刘克
- 作品数:6 被引量:7H指数:2
- 供职机构:中国科学院应用数学研究所更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金广东省自然科学基金更多>>
- 相关领域:理学更多>>
- 向量值半Markov决策规划被引量:5
- 1990年
- 关于向量值Markov决策规划,文献[1]研究了有限阶段与无限阶段模型之间的关系。文献[2,3]将标量模型的策略迭代算法推广到向量模型,给出了求最优策略的算法。其算法大致叙述如下:从任一平稳策略出发,在平稳策略类中不断进行策略迭代改进,求得不动点及其周围的可疑点,然后从可疑点开始迭代改进。上述过程反复进行,直到考察完所有平稳策略为止。最后在求出的不动点集合Γ中用穷举法求出全部最优策略。
- 刘克刘建庸
- 关键词:马氏决策规划
- 前言
- 运筹学是一门独立的学科,它与自然科学、技术科学和社会科学有着密不可分的联系,它的理论来源于实际问题,其方法又用于解决实际问题。运筹学经过五六十年的发展,已经取得了令人瞩目的成果,从早期的所谓运筹学三大理论支柱,即规划论、...
- 罗小明刘克刘宝碇
- 文献传递
- 前言
- 罗小明刘克刘宝碇
- 非平稳MDP平均模型及其滚动式算法被引量:2
- 1999年
- 本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法.
- 郭先平刘建庸刘克
- 关键词:马氏决策过程
- 部分可观察马尔可夫决策规划──首达目标模型被引量:1
- 1994年
- 部分可观察马尔可夫决策规划──首达目标模型刘迪芬(湖南师范大学数学系,长沙410081)刘建庸,刘克(中国科学院应用数学研究所,北京100080)PARTIALLYOBSERVABLEMARKOVDECISIONPROGRAMMING:FIRSTPA...
- 刘迪芬刘建庸刘克
- 关键词:马氏决策规划
- 一类单周期预、决策定货模型
- 该文讨论一类单周期二模式预,决策模型(其特例是newsvendor问题)。在建立一般模型之后,作者就一些特例研究了值函数的一些性质,给出了求解最优定货策略的算法。
- 刘克严厚民
- 关键词:值函数
- 文献传递