您的位置: 专家智库 > >

刘克

作品数:6 被引量:7H指数:2
供职机构:中国科学院应用数学研究所更多>>
发文基金:国家自然科学基金国家杰出青年科学基金广东省自然科学基金更多>>
相关领域:理学更多>>

文献类型

  • 3篇期刊文章
  • 3篇会议论文

领域

  • 6篇理学

主题

  • 2篇马氏决策规划
  • 1篇定货
  • 1篇值函数
  • 1篇向量值
  • 1篇马氏决策过程
  • 1篇货量
  • 1篇函数
  • 1篇MARKOV

机构

  • 6篇中国科学院
  • 2篇清华大学
  • 2篇装备指挥技术...
  • 1篇中山大学
  • 1篇香港中文大学

作者

  • 6篇刘克
  • 3篇刘建庸
  • 2篇刘宝碇
  • 2篇罗小明
  • 1篇郭先平
  • 1篇严厚民

传媒

  • 1篇科学通报
  • 1篇系统科学与数...
  • 1篇应用数学学报
  • 1篇第三届中国青...

年份

  • 2篇2001
  • 2篇1999
  • 1篇1994
  • 1篇1990
6 条 记 录,以下是 1-6
排序方式:
向量值半Markov决策规划被引量:5
1990年
关于向量值Markov决策规划,文献[1]研究了有限阶段与无限阶段模型之间的关系。文献[2,3]将标量模型的策略迭代算法推广到向量模型,给出了求最优策略的算法。其算法大致叙述如下:从任一平稳策略出发,在平稳策略类中不断进行策略迭代改进,求得不动点及其周围的可疑点,然后从可疑点开始迭代改进。上述过程反复进行,直到考察完所有平稳策略为止。最后在求出的不动点集合Γ中用穷举法求出全部最优策略。
刘克刘建庸
关键词:马氏决策规划
前言
运筹学是一门独立的学科,它与自然科学、技术科学和社会科学有着密不可分的联系,它的理论来源于实际问题,其方法又用于解决实际问题。运筹学经过五六十年的发展,已经取得了令人瞩目的成果,从早期的所谓运筹学三大理论支柱,即规划论、...
罗小明刘克刘宝碇
文献传递
前言
罗小明刘克刘宝碇
非平稳MDP平均模型及其滚动式算法被引量:2
1999年
本文考虑可数状态空间非平稳马尔可夫决策过程(MDP)的平均目标.首先,我们指出并改正了Park,et,al[1]和Alden,etal[2]的错误,并在弱于Park,etal[1]的条件下,借助于新建立的最优方程,证明了最优平均值的收敛性和平均最优马氏策略的存在性.其次,给出了ε(>0)-平均最优马氏策略的滚动式算法.
郭先平刘建庸刘克
关键词:马氏决策过程
部分可观察马尔可夫决策规划──首达目标模型被引量:1
1994年
部分可观察马尔可夫决策规划──首达目标模型刘迪芬(湖南师范大学数学系,长沙410081)刘建庸,刘克(中国科学院应用数学研究所,北京100080)PARTIALLYOBSERVABLEMARKOVDECISIONPROGRAMMING:FIRSTPA...
刘迪芬刘建庸刘克
关键词:马氏决策规划
一类单周期预、决策定货模型
该文讨论一类单周期二模式预,决策模型(其特例是newsvendor问题)。在建立一般模型之后,作者就一些特例研究了值函数的一些性质,给出了求解最优定货策略的算法。
刘克严厚民
关键词:值函数
文献传递
共1页<1>
聚类工具0