- 半Markov决策过程的研究进展
- 2015年
- 本文综述半Markov决策过程(SMDP)理论的发展现状,主要介绍SMDP无限阶段期望折扣报酬准则、长期平均准则、有限阶段期望报酬准则、首达目标期望报酬准则、概率准则、受约束问题和均值-方差准则的研究工作,着重阐述这些优化准则的背景、意义、主要研究进展及有待研究的问题.最后,展望SMDP未来的一些潜在研究方向和相关问题.
- 郭先平黄永辉
- 关键词:半MARKOV决策过程计算方法
- 有限阶段半马氏决策过程的理论及应用
- 有限阶段半马氏决策过程是一类基本而重要的随机最优控制问题。它的目标是优化由半马氏过程所刻画的系统在有限时间内的性能,如期望报酬或费用.该问题经常产生于经济、金融中,具有丰富的实际背景。然而,如文献[8,32]所指出,连续...
- 黄永辉
- 关键词:最优控制
- 半马氏决策过程中的首达目标准则
- 本文致力于研究半马氏决策过程中的几个首达目标准则,包括首达目标期望准则、风险概率准则、首达目标概率准则和受约束首达目标准则。与通常的无限阶段期望折扣准则和平均准则不同,首达目标准则关注的是系统首次到达某些状态集前的性能和...
- 黄永辉
- 关键词:马尔可夫链
- 一种基于多智能体强化学习的微网群功率控制方法及系统
- 本发明提供了一种基于多智能体强化学习的微网群功率控制方法及系统,所述方法包括:对微网群中的各个微网建立微网群模拟系统,其中,所述微网群模拟系统用于模拟所述微网群的运行过程,所述微网群模拟系统中的各个智能体对应所述微网群中...
- 夏俐胡君楷张俊玉黄永辉郭先平
- 截断前马氏过程与截断后马氏过程
- 2009年
- 证明了任一马氏过程X(t,ω),若用一停时α(ω)去截X(t,ω)的样本轨道,则截断前的样本轨道函数在满足条件{α>t}∈Ft∞的条件下是一马氏过程,同时得到了截断后的样本轨道函数也是一马氏过程。另外,对于任意的随机过程,证明了X(t,ω)的t前σ-代数Ft满足右连续性(即Ft=∩s>tFs),以及任一首达时间是一停时。
- 唐荣黄永辉
- 关键词:停时首达时间
- 一种多微电网系统并网点功率的控制方法及系统
- 本发明提供了一种多微电网系统并网点功率的控制方法及系统,所述方法包括:获取多微电网系统的实时运行数据,所述实时运行数据包括所述多微电网系统中各个微电网的实时新能源发电出力状态、实时负荷水平状态以及实时储能荷电状态;根据所...
- 夏俐胡君楷张俊玉黄永辉郭先平
- 非负费用折扣半马氏决策过程被引量:2
- 2010年
- 本文考虑可数状态非负费用的折扣半马氏决策过程.首先在给定半马氏决策核和策略下构造一个连续时间半马氏决策过程,然后用最小非负解方法证明值函数满足最优方程和存在ε-最优平稳策略,并进一步给出最优策略的存在性条件及其一些性质.最后,给出了值迭代算法和一个数值算例.
- 黄永辉郭先平