您的位置: 专家智库 > >

陈仕超

作品数:2 被引量:1H指数:1
供职机构:苏州大学计算机科学与技术学院更多>>
发文基金:教育部重点实验室开放基金江苏省高校自然科学研究项目江苏省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇行动者
  • 2篇评论家
  • 2篇高斯
  • 2篇高斯过程
  • 2篇贝叶斯
  • 1篇人工智能
  • 1篇贝叶斯理论
  • 1篇贝叶斯推理

机构

  • 2篇苏州大学
  • 1篇吉林大学

作者

  • 2篇陈仕超
  • 1篇凌兴宏
  • 1篇陈桂兴
  • 1篇伏玉琛
  • 1篇刘全

传媒

  • 1篇计算机应用研...

年份

  • 1篇2016
  • 1篇2015
2 条 记 录,以下是 1-2
排序方式:
一种基于高斯过程的行动者评论家算法被引量:1
2016年
强化学习领域的一个研究难点是在大规模或连续空间中平衡探索和利用的问题。针对该问题,应用函数近似与高斯过程方法,提出新的行动者评论家(actor-critic,AC)算法。该算法在actor中使用时间差分误差构造关于策略参数的更新公式;在critic中利用高斯过程对线性带参值函数建模,结合生成模型,根据贝叶斯推理求解值函数的后验分布。将该算法应用于平衡杆实验中,实验结果表明,算法收敛速度较快,可以有效解决在大规模或连续空间中探索和利用的平衡问题,具有较好的性能。
陈仕超凌兴宏刘全伏玉琛陈桂兴
关键词:高斯过程贝叶斯推理
基于贝叶斯理论的行动者评论家算法研究
强化学习作为一种重要的机器学习方法,其两个特征是模型无关性和在线学习性。智能体通过与环境交互,利用环境反馈的信息,即奖赏来调整和改善自己的行为,最终获得最优策略。强化学习领域的一个研究难点是如何在大规模或连续空间中平衡探...
陈仕超
关键词:人工智能高斯过程
文献传递
共1页<1>
聚类工具0