您的位置: 专家智库 > >

尹晓虎

作品数:8 被引量:13H指数:2
供职机构:国防科学技术大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术经济管理兵器科学与技术文化科学更多>>

文献类型

  • 2篇期刊文章
  • 2篇学位论文
  • 2篇会议论文
  • 2篇专利

领域

  • 4篇自动化与计算...
  • 1篇经济管理
  • 1篇军事
  • 1篇文化科学
  • 1篇兵器科学与技...

主题

  • 2篇多AGENT...
  • 2篇多AGENT...
  • 2篇信息融合
  • 2篇学习算法
  • 2篇智能机器人
  • 2篇强化学习方法
  • 2篇抓取
  • 2篇维修过程
  • 2篇零部件
  • 2篇机器人
  • 2篇机械装备
  • 2篇Q学习
  • 2篇多AGENT...
  • 1篇动力学分析
  • 1篇多AGENT...
  • 1篇元组
  • 1篇强化学习算法
  • 1篇MULTI-...
  • 1篇Q学习算法
  • 1篇REINFO...

机构

  • 8篇国防科学技术...

作者

  • 8篇尹晓虎
  • 4篇姚莉
  • 4篇鲍翊平
  • 4篇王长缨
  • 2篇葛哲学
  • 2篇官凤娇
  • 2篇罗旭
  • 2篇杨拥民
  • 2篇刘颖
  • 2篇钱彦岭
  • 1篇张士刚

传媒

  • 1篇模式识别与人...
  • 1篇计算机工程与...
  • 1篇中国人工智能...

年份

  • 2篇2018
  • 1篇2008
  • 1篇2006
  • 1篇2005
  • 1篇2004
  • 2篇2003
8 条 记 录,以下是 1-8
排序方式:
装备维修系统的动力学分析技术研究
装备维修系统是由装备维修所需的物质资源、人力资源、信息资源以及管理手段等要素组成的复杂系统体系。伴随作战理念和作战样式的演变以及装备技术的发展,装备维修系统的构成结构和运行模式都发生了深刻变化,科学维修、精确保障成为指导...
尹晓虎
关键词:动力学分析
文献传递
多Agent协同的强化学习方法研究
强化学习,因其不需要环境模型、通过Agent和所在环境的自主交互进行学习的特点,现已成为多Agent系统和机器学习领域的研究热点。多Agent系统常被应用于开放、复杂、动态变化的环境,单个Agent的能力已不能胜任所面临...
尹晓虎
关键词:多AGENT系统
文献传递
一种共享经验元组的多agent协同强化学习算法被引量:6
2005年
Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高。最后将该算法应用于猎人捕物问题域。实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的。
王长缨尹晓虎鲍翊平姚莉
关键词:多AGENT学习Q学习
机械装备维修过程中基于智能机器人的零部件分拣方法
一种机械装备维修过程中基于智能机器人的零部件分拣方法,首先对维修过程建模与待安装零部件排序;然后确定待安装零部件基本特征参数;采用智能机器人抓取待识别零部件,将待识别零部件从原始摆放区域抓取到识别区域,获取待识别零部件的...
葛哲学杨拥民尹晓虎蒋思远钱彦岭罗旭刘颖官凤娇
基于目标分解的多Agent协作强化学习方法
本文将单agent Q学习引入到多agent环境,提出了一种多agent协作团队的Q学习方法,即基于承诺和约定先给agent分配求解子目标,然后针对系统求解过程中的相似性,用相似性来减少学习过程的状态空间,并利用Q值共享...
尹晓虎王长缨姚莉鲍翊平
文献传递
基于随机博弈的Agent协同强化学习方法被引量:6
2006年
本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。
王长缨尹晓虎鲍翊平姚莉
关键词:多AGENT系统
机械装备维修过程中基于智能机器人的零部件分拣方法
一种机械装备维修过程中基于智能机器人的零部件分拣方法,首先对维修过程建模与待安装零部件排序;然后确定待安装零部件基本特征参数;采用智能机器人抓取待识别零部件,将待识别零部件从原始摆放区域抓取到识别区域,获取待识别零部件的...
葛哲学杨拥民钱彦岭尹晓虎罗旭刘颖官凤娇张士刚
文献传递
一种多Agent协作的Q学习算法及其试验研究
1引言MAS(Multi-Agent Systems)是当前人工智能研究的热点,MAS的环境是复杂、大型、开放、动态和不可预测的,在设计时,难以预见agent可能遇到的所有潜在状态以及预先详细地优化agent的行为,无法...
鲍翊平姚莉王长缨尹晓虎
关键词:COOPERATIONQ-LEARNING
文献传递
共1页<1>
聚类工具0