公共文化服务平台

2025年4月2日星期三

|

欢迎来到营口市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

尹晓虎: 作品数：8 被引量：13H指数：2; 供职机构：国防科学技术大学更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术经济管理兵器科学与技术文化科学更多>>

合作作者

王长缨国防科学技术大学信息系统与管理...
鲍翊平国防科学技术大学信息系统与管理...
姚莉国防科学技术大学信息系统与管理...
钱彦岭国防科学技术大学
刘颖国防科学技术大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
2篇学位论文
2篇会议论文
2篇专利

领域

4篇自动化与计算...
1篇经济管理
1篇军事
1篇文化科学
1篇兵器科学与技...

主题

2篇多AGENT...
2篇多AGENT...
2篇信息融合
2篇学习算法
2篇智能机器人
2篇强化学习方法
2篇抓取
2篇维修过程
2篇零部件
2篇机器人
2篇机械装备
2篇Q学习
2篇多AGENT...
1篇动力学分析
1篇多AGENT...
1篇元组
1篇强化学习算法
1篇MULTI-...
1篇Q学习算法
1篇REINFO...

机构

8篇国防科学技术...

作者

8篇尹晓虎
4篇姚莉
4篇鲍翊平
4篇王长缨
2篇葛哲学
2篇官凤娇
2篇罗旭
2篇杨拥民
2篇刘颖
2篇钱彦岭
1篇张士刚

传媒

1篇模式识别与人...
1篇计算机工程与...
1篇中国人工智能...

年份

2篇2018
1篇2008
1篇2006
1篇2005
1篇2004
2篇2003

共 8 条记录，以下是 1-8

全选清除导出

排序方式：

装备维修系统的动力学分析技术研究: 装备维修系统是由装备维修所需的物质资源、人力资源、信息资源以及管理手段等要素组成的复杂系统体系。伴随作战理念和作战样式的演变以及装备技术的发展,装备维修系统的构成结构和运行模式都发生了深刻变化,科学维修、精确保障成为指导...; 尹晓虎; 关键词：动力学分析; 文献传递

多Agent协同的强化学习方法研究: 强化学习，因其不需要环境模型、通过Agent和所在环境的自主交互进行学习的特点，现已成为多Agent系统和机器学习领域的研究热点。多Agent系统常被应用于开放、复杂、动态变化的环境，单个Agent的能力已不能胜任所面临...; 尹晓虎; 关键词：多AGENT系统; 文献传递

一种共享经验元组的多agent协同强化学习算法被引量：6: 2005年; Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高。最后将该算法应用于猎人捕物问题域。实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的。; 王长缨尹晓虎鲍翊平姚莉; 关键词：多AGENT学习 Q学习

机械装备维修过程中基于智能机器人的零部件分拣方法: 一种机械装备维修过程中基于智能机器人的零部件分拣方法，首先对维修过程建模与待安装零部件排序；然后确定待安装零部件基本特征参数；采用智能机器人抓取待识别零部件，将待识别零部件从原始摆放区域抓取到识别区域，获取待识别零部件的...; 葛哲学杨拥民尹晓虎蒋思远钱彦岭罗旭刘颖官凤娇

基于目标分解的多Agent协作强化学习方法: 本文将单agent Q学习引入到多agent环境，提出了一种多agent协作团队的Q学习方法，即基于承诺和约定先给agent分配求解子目标，然后针对系统求解过程中的相似性，用相似性来减少学习过程的状态空间，并利用Q值共享...; 尹晓虎王长缨姚莉鲍翊平; 文献传递

基于随机博弈的Agent协同强化学习方法被引量：6: 2006年; 本文针对一类追求系统得益最大化的协作团队的学习问题,基于随机博弈的思想,提出了一种新的多Agent协同强化学习方法。协作团队中的每个Agent通过观察协作相识者的历史行为,依照随机博弈模型预测其行为策略,进而得出最优的联合行为策略。; 王长缨尹晓虎鲍翊平姚莉; 关键词：多AGENT系统

机械装备维修过程中基于智能机器人的零部件分拣方法: 一种机械装备维修过程中基于智能机器人的零部件分拣方法，首先对维修过程建模与待安装零部件排序；然后确定待安装零部件基本特征参数；采用智能机器人抓取待识别零部件，将待识别零部件从原始摆放区域抓取到识别区域，获取待识别零部件的...; 葛哲学杨拥民钱彦岭尹晓虎罗旭刘颖官凤娇张士刚; 文献传递

一种多Agent协作的Q学习算法及其试验研究: 1引言MAS(Multi-Agent Systems)是当前人工智能研究的热点,MAS的环境是复杂、大型、开放、动态和不可预测的,在设计时,难以预见agent可能遇到的所有潜在状态以及预先详细地优化agent的行为,无法...; 鲍翊平姚莉王长缨尹晓虎; 关键词：COOPERATION Q-LEARNING; 文献传递

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@营口市图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张