公共文化服务平台

2025年7月17日星期四

|

欢迎来到营口市图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

乔林: 作品数：3 被引量：4H指数：1; 供职机构：南京邮电大学自动化学院更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

罗杰南京邮电大学自动化学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

2篇期刊文章
1篇学位论文

领域

3篇自动化与计算...

主题

3篇学习算法
3篇Q学习
3篇Q学习算法
2篇MAS
1篇智能体
1篇智能体系统
1篇围捕
1篇多智能
1篇多智能体
1篇多智能体系
1篇多智能体系统
1篇复杂环境

机构

3篇南京邮电大学

作者

3篇乔林
2篇罗杰

传媒

2篇计算机科学

年份

3篇2012

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

MAS中基于多奖惩标准的Q学习算法研究: 2012年; 传统的Q学习算法是基于单奖惩标准的。基于单奖惩标准的Q学习算法往往不能适应multi-agent system(MAS)面对的复杂变化的环境与状态,相反可能还会制约学习效率。提出的基于多奖惩标准的Q学习算法能够较好地适应复杂变化的状态与环境,分阶段完成任务,不同阶段使用不同的奖惩标准,能够快速地完成阶段目标。以三维世界中的围捕问题为仿真平台,增加了围捕的难度和状态环境的复杂性。仿真实验表明,基于多奖惩标准的Q学习算法能够灵活地适应复杂变化的环境与状态,高效地完成学习任务。; 乔林罗杰; 关键词：Q学习算法 MAS

学习过程中共享经验的Q学习算法的研究被引量：1: 2012年; 主要以提高多智能体系统中Q学习算法的学习效率为研究目标,以追捕问题为研究平台,提出了一种基于共享经验的Q学习算法。该算法模拟人类的团队学习行为,各个智能体拥有共同的最终目标,即围捕猎物,同时每个智能体通过协商获得自己的阶段目标。在学习过程中把学习分为阶段性学习,每学习一个阶段,就进行一次阶段性总结,分享彼此好的学习经验,以便于下一阶段的学习。这样以学习快的、好的带动慢的、差的,进而提升总体的学习性能。仿真实验证明,在学习过程中共享经验的Q学习算法能够提高学习系统的性能,高效地收敛于最优策略。; 乔林罗杰; 关键词：Q学习算法 MAS

多智能体系统中的Q学习算法研究: 随着人工智能技术和计算机科学的发展与进步，分布式人工智能等技术应运而生，并在过去的20多年中获得快速发展。多智能体系统（MAS）是分布式人工智能的一个重要分支。MAS技术主要研究一组自治的智能体在分布式开放的动态环境下，...; 乔林; 关键词：多智能体系统 Q学习算法复杂环境

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@营口市图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张