您的位置: 专家智库 > >

乔林

作品数:3 被引量:4H指数:1
供职机构:南京邮电大学自动化学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 3篇学习算法
  • 3篇Q学习
  • 3篇Q学习算法
  • 2篇MAS
  • 1篇智能体
  • 1篇智能体系统
  • 1篇围捕
  • 1篇多智能
  • 1篇多智能体
  • 1篇多智能体系
  • 1篇多智能体系统
  • 1篇复杂环境

机构

  • 3篇南京邮电大学

作者

  • 3篇乔林
  • 2篇罗杰

传媒

  • 2篇计算机科学

年份

  • 3篇2012
3 条 记 录,以下是 1-3
排序方式:
MAS中基于多奖惩标准的Q学习算法研究
2012年
传统的Q学习算法是基于单奖惩标准的。基于单奖惩标准的Q学习算法往往不能适应multi-agent system(MAS)面对的复杂变化的环境与状态,相反可能还会制约学习效率。提出的基于多奖惩标准的Q学习算法能够较好地适应复杂变化的状态与环境,分阶段完成任务,不同阶段使用不同的奖惩标准,能够快速地完成阶段目标。以三维世界中的围捕问题为仿真平台,增加了围捕的难度和状态环境的复杂性。仿真实验表明,基于多奖惩标准的Q学习算法能够灵活地适应复杂变化的环境与状态,高效地完成学习任务。
乔林罗杰
关键词:Q学习算法MAS
学习过程中共享经验的Q学习算法的研究被引量:1
2012年
主要以提高多智能体系统中Q学习算法的学习效率为研究目标,以追捕问题为研究平台,提出了一种基于共享经验的Q学习算法。该算法模拟人类的团队学习行为,各个智能体拥有共同的最终目标,即围捕猎物,同时每个智能体通过协商获得自己的阶段目标。在学习过程中把学习分为阶段性学习,每学习一个阶段,就进行一次阶段性总结,分享彼此好的学习经验,以便于下一阶段的学习。这样以学习快的、好的带动慢的、差的,进而提升总体的学习性能。仿真实验证明,在学习过程中共享经验的Q学习算法能够提高学习系统的性能,高效地收敛于最优策略。
乔林罗杰
关键词:Q学习算法MAS
多智能体系统中的Q学习算法研究
随着人工智能技术和计算机科学的发展与进步,分布式人工智能等技术应运而生,并在过去的20多年中获得快速发展。多智能体系统(MAS)是分布式人工智能的一个重要分支。MAS技术主要研究一组自治的智能体在分布式开放的动态环境下,...
乔林
关键词:多智能体系统Q学习算法复杂环境
共1页<1>
聚类工具0