乔林
- 作品数:3 被引量:4H指数:1
- 供职机构:南京邮电大学自动化学院更多>>
- 相关领域:自动化与计算机技术更多>>
- MAS中基于多奖惩标准的Q学习算法研究
- 2012年
- 传统的Q学习算法是基于单奖惩标准的。基于单奖惩标准的Q学习算法往往不能适应multi-agent system(MAS)面对的复杂变化的环境与状态,相反可能还会制约学习效率。提出的基于多奖惩标准的Q学习算法能够较好地适应复杂变化的状态与环境,分阶段完成任务,不同阶段使用不同的奖惩标准,能够快速地完成阶段目标。以三维世界中的围捕问题为仿真平台,增加了围捕的难度和状态环境的复杂性。仿真实验表明,基于多奖惩标准的Q学习算法能够灵活地适应复杂变化的环境与状态,高效地完成学习任务。
- 乔林罗杰
- 关键词:Q学习算法MAS
- 学习过程中共享经验的Q学习算法的研究被引量:1
- 2012年
- 主要以提高多智能体系统中Q学习算法的学习效率为研究目标,以追捕问题为研究平台,提出了一种基于共享经验的Q学习算法。该算法模拟人类的团队学习行为,各个智能体拥有共同的最终目标,即围捕猎物,同时每个智能体通过协商获得自己的阶段目标。在学习过程中把学习分为阶段性学习,每学习一个阶段,就进行一次阶段性总结,分享彼此好的学习经验,以便于下一阶段的学习。这样以学习快的、好的带动慢的、差的,进而提升总体的学习性能。仿真实验证明,在学习过程中共享经验的Q学习算法能够提高学习系统的性能,高效地收敛于最优策略。
- 乔林罗杰
- 关键词:Q学习算法MAS
- 多智能体系统中的Q学习算法研究
- 随着人工智能技术和计算机科学的发展与进步,分布式人工智能等技术应运而生,并在过去的20多年中获得快速发展。多智能体系统(MAS)是分布式人工智能的一个重要分支。MAS技术主要研究一组自治的智能体在分布式开放的动态环境下,...
- 乔林
- 关键词:多智能体系统Q学习算法复杂环境