国家自然科学基金(69875017)
- 作品数:15 被引量:104H指数:7
- 相关作者:陈小平蔡庆生刘贵全刘洁郭宝贵更多>>
- 相关机构:中国科学技术大学安徽大学合肥工业大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术哲学宗教经济管理理学更多>>
- Q-learning算法及其在囚徒困境问题中的实现被引量:9
- 2001年
- Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比T Q-learning算法与TFT算法,验证了 Q-learning算法的优良特性。
- 张春阳陈小平刘贵全蔡庆生
- 关键词:人工智能
- 一个意图后承的形式理论被引量:5
- 2000年
- 对意图(Intention)、信念(Belief)和目标(Goal)等知识状态的形式化研究是近年人工智能和哲学逻辑等领域中的一个重要课题。基于经典逻辑的工作遇到了很大的困难。本文针对意图的形式化,分析了困难的原因,并给出一种解决办法。...……
- 陈小平刘贵全郭宝贵
- 连续认知结构推理方法及其应用被引量:2
- 2002年
- 实际问题中存在着大量连续量以及对它们的各种认知信息(知识).为了较好地描述和利用这些知识,将这些知识分解为连续认知结论以及关于这个结论的一个认知结构,并将它们统一成一个连续认知结构.在此基础上提出了一种基于连续认知结构的连续认知推理网络,并探讨了一套利用连续认知结构进行推理的方法.这种方法在不完全的知识推理网络中的推理是非单调的,其最简推理复杂度关于推理网络节点在最复杂情况下是线性的.同时,还用例子说明了这种方法在实际问题求解中的适用性.
- 刘洁刘贵全陈小平蔡庆生
- 关键词:证据理论智能体人工智能
- 基于Anytime算法的组合优化问题求解被引量:2
- 2000年
- 介绍一种基于Anytime算法的组合优化问题求解框架,并报告了对TSP问题进行求解的实验。实验结果表明,上述框架可以较好地协调问题的复杂度与求解时间要求之间的冲突。
- 郭宝贵陈小平杨琪王煦法王颖波章晓良
- 关键词:组合优化问题ANYTIME算法TSP问题
- 一个新的意图后承形式系统L_(m5c)被引量:3
- 2002年
- 建立意图后承的形式化推理系统是意图形式化研究中的一个重要课题.提供了一个新的基于归约蕴涵的意图后承形式系统Lm5c,给出了意图后承的形式规范.与已有的意图后承形式系统相比,这个系统比较简单,并具有许多现有同类系统所不具备的优良性质,比如无副作用.此外,还具有较强的推理能力,可供Agent自身用于意图推理和目标修改.
- 朱紫汝陈小平周熠
- 关键词:BDI模型多值逻辑人工智能
- 基于采样的POMDP近似算法被引量:4
- 2006年
- 部分可观察马尔科夫决策过程(POMDP)是一种描述机器人在动态不确定环境下行动选择的问题模型。对于具有稀疏转移矩阵的POMDP问题模型,该文提出了一种求解该问题模型的快速近似算法。该算法首先利用QMDP算法产生的策略进行信念空间采样,并通过点迭代算法快速生成POMDP值函数,从而产生近似的最优行动选择策略。在相同的POMDP试验模型上,执行该算法产生的策略得到的回报值与执行其他近似算法产生的策略得到的回报值相当,但该算法计算速度快,它产生的策略表示向量集合小于现有其他近似算法产生的集合。因此,它比这些近似算法更适应于大规模的稀疏状态转移矩阵POMDP模型求解计算。
- 陈茂陈小平
- 关键词:采样
- 一个意图后承的形式理论(Ⅱ)——基于相关性的刻画被引量:3
- 2002年
- 本文通过引入相关性,给出Lm4c+后承的一个基于经典逻辑概念的形式刻画,进而给出“愿望保持性”和“承诺可传递性”的一个统一的形式规范,从而为“意图调整”提供了理论支持。
- 陈小平
- 关键词:形式化
- 基于Agent的信件自动处理系统的实现被引量:7
- 2000年
- 电子邮件 (E- Mail)是目前人们利用网络进行通讯的一种重要手段 .本文结合 Agent技术与机器学习方法 ,设计并实现了可自动为用户进行信件处理的接口 Agent.对本文的方法进行一些简单的扩展还可用于其他类型的网络服务 .
- 刘贵全陈小平张波赵雷
- 关键词:AGENT
- 多主体协作系统的一种形式模型被引量:20
- 2001年
- 建造能一起工作的计算机系统一直是计算机科学的一项重要任务 [6 ] .目前多主体 (Agent)协作的理论与应用研究已成为多学科和 AI交叉研究中的一个热点前沿课题 .关于主体及多主体系统理论研究的主要难点是所谓的“副作用问题”以及动态环境下对主体资源及能力有限的特性的刻画 .该文基于情形演算与三值逻辑给出了一个多主体协作的形式模型 ;本模型能较好的避免“副作用问题”;此外 ,在此基础上给出的一个多 Agent协作规划理论能较好的刻画动态环境下主体的上述特性 [8] .
- 刘贵全陈小平范焱蔡庆生
- 关键词:人工智能计算机科学三值逻辑
- 不确定信息的认知结构表示、推理和学习被引量:18
- 2002年
- 提出了一个对不确定信息进行表示、推理和学习的统一框架.通过引入4-值认知结构刻画不确定性,提供了更强的度量能力和更高的推理效率,同时支持相关不确定信息的有效获取,从而更加接近实际应用的需要.
- 刘洁陈小平蔡庆生范焱
- 关键词:不确定信息人工智能