中国博士后科学基金(20060390919) 作品数:9 被引量:106 H指数:4 相关作者: 刘全 李志涛 周文云 刘忠 高阳 更多>> 相关机构: 苏州大学 南京大学 吉林大学 更多>> 发文基金: 中国博士后科学基金 江苏省高校自然科学研究项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
一阶逻辑公式自动推演前的预处理 2009年 讨论了一种方法用于在处理γ子式前先对δ子式进行处理,减少了后期执行的工作量,简化了自动推演程序,并对其在理论上进行了证明,同时也得到了对一阶逻辑公式进行范式转换的方法. 王炜程 刘全关键词:析取范式 一种大规模离散空间中的高斯强化学习方法 被引量:1 2009年 针对大规模离散空间中强化学习的"维数灾"问题,即状态空间的大小随着特征的增加而发生指数级的增长,提出了一种基于高斯过程的强化学习方法。在本方法中,高斯过程模型有表示函数分布的能力,使用该模型之后,可以得到的不只是一个所需的估计值,而是关于该值的一个分布。实验结果表明,结合了高斯过程的强化学习方法在各方面性能,如收敛速度以及最终实验效果等都有所提高。使用高斯方法的回归模型可以在一定程度上解决大规模离散空间上的"维数灾"问题。 周文云 刘全 李志涛关键词:维数灾 高斯过程 一种基于启发式轮廓表的逻辑强化学习方法 被引量:9 2008年 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.针对强化学习一直被"维数灾"问题所困扰的问题,提出在关系强化学习的基础上,引入启发式轮廓表的方法,采用含轮廓表的一阶谓词表示状态、活动和Q-函数,充分发挥Prolog表的优势,将逻辑谓词规则与强化学习相结合,形成一种新的逻辑强化学习方法——CCLORRL,并对其收敛性进行了证明.该方法使用轮廓形状谓词产生形状状态表,大幅度地减少状态空间;利用启发式规则指导动作的选择,减少了样本中不存在状态选择的盲目性.CCLORRL算法应用于俄罗斯方块中,实验表明,该方法是比较高效的. 刘全 高阳 陈道蓄 孙吉贵 姚望舒关键词:维数灾 谓词 一种多分类器Deep Web数据源的自动分类与判别方法 2010年 Deep Web数据源的发现和其领域相关性越来越引起人们的关注和兴趣。针对在判别查询接口时,提取精度低和忽略领域相关性的问题,提出一种采用多分类器对Deep Web数据源进行自动分类和判别的方法,其思想是:对爬虫获取到的页面使用朴素贝叶斯分类器对其进行领域相关性分类,然后使用改进的决策树分类器来对特定领域的数据源进行判定。实验结果表明此方法相比于使用单一决策树分类器有更好的性能,其召回率和精度都有所提高。 李志涛 刘全 周文云关键词:深网 网页表单 朴素贝叶斯分类 决策树 一种逻辑强化学习的tableau推理方法 被引量:4 2008年 tableau方法是一种具有较强的通用性和适用性的推理方法,但由于函数符号、等词等的限制,使得自动推理具有不确定性.针对tableau推理中封闭集合构造过程具有盲目性的问题,提出将强化学习用于tableau自动推理的方法.该方法将tableau推理过程中的逻辑公式与强化学习相结合,产生抽象的状态和活动.这样一方面可以通过学习方法控制自动推理的推理顺序,形成合理的封闭分枝,减少推理的盲目性;另一方面复杂的推理可以利用简单的推理结果,提高推理的效率. 刘全 崔志明 高阳 陈道蓄 姚望舒关系强化学习方法的初步研究 被引量:1 2010年 强化学习方法是人工智能领域中比较重要的方法之一,自从其提出以来已经有了很大的发展,并且能用来解决很多的问题。但是在遇到大规模状态空间问题时,使用普通的强化学习方法就会产生"维数灾"现象,所以提出了关系强化学习,把强化学习应用到关系领域可以在一定的程度上解决"维数灾"难题。在此基础上,简单介绍关系强化学习的概念以及相关的算法,以及以后有待解决的问题。 刘全 周文云 李志涛关键词:维数灾 数据挖掘中聚类算法的新发展 被引量:77 2008年 在对传统聚类方法进行简要介绍的基础上,对聚类的新发展进行了较详细的归纳,总结了聚类分类方法发展的趋势。 李明华 刘全 刘忠 郗连霞关键词:数据挖掘 聚类分析 聚类方法 强化学习算法研究 被引量:10 2008年 针对智能Agent运动中普遍存在的避障问题,结合强化学习具有的试错和环境交互获得在某状态下选择动作的策略以及无导师在线学习等特性。在介绍强化学习的原理、分类以及主要算法(TD(λ)、Q_learning、Dyna、Prioritized Sweeping、Sarsa)的基础上,对TD(λ)、Q_learning的算法进行分析,并将其应用到实验中。实验结果表明,强化学习中的、TD(λ)Q_learning等算法在不同情况下都能高效地解决避障等问题。 刘忠 李海红 刘全关键词:Q学习 机器人控制 避障 搜索引擎 一种基于集合符号的自动推理扩展方法 被引量:4 2007年 在多值逻辑Tableau推理的基础上,提出了一种基于集合符号的自动推理扩展方法.将符号集合作为真值,减少了Tableau的推理分枝,并可以将适合经典逻辑的推理方法和策略应用于其中,使得非经典逻辑推理经典化.使用SWI-PROLOG语言设计实现了基于集合符号的自动推理系统,在系统中使用集合符号方法,只需要在规则库中增加推理规则,即可生成规则程序,系统本身不需要任何的修改,因此一些适合于经典逻辑的推理方法和技巧就可以很容易地应用到多值逻辑、模态逻辑、直觉逻辑等非经典逻辑,也可以进一步推广到无穷值逻辑和含模糊量词(如T-算子和S-算子)的逻辑中,对于无穷值逻辑和模糊逻辑的Tableau方法研究具有一定的借鉴作用.对TPTP中的900个逻辑问题进行了证明,实验结果表明,系统在时间和空间上效率都是较高的. 刘全 伏玉琛 孙吉贵 崔志明 龚声蓉 凌兴宏关键词:TABLEAU 经典逻辑 非经典逻辑