国家社会科学基金(11BYY052)
- 作品数:14 被引量:35H指数:4
- 相关作者:胡金柱杨进才吴锋文舒江波谢芳更多>>
- 相关机构:华中师范大学信阳师范学院湖北工业大学更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金教育部人文社会科学重点研究基地度重大研究项目更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于本体的汉语复句分类初探
- 2015年
- 从构建中文信息处理中复句本体体系结构的需要出发,引入人工智能领域的本体论思想对复句进行分类、多层次划分。以双视点方式命名划分出的复句类别,初步构建了一个具有6个层次43个类别的汉语复句本体体系结构,并对复句领域概念与本体概念之间的映射关系进行了分析,为最终建立汉语复句本体库和实现复句语义知识的共享及重用打下基础。
- 吴锋文
- 关键词:本体复句
- 汉语复句层次关系识别的语用影响探微
- 2015年
- 复句层次关系识别对计算语言学句法分析和中文信息处理意义重大。为解决复句中语用因素给复句层次关系识别带来的困扰,需要充分挖掘可供计算机理解的语言知识。文章探讨了复句中回指形式、话题性语段、独立语、分句句序逆置以及篇章关系词的句法、语义条件及其语境特征,以期为复句层次关系识别服务。
- 吴锋文
- 关键词:信息处理复句回指
- 复句关系词自动识别中规则的表示方法研究被引量:8
- 2016年
- 关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统中规则的表示方法,为进一步研究、建设复句关系词自动识别中的规则库,深入研究规则与统计相结合自动识别复句和复句关系词的方法,为实现汉语句子和篇章的自动识别奠定基础。
- 胡金柱舒江波胡泉李源杨进才谢芳
- 关键词:自动识别中文信息处理
- 基于GAE的专业服务网信息获取技术研究被引量:1
- 2011年
- 传统的专业信息服务网的信息获取技术在信息获取过程中,存在大量的冗余信息,使得用户很难快速找到自己真正感兴趣的内容。因此,需要研究一种新的、有效的信息获取方式。本文建立了一个基于GAE面向本体语义的专业信息服务网信息自主更新系统,用于从相关的网站上及时、准确地获取所需的各种相关信息,已在独立开发的省情网和农民工信息服务网上进行实验性应用。实验结果表明,该系统信息获取的召回率和准确率都高于其他信息获取技术。
- 胡泉胡金柱谢芳
- 关键词:云计算信息获取技术本体语义
- 关系标记对汉语复句层次关系识别的影响被引量:2
- 2014年
- 关系词语对计算机的汉语复句层次关系识别具有重要意义。伪关系词的出现和关系标记的缺失给复句层次关系识别造成的影响,分析复句关系词语与同形的异类词、异构词之间的区别,揭示关系标记与词间连词、篇章关系词的不同用法的差异,挖掘复句关系标记缺失的隐现形式,以期为复句层次关系识别服务。
- 吴锋文
- 关键词:复句自动识别
- 汉语复句关系词自动识别中规则的约束条件研究被引量:6
- 2015年
- 关系词在汉语复句中具有重要的作用,是汉语语法、语义的重要研究内容,在信息处理领域具有很高的研究价值,但复句关系词的计算机自动识别是一个非常困难的问题。本文从中文信息处理角度,研究"基于规则的关系词自动识别"系统中规则的约束条件,为进一步研究计算机自动识别复句的方法以及自动识别汉语句子和篇章的方法奠定基础。
- 胡金柱舒江波胡泉杨进才谢芳李源
- 关键词:汉语复句自动识别中文信息处理
- 复句关系词规则生成系统中的冲突检测与处理被引量:5
- 2015年
- 复句中的关系词对研究复句中各分句的语义关系有着重要意义,在基于规则的关系词自动识别中需要大量的规则,并且规则库是动态变化和不断完善的,向规则库中入库规则时会出现规则冲突和入库错误的情况,该文探讨如何在入库时识别产生冲突的规则,并对规则进行相关的处理。对复句的普通规则、连用词规则、普通句式规则、连用句式规则四类规则进行了形式化的表示与存储,在此基础上设计了关系词检测、约束类型检测、约束条件检测、结论检测的检测流程。提出了两种冲突处理方式——优先级方式和有向无环图方式,对两种方法进行了比较。利用该检测方法和有向无环图的处理方式,入库了千余条规则。实验表明,利用该方法冲突规则的检测和处理正确率达到100%。
- 杨进才谢芳王中华胡金柱
- 关键词:有向无环图
- 多重复句关系标记搭配的求解模型研究被引量:4
- 2011年
- 关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。
- 胡金柱雷利利杨进才舒江波陈江曼
- 关键词:多重复句
- 面向信息处理的汉语复句研究现状及其展望
- 2013年
- 加强汉语复句信息处理研究对中文信息处理具有重要意义。为适应时代信息科技的发展,必须大力推动汉语复句机器应用层面的研究。介绍汉语复句信息工程的概况及其进展,将复句信息处理研究成果总结为汉语复句知识建模、复句关系标记识别、非分句识别、复句句法语义关系判定、复句知识库建设等五方面,并将这些研究成果条理化,结合已有成果的研究视角、关注焦点分析复句信息处理的研究现状,最后指出汉语复句信息处理研究的未来走向主要是加强汉语复句研究"两栖学者"联合攻关势态,加强汉语复句语义识别研究以及加强复句知识库资源建设。
- 吴锋文
- 关键词:信息处理复句自动识别
- 汉语复句关系词自动标识中规则引擎的研究被引量:3
- 2014年
- 近年来规则引擎的研究取得了丰硕的成果,将其成果应用到各个方面为汉语复句处理带来了全新的思路与途径。将规则引擎用于复句关系词自动标识中,设计了规则引擎的结构,提出了关系搭配集的模式匹配策略、消除冲突规则的"消除包含最大化策略"以及最终结果集的"正覆盖"策略。在规则引擎中,3种策略的应用提高了复句关系词识别的效率与准确率。
- 杨进才谢芳胡金柱
- 关键词:规则引擎