国家高技术研究发展计划(2008AA01Z144)
- 作品数:15 被引量:259H指数:8
- 相关作者:刘挺秦兵李生张宇宋巍更多>>
- 相关机构:哈尔滨工业大学西北师范大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 句法与词义相结合的中文代词消解
- 句法知识对代词消解有着很大的支持。近年来依存句法由于其利于描述语言中词与词之间的关系、突出核心词的特点日益得到重视。本文提出了一种中文第三人称代词消解方法,直接利用依存句法分析器的结果,构建有效的句法角色特征和名词短语的...
- 宋巍秦兵郎君刘挺
- 关键词:代词消解支持向量机
- 文献传递
- 基于中心语匹配的共指消解被引量:5
- 2011年
- 共指消解是自然语言处理的核心任务之一。在传统机器学习方法使用的平面特征基础上,该文提出一种利用中心语信息的新方法。该方法首先引进一种基于简单平面特征的实例匹配算法用于共指消解。在此基础上,又引入了先行语与照应语的中心语字符串作为新特征,并提出一种竞争模式对将中心语约束融合进实例匹配算法,提升了消解效果。该方法与其他只使用平面特征的传统机器学习方法相比,能充分地利用每一个训练实例的特征信息,进一步融合中心语字符串特征使消解效果更加准确。
- 张牧宇黎耀炳秦兵刘挺
- 关键词:共指消解
- 开放域问答技术研究进展被引量:18
- 2009年
- 问答技术是信息检索和自然语言理解中的研究热点.本文对开放域问答技术在近年来的研究进展进行了总结.针对不同类型的问题,比较了问答系统中问题分析、文档和句段检索、答案抽取各个部分不同实现方法的特点,讨论了这些技术中存在的不足.最后,对问答技术未来的研究趋势进行了分析与展望.
- 张志昌张宇刘挺李生
- 关键词:答案抽取
- 基于XML的语言技术平台
- 本文提出了一个基于XML数据表示的中文自然语言处理框架:语言技术平台(LanguageTechnology Platform,LTP)。LTP包括六个组成部分:基于LTML(Language Technology Mar...
- 李正华车万翔刘挺
- 关键词:可视化
- 文献传递
- 基于潜在语义索引和自组织映射网的检索结果聚类方法被引量:6
- 2009年
- 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
- 陈毅恒秦兵刘挺王平李生
- 关键词:检索结果聚类潜在语义索引标签
- 基于宏微观重要性判别模型的时序多文档文摘被引量:4
- 2009年
- 时序多文档文摘是针对新闻领域跨时段的相关文档集,即系列新闻报道进行问题无关的、抽取式文摘.根据系列新闻报道不同细节层次的时序特性,提出一种基于宏微观重要性判别模型的内容选择方法.从宏观和微观角度挖掘信息随着时间进化的时序特性,以指导时序多文档文摘的内容选择.首先通过宏观模型确定重要的时间点,然后通过微观模型在重要的时间点选择重要的句子,从而更有效地获取文摘.实验证明该方法是有效的.
- 贺瑞芳秦兵刘挺潘越群李生
- 评价对象抽取及其倾向性分析
- 情感分析近年来已经成为自然语言处理领域的热点问题,本文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词...
- 刘鸿宇赵妍妍秦兵刘挺
- 关键词:情感分析句法分析
- 文献传递
- 基于柱状搜索的高阶依存句法分析
- 本文提出使用所有的孙子节点构成祖孙特征的高阶依存模型,并且使用柱状搜索策略限制搜索空间,最终找到近似最优依存树。另外,我们以较小的时间复杂度为代价,使用了丰富的依存关系特征,并且允许模型在解码的过程中进行依存关系选择。我...
- 李正华车万翔刘挺
- 关键词:依存分析
- 文献传递
- 基于自动构建语料库的词汇级复述研究被引量:4
- 2009年
- 本文针对词汇级复述问题提出了一种新的方法.该方法首先利用翻译引擎将双语平行语料库自动转换为单语平行语料库,以此构建复述语料库并用于候选复述的抽取.在此基础上,本文提出了一种新的统计模型.该模型根据特定的上下文为待复述词选择最为合适的复述.实验结果表明自动构建的复述语料库对于词汇级复述的抽取是有效的.同时,本文提出的模型明显优于两种传统模型,在准确率和召回率上分别提高10%左右.
- 赵世奇刘挺李生
- 中文交互式问答用户问题相关检测研究被引量:3
- 2010年
- 交互式问答是具备处理系列相关问题以及与用户进行对话式交互的问答技术,是近年来国际上问答技术研究的一个热门方向,但是目前在中文问答领域几乎没有开展相关的研究。实现交互式问答系统首先要判别用户系列问题之间的相关性。该文探讨了提取问题中不同特征对中文交互式问答问题相关检测的作用,并且根据识别出的有效特征采用基于二元分类方法分别对翻译成中文的TREC QA问题集语料和真实的交互式问答语料进行问题相关检测实验,实验结果显示该文的方法获得了较好的问题相关检测效果。
- 伍大勇张宇刘挺
- 关键词:计算机应用中文信息处理