国家自然科学基金(90820005)
- 作品数:7 被引量:19H指数:3
- 相关作者:姬东鸿冯文贺刘茂福李文捷余博更多>>
- 相关机构:武汉大学武汉科技大学香港理工大学更多>>
- 发文基金:国家自然科学基金湖北省自然科学基金国家教育部“985工程”更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 并列结构的依存分析与连词的控制语地位被引量:9
- 2011年
- 从依存的角度看,连词是一种虚谓词,它支配着两个具有-N属性的论元。基于这一认识,不仅传统语法下的各种并列结构得到了统一的依存表示,复句及有关特殊句式也得到了统一的依存表示。并列结构的各种语法形式差异及有关语义问题均可根据依存结构上具体结点的异同及性质差异得到一定解释。对谓词控制更全面的论断是:单命题句中实义谓词是根控制语("中心");多命题句中,连词是根控制语("中心")。
- 冯文贺姬东鸿
- 关键词:依存连词
- 汉语复合名词短语特征结构的标注研究
- 复合名词短语的特征结构标注是基于特征结构表示的汉语大规模语义资源建设的一个子任务。本文探讨了在标注的过程中建立的最小关联原则、直接关联原则、语言关联原则等主要原则,同时也涉及复杂名词短语内部成分之间的语义关联种类的确定,...
- 万菁姬东鸿任函冯文贺
- 关键词:特征结构名词短语
- 文献传递
- 统计与规则相结合的指代消解在事件自动文摘中的应用
- 本文利用基于规则和统计相结合的方法对自动文摘源语料中的代词进行消解。首先使用单纯的规则方法进行消解,通过对召回率和准确率以及消解后的语料进行分析,发现其不足在于不能很好的确定哪些代词指代命名实体。针对这一问题本文将统计中...
- 刘茂福金可佳姬东鸿张晓龙
- 关键词:指代消解最大熵
- 文献传递
- 基于维基百科的多文档自动摘要系统研究
- 2011年
- 设计并实现了一个基于维基百科的抽取式多文档自动摘要系统。使用ROUGE评测工具对使用维基百科前后的摘要进行对比实验。实验结果表明,维基百科能较大程度地提高多文档摘要的质量。
- 刘茂福余博胡慧君
- 关键词:多文档自动摘要维基百科句子抽取
- 基于事件项语义图聚类的多文档摘要方法被引量:6
- 2010年
- 基于事件的抽取式摘要方法一般首先抽取那些描述重要事件的句子,然后把它们重组并生成摘要。该文将事件定义为事件项以及与其关联的命名实体,并聚焦从外部语义资源获取的事件项语义关系。首先基于事件项语义关系创建事件项语义关系图并使用改进的DBSCAN算法对事件项进行聚类,接着为每类选择一个代表事件项或者选择一类事件项来表示文档集的主题,最后从文档抽取那些包含代表项并且最重要的句子生成摘要。该文的实验结果证明在多文档自动摘要中考虑事件项语义关系是必要的和可行的。
- 刘茂福李文捷姬东鸿
- 关键词:DBSCAN聚类算法
- 基于依存图的汉语主谓谓语句语义标注研究
- 建构大规模的汉语语义资源,是当前中文信息处理的重要任务之一。本文提出了基于依存图的语义标注方法,并在此基础上建构了一个大规模的汉语语义资源。依存图方法是一种无向图,可以清晰地表示出汉语语句中词语与词语之间的语义关系,包含...
- 陈波吕晨
- 关键词:主谓谓语句语义标注
- 文献传递
- 一种基于MIRA和遗传算法的句法分析模型构造方法
- 提出了一种新方法,通过在线学习算法MIRA(Margin Infused Relaxed Algorithm)和遗传算GA(GeneticAlgorithm)来构造句法分析模型。首先用MIRA用来构造句法分析模型,然后使...
- 王丹姬东鸿黄玮
- 关键词:在线学习算法遗传算法
- 文献传递
- 英语词语歧义检测方法述评
- 2012年
- 引言
很多歧义现象由多义词造成.解释一词多义现象和语义灵活性是当代词汇语义学的主要焦点。区分词语歧义(义项)是人际交往和语言工程的必须工作.涉及语言内部和外部因素。
- 倪盛俭
- 关键词:歧义现象英语词语词汇语义学一词多义现象人际交往多义词
- “把/被”及其相关句式的依存分析被引量:1
- 2011年
- "把""被"依存地位相同,均支配两个V论元,其中一个为原因V1,一个为结果V2;通常把/被字句的谓语动词不能是光杆动词形式,正在于"把""被"必须支配两个V的缘故。把字句与被字句有相同依存结构,其中"把""被"居于根结点位置,即为全句中心;通常称其为把字句、被字句,直观命名反映的是"把""被"可以控制全句的本质。把字句、被字句的形式差异及语义解读差异可通过"把/被"支配的V结点及V结点支配的N结点的差异得到一定解释,这些差异包括V的价类选择,及V和N结点的隐现等。本文还从依存结构上分析了新兴被字句的共性与个性,并预测了新兴把字句的情况。
- 冯文贺姬东鸿
- 关键词:把字句被字句