国家教育部博士点基金(200802850006)
- 作品数:9 被引量:109H指数:5
- 相关作者:周国栋孔芳朱巧明王步康王红玲更多>>
- 相关机构:江苏省计算机信息处理技术重点实验室苏州大学信息技术有限公司更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于合一句法和实体语义树的中文语义关系抽取被引量:19
- 2010年
- 该文提出了一种基于卷积树核函数的中文实体语义关系抽取方法,该方法通过在关系实例的结构化信息中加入实体语义信息,如实体类型、引用类型和GPE角色等,从而构造能有效捕获结构化信息和实体语义信息的合一句法和实体语义关系树,以提高中文语义关系抽取的性能。在ACE RDC 2005中文基准语料上进行的关系探测和关系抽取的实验表明,该方法能显著提高中文语义关系抽取性能,大类抽取的最佳F值达到67.0,这说明结构化句法信息和实体语义信息在中文语义关系抽取中具有互补性。
- 虞欢欢钱龙华周国栋朱巧明
- 基于树核函数的“it”待消解项识别研究被引量:3
- 2010年
- 该文在基于特征的英文代词指代消解平台上,使用复合核函数,研究指代消解中待消解项"it"的识别问题。围绕"it"是否是待消解项,该文采取有效策略获得"it"句法结构信息与平面特征信息,并将它们结合起来生成"it"待消解项分类器。在测试分类器性能的同时,将其运用到代词指代消解中以检验它对指代消解的作用。最后在ACE2003基准语料上实验表明采用复合核生成的分类器具有较高的准确率,并能显著提高代词指代消解性能。
- 陈九昌孔芳朱巧明周国栋
- 关键词:复合核指代消解
- 基于树核函数的中英文代词消解被引量:23
- 2012年
- 基于树核函数,提出了从使用中心理论、集成竞争者信息和融入语义角色相关信息这3个方面对结构化句法树进行动态扩展来提升中英文代词消解的性能.首先探索了3种基本结构化句法树捕获方案,并使用SVMLight中提供的卷积树核函数直接进行基于结构化句法树的相似度计算,从而完成指代消解任务;其次,在分析3种结构化句法树捕获方案的基础上,从中心理论、竞争者信息和语义角色相关信息等几方面对捕获的结构化句法树进行了扩展;最后,通过ACE 2004 NWIRE英文语料和ACE 2005 NWIRE中文语料上的实验,说明了这些扩展能够提升代词消解的性能.
- 孔芳周国栋
- 关键词:代词消解树核函数
- 基于依存句法分析的中文语义角色标注
- 依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。本文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使...
- 王步康王红玲袁晓虹周国栋
- 关键词:语义角色标注最大熵分类器
- 文献传递
- 一种改进的中文层次句法分析模型研究
- 首先提出了层次句法分析模型,该模型先对输入句子进行词性标注和基本组块识别,紧接着循环多次进行复杂组块识别直至得到根结点。该方法本质上属于一种基于移进-归约序列的句法分析模型,因此具有此类模型的各类优点;然后,本文分析了移...
- 李军辉周国栋朱巧明钱培德
- 文献传递
- 依存关系上的中文名词性谓词识别研究被引量:1
- 2011年
- 首次实现了一个基于依存关系的中文名词性谓词识别平台,作为语义角色标注的前提,谓词识别的结果直接影响语义角色标注的性能。使用两种方法进行实验:一种是基于传统的特征向量的方法在Chinese Nombank的转换语料上进行了系统实验,对各种词法特征、结构特征及其组合进行了测试,标准语料上F1值达到89.65,自动语料上达到81.27。另一种是使用树核的方法进行探索性实验,在标准语料和自动语料上分别得到84.62和80.93的F1值。
- 王红玲袁晓虹王步康周国栋
- 关键词:语义角色标注树核
- 基于依存关系的中文谓词标注研究
- 谓词标注是语义角色标注中的重要一步,它的性能直接影响到语义角色标注的性能。本文实现了一个基于依存关系的中文谓词分析平台,使用最大熵分类器在CoNLL’2008和CoNLL’2009评测数据上进行了系统实验,对各种词法、语...
- 袁晓虹王步康王红玲周国栋
- 关键词:语义角色标注最大熵分类器
- 文献传递
- 基于依存句法分析的中文语义角色标注被引量:23
- 2010年
- 依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。该文采用英文语义角色标注的研究方法,实现了一个基于中文依存句法分析的语义角色标注系统。该系统针对中文依存关系树,采用有效的剪枝算法和特征,使用最大熵分类器进行语义角色的识别和分类。系统使用了两种不同的语料,一种是由标准短语结构句法分析(CTB5.0)转换而来,另一种是CoNLL2009公布的中文语料。系统分别在两种语料的标准谓词和自动谓词的基础上进行实验,在标准谓词上取得的F1值分别为84.30%和81.68%,在自动谓词上的F1值为81.02%和81.33%。
- 王步康王红玲袁晓虹周国栋
- 关键词:中文信息处理语义角色标注最大熵分类器
- 基于机器学习方法的英文事件代词消解研究被引量:2
- 2012年
- 与实体指代不同,事件指代因为其先行词候选是一个事件,与名词性的指代词具有完全不同的语义分类体系,因此适用于实体指代消歧的大多数特征都不能用于事件指代消歧。该文给出了一个基于机器学习方法的事件代词指代消歧平台,详细介绍了平台的实例生成和特征选择过程,并给出了平台在OntoNotes3.0语料上的事件代词指代消歧的结果,对结果进行了分析。从实验结果可以看到,给出的平台获得了较好的系统性能。
- 张宁孔芳李培峰周国栋朱巧明
- 关键词:机器学习方法
- 中英文指代消解中待消解项识别的研究被引量:15
- 2012年
- 深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;利用复合核函数将平面特征和结构化特征有效结合,对待消解识别问题进行了进一步研究.在ACE2003英文语料和ACE2005中文语料上的实验结果表明,提出的多种待消解项识别方案各具特色,都取得了不错的性能.最后将得到的待消解项识别模块应用于中英文的指代消解任务.实验结果表明,合适的待消解项识别能够大大提高中英文指代消解的性能.
- 孔芳朱巧明周国栋