熊皓
- 作品数:10 被引量:7H指数:1
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 联合语义角色标注和指代消解被引量:6
- 2013年
- 语义角色标注和指代消解是自然语言处理中两个重要的基础研究任务,该文提出使用马尔科夫逻辑网络对两个任务进行联合学习推导。通过提出8条联合学习规则,在OntoNote5.0的实验中证明采用联合学习推导后,两者的标注性能都比单独标注任务有了1.6个F值的性能提升。
- 熊皓刘群吕雅娟
- 关键词:语义角色标注指代消解
- 基于树到树翻译模型的翻译规则抽取方法和翻译方法
- 本发明提供一种基于树到树翻译模型的翻译规则抽取方法,包括下列步骤:1)、分析训练语料中的源语言串和目标语言串并输出训练语料的源语言压缩共享句法森林和训练语料的目标语言压缩共享句法森林;2)、根据所述训练语料的源语言压缩共...
- 刘洋吕亚娟刘群熊皓
- 文献传递
- 模糊匹配在树到串翻译模型中的应用被引量:1
- 2011年
- 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以由句法分析错误造成的规则无法匹配的现象很常见,特别是在树到树的翻译模型中,能够精确匹配的规则数量非常稀少,进而对机器翻译的性能造成很大影响。因此该文提出了一种基于树核的模糊匹配技术,在NIST 2005汉英翻译测试集上的结果表明,基于树核的模糊匹配模型相对于传统的翻译模型显著的提高了1.3个BLEU值,并且在森林模型中使用模糊匹配技术仍然能够提高0.7个BLEU值。
- 熊皓刘洋刘群
- 关键词:树核统计机器翻译
- 基于图模型的语义角色标注重排序
- 2013年
- 传统的语义角色标注模型使用的都是本地特征,不利于捕捉一些全局性的标注错误。该文提出使用图模型对语义角色标注结果进行重排序,利用标记传播迭代算法对标注的结果进行重排序,保证全局标注结果的一致性。该文在PropBank上的实验表明,采用重排序后标注性能有了2.4个F值的显著提升。在不使用系统融合技术的情况下,标注的结果是当前世界最好的性能。
- 熊皓刘群吕雅娟
- 关键词:语义角色标注图模型
- 基于篇章上下文的统计机器翻译方法
- 上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的,但是之前的SMT模型并没有充分利用上下文信息。在本文中,我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先我们利用向量空间模...
- 于惠谢军熊皓吕雅娟刘群林守勋
- 关键词:统计机器翻译上下文信息向量空间模型
- 文献传递
- 基于篇章上下文的统计机器翻译方法
- 2013年
- 上下文信息对于统计机器翻译(Statistical Machine Translation,SMT)中的规则选择是很重要的,但是之前的SMT模型只利用了句子内部的上下文信息,没有利用到整个篇章的上下文信息。该文提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先利用向量空间模型获得训练语料的文档和测试集中文档的相似度,然后把相似度作为一个新的特征加入到短语模型中。实验结果表明,在英语到汉语的翻译工作中,该方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BLEU值都有显著的提高。
- 于惠谢军熊皓吕雅娟刘群林守勋
- 关键词:统计机器翻译上下文信息向量空间模型
- 基于篇章上下文的统计机器翻译方法
- 上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的,但是之前的SMT模型并没有充分利用上下文信息。在本文中,我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先我们利用向量空间模...
- 于惠谢军熊皓吕雅娟刘群林守勋
- 关键词:统计机器翻译上下文信息向量空间模型
- 模糊匹配在树到串翻译模型中的应用
- 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以句法分折错误造成的规则无...
- 熊皓刘洋刘群
- 关键词:树核统计机器翻译
- 模糊匹配在树到串翻译模型中的应用
- 在传统的基于树的翻译模型中,一般都是将一条规则视为字符串,然后使用字符串匹配技术从规则表中搜索可用的规则。然而,由于基于树的翻译模型依赖于句法分析的结果,而有些语言的句法分析准确率并不是很高,所以句法分析错误造成的规则无...
- 熊皓刘洋刘群
- 关键词:树核统计机器翻译
- 文献传递
- 2009中国机器翻译研讨会计算所系统描述
- 本文介绍了中国科学院计算技术研究所自然语言处理实验室参加2009年中国机器翻译研讨会机器翻译评测的情况。今年,我们参加了汉英新闻领域单一系统及系统融合,英汉新闻、英汉科技和汉蒙日常用语五项评测任务,使用了Silenus、...
- 米海涛刘群刘洋冯洋夏天肖欣延熊皓郑达奇涂兆鹏吕雅娟
- 关键词:机器翻译自然语言处理
- 文献传递