蒋宏飞
- 作品数:12 被引量:8H指数:2
- 供职机构:北京师范大学中文信息处理研究所更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- CWMT2008机器翻译评测技术报告
- 本文对哈尔滨工业大学机器智能与翻译实验室向CWMT2008所提交的机器翻译系统及译文融合系统进行了介绍。其中包括了3个机器翻译系统和3个译文融合系统。机器翻译主评系统为一个加入了句法信息的基于短语的统计机器翻译系统,第一...
- 王博蒋宏飞梁华参张春越孙加东赵铁军刘树杰马永亮王欣欣
- 关键词:机器翻译句法分析
- 文献传递
- 基于词语对齐融合提高统计机器翻译质量
- 当前,多数统计机器翻译系统通过从并行双语语料中抽取翻译知识来建立模型。而词对齐是第一个关键技术,后面的翻译知识获取均要依赖于此。但是词对齐性能和机器翻译性能之间关系尚不明朗,而差异较大的词对齐模型也许会为机器翻译提供互补...
- 张春越蒋宏飞赵铁军
- 关键词:统计机器翻译词语对齐
- 文献传递
- 汉语二语教学领域词义标注语料库的研究及构建
- 汉语二语教学领域,词汇教学在其中占有极为重要的地位,其中多义词又是词汇教学的重点和难点。本研究通过分析三部经典领域词表,选取了1181个重点多义词,以《现代汉语词典(第六版)》为标注体系,制定了适合实际标注的多义词标注规...
- 王敬杨丽姣蒋宏飞苏靖杰付静玲
- 关键词:语料库
- 面向奥运的汉英RBMT与EBMT研究被引量:1
- 2006年
- 介绍了采用基于实例的方法和基于规则的方法在面向奥运的汉英机器翻译系统的最新进展。揭示了二者不同的翻译处理过程和翻译知识学习机制。通过2003年和2005年两次863汉英测试的结果比较了二者的性能差别。采用4元Bleu指标作为评分标准,在2005年863评测中RBMT系统的篇章类得分为0.1056。对话类得分为0.1714;EBMT系统的篇章类得分为0.0718,对话类得分为0.1454。
- 蒋宏飞杨沐昀赵铁军
- 关键词:机器翻译
- 一种基于同步树替换文法的统计机器翻译模型被引量:1
- 2009年
- 提出一种基于同步树替换文法的机器翻译模型.相对于基于短语的模型,此模型可以对远距离结构性调序和非连续短语翻译进行建模;相对于基于同步上下文无关文法模型,此模型可以对任何层次上的树节点调序进行建模.因此,该模型可以为处理语言结构间的异构对应问题提供有效的解决途径.在两组风格差异较大的数据集上进行的实验均验证了基于同步树替换文法的模型相对于基于短语模型和基于同步上下文无关文法模型的稳定优势.
- 蒋宏飞李生付国宏赵铁军张民
- 关键词:机器翻译
- EBMT翻译模型自动构建研究
- 基于实例的机器翻译方法具有系统实现周期短,容易对新的知识进行扩充,在限定领域下可以生成高质量的译文的优点。但是,由于在EBMT系统进行译文搜索的过程中往往只能依靠人为设定的启发式函数进行指导,对人为因素的依赖较大,很容易...
- 蒋宏飞
- 关键词:机器翻译机器学习算法翻译模型
- 文献传递
- 汉英EBMT系统的领域自适应研究
- EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术。为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术。自动判别待翻译文本的类型,并选择对应的翻译实例库进行...
- 蒋宏飞杨沐昀刘海洁赵铁军
- 关键词:EBMT领域自适应文本分类
- 文献传递
- 基于同步树替换文法的统计机器翻译方法研究
- 机器翻译的研究已经有五十多年的历史。目前,主导的研究方向是基于统计的机器翻译。经过近十多年的发展,统计机器翻译已经从最开始的基于词的模型演变到现在比较成熟的基于短语的翻译模型,直至目前正处于研究热点阶段的基于句法的统计机...
- 蒋宏飞
- 关键词:统计机器翻译句法限制
- 文献传递
- 基于同步树序列替换文法的统计机器翻译模型被引量:2
- 2009年
- 基于短语的模型是目前发展相对成熟的一种统计机器翻译(Statistical machine translation,SMT)模型.但基于短语的模型不包含任何结构信息,因而缺乏有效的全局调序能力,同时不能对非连续短语进行建模.基于句法的模型因具有结构信息而具有解决以上问题的潜力,因而越来越受到研究者们的重视.然而现有的大多数基于句法的模型都因严格的句法限制而制约了模型的描述能力.为突破这种限制并将基于短语的模型的优点融入到句法模型中,本文提出一种基于同步树序列替换文法(Synchronous tree sequence substitution grammar,STSSG)的统计机器翻译模型.在此模型中,树序列被用作为基本的翻译单元.在这种框架下,不满足句法限制的翻译等价对和满足句法限制的翻译等价对都可以融入句法信息并被翻译模型所使用.从而,两种模型的优点均得到充分利用.在2005年度美国国家标准与技术研究所(NIST)举办的机器翻译评比的中文翻译任务语料上的实验表明,本文提出的模型显著地超过了两个基准系统:基于短语的翻译系统Moses和一个基于严格树结构的句法翻译模型.
- 蒋宏飞李生张民赵铁军杨沐昀
- 关键词:统计机器翻译句法限制
- 汉英EBMT系统的领域自适应研究
- EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术.为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术,自动判别待翻译文本的类型,并选择对应的翻译实例库进行...
- 蒋宏飞杨沐昀刘海洁赵铁军
- 关键词:EBMT领域自适应文本分类翻译
- 文献传递