梁华参
- 作品数:8 被引量:11H指数:2
- 供职机构:哈尔滨工业大学计算机科学与技术学院语言语音教育部-微软重点实验室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- CWMT2011哈工大机器智能与翻译研究室技术报告
- 本文详细介绍了哈尔滨工业大学机器智能与翻译研究室(HIT-MITLA)参加2011年全国机器翻译研讨会(cwMT2011)翻译评测任务的情况。在本次评测中,HIT-MITLAB共使用了5个翻译系统,它们分别是DINO,M...
- 梁华参刘乐茂于墨刘宇鹏胡鹏龙李婷婷张春越曹海龙赵铁军
- 关键词:机器翻译短语翻译
- 文献传递
- 统计机器翻译中双语语料的过滤及词对齐的改进被引量:3
- 2013年
- 词对齐是统计机器翻译系统中最重要的一个环节,统计机器翻译中的翻译模型和调序模型都是在词对齐结果的基础上构造的,词对齐阶段出现的错误,会延续到这些模型中,甚至会因为词对齐的错误而在这些模型中引发更大的错误。为减少词对齐阶段的错误,提出一种基于对齐困惑度的双语语料过滤方法和一种改进的判别式词对齐算法,语料过滤方法可以将词对齐阶段有严重错误的双语句对过滤掉,判别式词对齐算法与传统的自动词对齐算法相比,可以得到对齐错误率更低的词对齐结果。
- 梁华参赵铁军
- 关键词:词对齐统计机器翻译
- CWMT2008机器翻译评测技术报告
- 本文对哈尔滨工业大学机器智能与翻译实验室向CWMT2008所提交的机器翻译系统及译文融合系统进行了介绍。其中包括了3个机器翻译系统和3个译文融合系统。机器翻译主评系统为一个加入了句法信息的基于短语的统计机器翻译系统,第一...
- 王博蒋宏飞梁华参张春越孙加东赵铁军刘树杰马永亮王欣欣
- 关键词:机器翻译句法分析
- 文献传递
- 基于结构对齐的统计机器翻译模型被引量:2
- 2009年
- 从图同构角度给出树同构的性质,并阐述了结构异构与结构对齐之间的关系。在此基础上为建立结构映射关系,以及在翻译过程中融入句法结构信息,提出元结构、互译结构组概念及多层次结构对齐的体系。最后利用对数线性模型,给出基于元结构对齐的统计机器翻译模型。模型的翻译过程中,源语言句法树以元结构为单位进行分解,利用互译结构组映射知识,转换为目标语言句法树结构序列,从而根据结构模型信息对目标语实施调序和译文的生成。实验结果表明,本模型在对于翻译知识的泛化能力和翻译结果方面都优于基于短语的统计机器翻译模型。
- 孙加东赵铁军梁华参
- 关键词:统计机器翻译
- 面向统计机器翻译的解码算法的研究
- 统计机器翻译发展到今天,其模型已经经历了词模型,短语模型,形式句法模型,树-串模型,串-树模型的变化,目前还有很多学者在尝试建立树-树模型。如此繁复多样的模型,其解码器也各不相同。 本文主要描述了一种基于k-best句...
- 梁华参
- 关键词:统计机器翻译解码算法
- 文献传递
- CWMT2011哈工大机器智能与翻译研究室技术报告
- 本文详细介绍了哈尔滨工业大学机器智能与翻译研究室(HIT-MITLA)参加2011年全国机器翻译研讨会(CWMT2011)翻译评测任务的情况。在本次评测中,HIT-MITLAB共使用了5个翻译系统,它们分别是DINO,M...
- 梁华参刘乐茂于墨刘宇鹏胡鹏龙李婷婷张春越曹海龙赵铁军
- 关键词:机器翻译短语翻译
- 基于短语的统计机器翻译模型训练中若干关键问题的研究
- 上世纪90年代前后,IBMWatson研究中心的Brown等人提出了基于信源信道模型的统计翻译方法,此类方法的性能远远超越了传统的基于规则的翻译方法。其后德国亚琛工业大学的Och等人根据Brown的理论发布了开源词对齐工...
- 梁华参
- 关键词:短语抽取
- 词汇相似度约束的短语抽取被引量:2
- 2010年
- 为克服传统的短语抽取方法对词对齐信息的依赖性强,抗噪声能力差这一缺陷,提出基于词汇相似度约束的短语抽取策略;在此框架下,提出了3种基于词汇相似度的约束方法:Dice系数、Phi平方系数和对数似然比.在IWSLT2004语料上进行的实验表明,3种基于词汇相似度的约束方法的翻译系统的BLEU评分均优于传统的翻译系统;其中基于对数似然比方法得到的翻译模型比基线系统Pharaoh的BLEU-4评分提高了15.14%.
- 梁华参赵铁军薛永增孙加东
- 关键词:机器翻译统计机器翻译短语抽取词汇相似度