刘洋
- 作品数:9 被引量:155H指数:5
- 供职机构:清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部人文社会科学研究重大课题攻关项目更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于多粒度的英汉人名音译被引量:4
- 2013年
- 音译是解决人名翻译的重要方法。在英汉人名音译问题中,翻译粒度问题一直是研究的重点之一。该文提出一种基于多粒度的英汉人名音译方法。将多种粒度的英文切分通过词图进行融合,并使用层次短语模型进行解码,从而缓解了由于切分错误而导致的音译错误,提高了系统的鲁棒性。实验结果表明基于多粒度的音译方法融合了基于各种粒度音译方法的优点,在准确率上提高了3.1%,在BLEU取得了2.2个点的显著提升。
- 于恒凃兆鹏刘群刘洋
- 关键词:多粒度词图
- 分布式共享设备的等时传输优化
- 通过扩展基于单机的硬件设备/驱动框架,提供外设层上的远程设备共享和访问服务,(即分布式设备的共享访问模式)可在系统层面上给用户提供各种分布式IO服务,从而共享分布式设备。然而,基于单机的硬件传输协议并没有考虑到网络远程连...
- 李宇骞袁欣颢王磊刘超刘洋顾荣辉王乃铮陈渝
- 关键词:分布式USB
- 文献传递
- Proofreading中快速发现英汉译文错误研究
- 随着中国的不断发展强大,国际交流与合作日益增多。这样,文本翻译任务也随之越来越重。目前机器翻译和校对还都远未达到理想的水平,只能在特定专业领域进行辅助性的翻译和校对。人工翻译和校对还是文本翻译的主要方式。面对繁重的校对任...
- 李闻江铭虎刘洋
- 关键词:翻译腔逻辑
- 文献传递
- 神经机器翻译前沿进展被引量:106
- 2017年
- 机器翻译研究如何利用计算机实现自然语言之间的自动翻译,是人工智能和自然语言处理领域的重要研究方向之一.近年来,基于深度学习的神经机器翻译方法获得迅速发展,目前已取代传统的统计机器翻译成为学术界和工业界新的主流方法.首先介绍神经机器翻译的基本思想和主要方法,然后对最新的前沿进展进行综述,最后对神经机器翻译的未来发展方向进行展望.
- 刘洋
- 关键词:人工智能
- 同步数据流语言高阶运算消去的可信翻译被引量:8
- 2015年
- Lustre是一种广泛应用于工业界核心安全级控制系统的同步数据流语言,采用形式化验证的方法实现Lustre到C的编译器可以有效地提高编译器的可信度.基于这种方法,开展了从Lustre*(一种类Lustre语言)到C子集Clight的可信编译器的研究.由于Lustre*与Clight之间巨大的语言差异,整个编译过程划分为多个层次,每个层次完成特定的翻译工作.阐述了其中高阶运算消去的翻译算法,翻译过程采用辅助定理证明工具Coq实现,并进行严格的正确性证明.
- 刘洋甘元科王生原董渊杨斐石刚闫鑫
- 关键词:形式化验证定理证明
- 基于非平行语料的双语词典构建被引量:5
- 2018年
- 在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.
- 张檬刘洋刘洋
- 可信编译器构造的翻译确认方法简述被引量:2
- 2014年
- 编译器的安全可信问题日益引起重视,特别是在安全关键系统中,编译器的误编译将会造成重大的损失。消除误编译的传统方法是大量的测试,但是测试难以达到完全覆盖,并不能充分地保证编译器的安全可信。近年来,形式化验证方法被成功用于可信编译器的构造中。一种方法是对编译器本身进行形式化验证,经过严密的证明,可杜绝误编译的发生。然而,这种方法可能"冻结"编译器的设计,阻碍编译器未来可能的优化和完善。翻译确认是另外一种用于可信编译器构造的形式化方法,它避免了对编译器自身的验证,有很好的可重用性,近年来在编译器验证领域得到了广泛研究,已取得令人瞩目的成果。介绍了翻译确认方法的概念及研究进展。
- 刘洋杨斐石刚闫鑫王生原董渊
- 关键词:形式化验证方法
- 语言计算的重要国际前沿被引量:23
- 2014年
- 该文在互联网规模语言信息处理的语境下,从语言计算基础模型、语言分析、语言资源建设、机器翻译、文本内容理解与问答等多个方面,对国内外相关重要动态进行了评述,讨论了语言计算的若干前沿问题及其对中文信息处理近期研究工作所提出的要求。
- 孙茂松刘挺姬东鸿穗志方赵军张钹吾守尔.斯拉木俞士汶朱军李建民刘洋王厚峰吐尔根.依布拉音刘群刘知远
- 关键词:中文信息处理
- 利用单语数据改进神经机器翻译压缩模型的翻译质量被引量:10
- 2019年
- 该文提出利用一个大型且精度高的神经机器翻译模型(教师模型)从单语数据中提取隐性双语知识,从而改进小型且精度低的神经机器翻译模型(学生模型)的翻译质量。该文首先提出了'伪双语数据'的教学方法,利用教师模型翻译单语数据获得的合成双语数据改进学生模型,然后提出了'负对数似然—知识蒸馏联合优化'教学方法,除了利用合成双语数据,还利用教师模型获得的目标语言词语概率分布作为知识,从而在知识蒸馏框架下提高学生模型的翻译质量。实验证明,在中英和德英翻译任务上,使用该方法训练的学生模型不仅在领域内测试集上显著超过了基线学生模型,而且在领域外测试集上的泛化性能也得到了提高。
- 李响刘洋刘洋刘群