黄云
- 作品数:5 被引量:8H指数:1
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家杰出青年科学基金更多>>
- 相关领域:语言文字自动化与计算机技术更多>>
- 第七届全国机器翻译研讨会(CWMT2011)评测报告
- 1概述为了全面了解国内外机器翻译技术的现状,促进机器翻译技术的研究,按照惯例,第七届全国机器翻译研讨会(CWMT2011)继续组织了统一的机器翻译评测,以推进参评单位的实质性交流和机器翻译技术的发展。本次评测由中国科学院...
- 赵红梅吕雅娟贲国生黄云刘群
- 文献传递
- 基于小规模俄汉双语词典的俄语形态切分
- 俄语是一种形态丰富的语言,其形态切分相关语料较为缺乏或带有噪声,这些都为俄语的形态切分研究带来困难。我们将此问题建模为经典的序列标注模型,首先自动切分小规模俄汉双语词典提取出形素字典作为训练数据,然后针对这种语言特点训练...
- 黄云姜文斌王志洋祝捷吕雅娟刘群
- 关键词:词语切分词法分析最大熵
- 第七届全国机器翻译研讨会(CWMT2011)评测报告
- 为了全面了解国内外机器翻译技术的现状,促进机器翻译技术的研究,按照惯例,第七届全国机器翻译研讨会(CWMT2011)继续组织了统一的机器翻译评测,以推进参评单位的实质性交流和机器翻译技术的发展。本文对第七届全国机器翻译研...
- 赵红梅吕雅娟贲国生黄云刘群
- 关键词:评测报告
- 第七届全国机器翻译研讨会机器翻译评测总结被引量:8
- 2012年
- 该文介绍了第七届全国机器翻译研讨会(CWMT2011)机器翻译评测的具体情况。本次评测重点关注各种语言到汉语的翻译,除了汉英、英汉、日汉三个语言对以外,评测还新增了五种民族语言(藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语)到汉语的翻译评测。共有19家国内外单位的165个系统参加此次评测。除了介绍评测项目的设置、评测数据的准备、评测流程、参评单位等,本文还重点介绍了CWMT2011的评测结果,并对评测结果进行了分析,用实例说明了与评测结果相关的几个因素:源语言与目标语言是否相似、评测领域是否集中、测试集与训练及开发集语料是否相似、训练语料的规模、参评系统的技术和成熟度等。
- 赵红梅吕雅娟贲国生黄云刘群
- 关键词:机器翻译机器翻译评测
- 基于小规模俄汉双语词典的俄语形态切分
- 俄语是一种形态丰富的语言,其形态切分相关语料较为缺乏或带有噪声,这些都为俄语的形态切分研究带来困难。我们将此问题建模为经典的序列标注模型,首先自动切分小规模俄汉双语词典提取出形素字典作为训练数据,然后针对这种语言特点训练...
- 黄云姜文斌王志洋祝捷吕雅娟刘群
- 关键词:俄语词语切分词法分析最大熵
- 文献传递