国家自然科学基金(60375019) 作品数:10 被引量:14 H指数:2 相关作者: 赵铁军 李生 杨沐昀 张春祥 张姝 更多>> 相关机构: 哈尔滨工业大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 建筑科学 更多>>
机器翻译评价方法的实现及翻译系统聚类 五十年来,研究者提出了多种人工和自动化的机器翻译质量评价方法利用不同语言特征评价译文的质量。本文选择常用的自动和人工评价方法对6个翻译系统进行了实验。把分数归一化之后,利用系统聚类的方法获得了6个翻译系统的系统图及类间距... 姚建民 赵铁军 李生关键词:系统聚类 文献传递 利用语义相似度解决双语词汇知识获取的错误累计问题 被引量:1 2006年 在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率. 刘鹏远 赵铁军 李生 杨沭昀关键词:词对齐 知识获取 HOWNET WORDNET 相似度 语义词典 Chinese Information Processing and Its Prospects 被引量:1 2006年 The paper presents some main progresses and achievements in Chinese information processing. It focuses on six aspects, i.e., Chinese syntactic analysis, Chinese semantic analysis, machine translation, information retrieval, information extraction, and speech recognition and synthesis. The important techniques and possible key problems of the respective branch in the near future are discussed as well. 李生 赵铁军面向奥运的汉英RBMT与EBMT研究 被引量:1 2006年 介绍了采用基于实例的方法和基于规则的方法在面向奥运的汉英机器翻译系统的最新进展。揭示了二者不同的翻译处理过程和翻译知识学习机制。通过2003年和2005年两次863汉英测试的结果比较了二者的性能差别。采用4元Bleu指标作为评分标准,在2005年863评测中RBMT系统的篇章类得分为0.1056。对话类得分为0.1714;EBMT系统的篇章类得分为0.0718,对话类得分为0.1454。 蒋宏飞 杨沐昀 赵铁军关键词:机器翻译 机器翻译系统跨领域移植方法的研究 被引量:1 2005年 机器翻译系统跨领域移植是降低系统开发代价的关键性因素。论文以翻译模板对训练语料库机器译文评测分数的贡献为依据,对其进行评价。从模板库中过滤出适应目标领域的翻译知识,以实现系统向新领域的快速移植。利用论文所提出的方法将一个通用领域的机器翻译系统向旅游领域进行移植,并使用来自旅游领域的2469句汉语句子作为测试语料进行开放测试。实验结果表明在开放测试中,机器译文的5元Nist评分提高了2.2807,上升了71.1%。 张春祥 赵铁军 杨沐昀 李生 时晓升关键词:机器翻译系统 面向事件的多语平行语料库构建研究 被引量:6 2005年 讨论了面向北京奥运的多语语料库建设中的若干基础问题。提出了面向事件、多领域融合的语料收集原则,制定了具有分类信息的标注规范,初步建立了具有近七万句对的可控多语语料库。 张姝 赵铁军 杨沐昀 李生基于TBL的中文名实体识别后处理技术 中文名实体识别是自然语言处理当中一个富有难度和挑战性的课题。本文提出了一种改进的基于TBL 的后处理技术,它对学习到的规则集合进行优化,极大地提高了单个分类器的识别效果。并且该方法可以自动获取专门领域的语言特征知识。同时... 刘利刚 谭红叶 赵铁军 杨沐昀关键词:TBL 后处理 文献传递 基于浅层句法信息的翻译实例获取方法研究 2009年 翻译实例库是基于实例的机器翻译系统的主要知识源。本文采用基于浅层句法分析的方法进行翻译实例的获取。首先根据浅层句法信息划分源语言和目标语言的翻译单元,然后在词对齐结果的指导下,利用统计对齐模型确定源语言和目标语言翻译单元之间的映射关系,从而获取翻译实例。通过与几种较具代表性的翻译实例获取方法进行对比实验发现,无论是对翻译实例库直接评测,还是通过EBMT系统进行间接评测,该方法都获得了令人满意的效果。 陈鄞 赵铁军 杨沐昀 李生关键词:浅层句法分析 基于译文加权的BLEU改进方法 BLEU是目前机器翻译自动评价的主要方法之一。针对BLEU中不区分译文差别而平均分配权重的问题,本文应用线性回归方法计算不同词性译文权重,进而设计不同长度译文组合的权重计算方式.实验表明,相对于传统的BLEU方法,本文的... 朱俊国 杨沐昀关键词:机器翻译 文献传递 汉英EBMT系统的领域自适应研究 EBMT系统在受限领域下可以高效地生成准确的译文,是目前应用较为成功的一种机器翻译技术。为了进一步解决此类系统面向不同应用领域时的自适应问题,本文提出应用文本分类技术。自动判别待翻译文本的类型,并选择对应的翻译实例库进行... 蒋宏飞 杨沐昀 刘海洁 赵铁军关键词:EBMT 领域自适应 文本分类 文献传递