您的位置: 专家智库 > >

刘小虎

作品数:6 被引量:236H指数:4
供职机构:哈尔滨工业大学计算机科学与技术学院计算机科学与工程系更多>>
发文基金:国家高技术研究发展计划国家自然科学基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 5篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇机器翻译
  • 3篇翻译
  • 2篇语料
  • 2篇语料库
  • 1篇单词
  • 1篇信息处理
  • 1篇信息增益
  • 1篇优化算法
  • 1篇消歧
  • 1篇目标语
  • 1篇决策树
  • 1篇基于语料
  • 1篇基于语料库
  • 1篇机器翻译系统
  • 1篇翻译系统
  • 1篇词典
  • 1篇词义消歧

机构

  • 6篇哈尔滨工业大...
  • 1篇黑龙江大学

作者

  • 6篇刘小虎
  • 6篇李生
  • 2篇赵铁军
  • 1篇吴葳
  • 1篇荀恩东
  • 1篇蔡萌
  • 1篇陈斌
  • 1篇鞠英杰

传媒

  • 2篇情报学报
  • 1篇计算机研究与...
  • 1篇软件学报
  • 1篇中文信息学报
  • 1篇应用基础与工...

年份

  • 1篇1999
  • 2篇1998
  • 3篇1997
6 条 记 录,以下是 1-6
排序方式:
基于目标语统计的译文选择的研究被引量:5
1999年
译文选择是词义消歧研究在机器翻译中的分支.本文介绍了基于目标语统计的译文选择的原理,并以英汉机器翻译中汉语译文的选择为例,详细讨论了基于目标语统计的方法的实现.通过对词典译文的处理得到统计数据.为适应实用化系统的要求,统计数据进行压缩,并采用特殊的检索算法.提出了多项式级的逐步渗透译文选择算法,实验结果表明,该算法可以将译文选择正确率提高10%以上.
赵铁军荀恩东陈斌刘小虎李生
关键词:词义消歧目标语机器翻译
决策树的优化算法被引量:210
1998年
决策树的优化是决策树学习算法中十分重要的分支.以ID3为基础,提出了改进的优化算法.每当选择一个新的属性时,算法不是仅仅考虑该属性带来的信息增益,而是考虑到选择该属性后继续选择的属性带来的信息增益,即同时考虑树的两层结点.提出的改进算法的时间复杂性与ID3相同,对于逻辑表达式的归纳,改进算法明显优于ID3.
刘小虎李生
关键词:决策树信息增益
基于词典和统计的语料库词汇级对齐算法被引量:13
1997年
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。
刘小虎吴葳李生赵铁军蔡萌鞠英杰
关键词:语料库信息处理
基于语料库的译文选择被引量:7
1997年
源语言中单词的目标语译文选择问题,一直是人们广泛关注的难题,直接决定译文的质量。本文采用基于语料库的统计方法,利用单词与单词的共现概率来消除多义选择歧义,应用约束传播算法同时解决句子中所有的歧义词。考虑到语料库的大小限制,不可能覆盖所有的词词搭配,我们采用了较好的平滑技术,提高了语料库的覆盖率。另外,对于译文选择的统计显著性也作出了定量的分析。为解决汉译英中的英语译文选择的问题,我们利用该方法对汉语动词、名词、形容词的译文选择进行消歧实验,与基于规则的方法相比准确率增加了9%
刘小虎李生
关键词:机器翻译语料库
全文增补中
机器辅助翻译中模糊查词典和快速录入单词被引量:1
1997年
本文介绍在单词记忆不准确的情况下,如何查找词典以及如何只键入单词中的几个字母快速录入单词的算法。在辅助翻译和写作系统中,词汇级的帮助是最基本的,主要指词典查询。但很多情况下,用户单词记忆不很准确,只记住了几个字母,本文解决这种情况下的模糊查询问题。这种模糊技术的核心是全文检索,依赖于词典的特殊索引。在解决了模糊查询之后,利用全文检索技术以及模糊二分查找技术进一步开发了写作系统中的快速录入功能。
刘小虎李生吴葳
关键词:单词
机器翻译系统中基于机器学习的目标词选择被引量:3
1998年
文中利用机器学习的方法研究英汉机器翻译中目标词选择的问题。词的目标语选择本质上是词的多分类问题,不同的译文就是不同的分类.文中以决策归纳学习算法ID3为基础,提出了特征为树型结构并且带有歧义性时使用ID3学习算法的方法。以词的上下文中单词的语义分类为特征,该方法用于词的目标语选择取得了良好的效果.
刘小虎李生
关键词:机器翻译系统
共1页<1>
聚类工具0