国家自然科学基金(60502048)
- 作品数:4 被引量:14H指数:2
- 相关作者:黄河燕陈肇雄张孝飞张亮张克亮更多>>
- 相关机构:中国科学院南京理工大学江苏警官学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向汉语分析的搜索引擎研究与实现被引量:4
- 2006年
- 搜索引擎是Internet上重要的信息检索工具.同时Internet上丰富的语言资源是汉语研究的重要内容.然而,服务于汉语分析的专业搜索引擎的研究与开发,目前还处于起步阶段.本文介绍了搜索引擎的基本原理,分析了Internet汉语研究的内在要求及其基本现状,详细阐述了一个面向汉语分析研究的搜索引擎的研究与设计,包括系统体系结构的设计、系统的汉语分析功能的描述以及实验结果的分析.初步结果表明,面向汉语分析的搜索引擎可以为汉语研究提供很好的帮助.
- 张亮黄河燕王树梅
- 关键词:信息检索搜索引擎元搜索引擎
- 面向应用的汉语句法分析辅助系统的设计与实现被引量:2
- 2006年
- 汉语句法分析是汉语研究和中文信息化处理中的一个关键环节,同时也是难点之一,面向汉语句法分析的辅助系统能为这个领域的研究与实践带来便利。本文概述了句法分析辅助系统的体系结构和基本功能,详细分析了系统实现中的两个关键算法,即括号匹配算法和句法解析算法,初步实验结果表明辅助系统效果良好,达到设计目的。
- 张亮陈肇雄黄河燕马玉芝
- 关键词:句法分析
- 大规模句子相似度计算方法被引量:6
- 2006年
- 如何根据源语言文本从大规模语料库中找出其最相近的翻译实例,即句子相似度计算,是基于实例翻译方法的关键问题之一。本文提出一种多层次句子相似度计算方法:首先基于句子的词表层特征和信息熵从大规模语料库中选择出少量候选实例,然后针对这些候选实例进行泛化匹配,从而计算出相似句子。在多策略机器翻译系统IHSMTS中的实验表明,当语料规模为20万英汉句对时,系统提取相似句子的召回率达96%。准确率达90%,充分说明了本文算法的有效性。
- 黄河燕陈肇雄张孝飞张克亮
- 关键词:句子相似度
- 一种面向机器翻译的双语组块识别方法
- 指出双语组块最重要的特点是语义自足性、结构合法性和翻译转换的充分性,即识别出来的“双语组块”包含有确定的语义信息和双语对译信息,并且符合一定的语法规范。为此,相应地提出了一种双语组块分析方法。其基本思路是:通过规则与统计...
- 张孝飞黄河燕陈肇雄
- 关键词:机器翻译语料库
- 文献传递
- 跨语言信息检索中查询语句翻译转换算法被引量:2
- 2007年
- 跨语言信息检索中,输入的查询语句往往是一系列关键词组合,而不是一个完整意义上的句子,致使查询关键词序列缺乏必要的语法、语境信息,难以实现查询语句的精确翻译。该文基于大规模双语语料库,以向量空间模型和词汇同现互信息为理论基础,运用传统单语信息检索技术,将查询语句的翻译问题转换为查询关键词词典义项的boost值计算,重构目标语查询语句。
- 张孝飞黄河燕陈肇雄代六玲
- 关键词:跨语言信息检索查询语句翻译转换双语语料库