北京市科技新星计划(H020820790130)
- 作品数:2 被引量:29H指数:2
- 相关作者:孙乐李飞李文波张永臣闵金明更多>>
- 相关机构:中国科学院软件研究所更多>>
- 发文基金:北京市科技新星计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 在查询反馈中改善文档聚类效果的策略研究
- 在信息检索的查询反馈处理中,可以利用聚类方法进行文档分析进而扩展查询条件[1]。这时被选择进行聚类的文档集合一般是小规模的,并且由于信息检索有限的性能,文档之间可能出现非常接近、一定程度上相似、基本无关等多种情况。本文针...
- 李文波孙乐
- 关键词:聚类孤立点信息检索
- 文献传递
- 基于Web数据的特定领域双语词典抽取被引量:16
- 2006年
- 双语词典是跨语言检索以及机器翻译等自然语言处理应用的基础资源。本文提出了一种从非平行语料中抽取特定领域双语词典的算法。首先给出了算法的基本假设并回顾了相关的研究方法,然后详细给出了利用词间关系矩阵法从特定领域非平行语料中抽取双语词典的过程,最后通过大量实验分析了种子词选择对词典抽取结果的影响,实验结果表明种子词的数量和频率对词典抽取结果有积极作用。
- 张永臣孙乐李飞李文波西野文人于浩方高林
- 关键词:中文信息处理双语词典
- 重新审视跨语言信息检索被引量:13
- 2006年
- 阻碍互联网资源在世界范围内广泛共享的一个主要障碍是多语言问题,而跨语言信息检索是解决这个问题的有效方法之一。本文从定义跨语言信息检索系统开始,给出了一个标准的跨语言信息检索系统框架和评价方法,对主流研究方法进行了重新审视,进一步明确指出了跨语言信息检索中必须解决的核心问题,最后通过分析研究现状给出了未来可能的重点研究方向。
- 闵金明孙乐张俊林
- 关键词:计算机应用中文信息处理跨语言信息检索未登录词词义消歧