赖治国
- 作品数:5 被引量:0H指数:0
- 供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 检索主题难易度评价
- TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把...
- 吕学强赖治国孙斌俞士汶
- 关键词:信息检索文本检索
- 文献传递
- 检索主题难易度预测
- TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新要求,该文提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,然...
- 吕学强赖治国昝红英项锟
- 关键词:信息检索文本检索
- 文献传递
- 检索主题难易度评价
- 2005年
- TREC 2004 R obust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列。针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型。根据W ordN et和它附带的B row n语料库构造了单词义项分布词典,再把检索主题中的单词按歧义性大小分为7类,通过计算平均单词容易度来度量检索主题的难度。实验结果表明,该模型有一定的预测能力。最后用此模型预测了TREC 2004 R obust任务的250个检索主题的难易度。
- 吕学强赖治国孙斌俞士汶
- 关键词:信息检索
- 中文搜索结果的在线层次聚类技术
- 本文改进了一种基于语义的、层次的、以集簇标签为向导对搜索引擎返回的结果进行层次聚类的算法。算法的主要思想是首先推导出可以表示集簇的集簇标签,然后在这些集簇标签的基础上,将摘要分配到不同的集簇中。展示了如何应用潜在语义分析...
- 赖治国
- 关键词:搜索结果聚类潜在语义索引
- 检索主题难易度预测
- TREC2004 Robust 任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新要求,该文提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet 和它附带的Brown 语料库构造了单词义项分布词...
- 吕学强赖治国昝红英项锟
- 关键词:信息检索
- 文献传递