倪廓阔
- 作品数:2 被引量:5H指数:1
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家社会科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 搜索引擎中“N1+N2”型短语查询优化研究被引量:5
- 2012年
- "N1+N2"作为现代汉语中常见的短语形式,亦广泛存在于搜索引擎检索用语中。以日志短语词典为基础,根据搜索日志查询串的语言特点,对包含"N1+N2"型短语的查询串进行改写,其中包括空格分割、引号加注和焦点强调方法,并对查询串粗略分类。实验结果显示:在引号加注的作用下MPA由0.362提高到0.441;导航类查询MRR值从0.64提升到0.719,信息事务类查询MRR值从0.25增加到0.344。从而验证了短语特征能够指导查询结果优化,进而提升搜索引擎性能。
- 倪廓阔吕学强韩艳铧王涛
- 关键词:搜索引擎查询优化
- 百度搜索日志中查询疑问推荐研究
- 2014年
- 查询疑问推荐,即通过推荐更合适的问句作为查询串来提升用户的搜索体验,其作为查询推荐的一个分支,是查询优化的主要障碍之一.本文依据百度搜索日志,研究搜索日志中疑问查询的语言特点,对显式疑问查询和隐式疑问查询进行分析,综合考虑到疑问查询在主题与疑问焦点方面信息的特征,提出了一种构建"主题-疑问焦点-问句"模型(简称为TFQ模型)的查询疑问推荐方法.在大规模真实Web搜索日志与搜索引擎反馈结果上的实验表明:准确性方面,推荐问句的MAP达到0.713;多样性方面,推荐问句的查询子话题精度(SP@r)达到0.630.
- 倪廓阔吕学强
- 关键词:搜索日志