杭州市重大科技创新项目(20112311A20)
- 作品数:2 被引量:3H指数:1
- 相关作者:陈岭刘颖陈根才殷婷肖敏更多>>
- 相关机构:浙江鸿程计算机系统有限公司浙江大学更多>>
- 发文基金:浙江省重大科技专项基金杭州市重大科技创新项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于CQPM的OLAP查询日志挖掘及推荐被引量:1
- 2012年
- 为提高用户的使用效率,提出基于连续查询模式挖掘(CQPM)算法的联机分析处理(OLAP)查询日志挖掘及推荐方法.CQPM算法在双向扩展频繁闭合序列模式挖掘算法(BIDE)的基础上加入查询之间的间隔约束,确保查询模式的连续性.提出方法通过基于查询后缀树的模糊查询模式匹配(AQPM)算法预测用户下一步有效查询,并将预测结果按概率大小排序后推荐给用户.通过8名OLAP分析人员在Mondrian OLAP服务器上的查询日志对提出方法进行性能评价,结果表明,相较基于prefixspan的改进算法,采用CQPM算法能够去除数量庞大的冗余的查询模式,相较基本的前缀匹配算法,AQPM算法能够提高推荐的准确率.
- 殷婷肖敏陈岭赵江奇王敬昌
- 关键词:数据仓库查询日志OLAP
- 基于历史点击数据的集合选择方法被引量:2
- 2013年
- 针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.
- 刘颖陈岭陈根才赵江奇王敬昌
- 关键词:分布式信息检索相似查询