朱冠胜
- 作品数:2 被引量:4H指数:1
- 供职机构:复旦大学更多>>
- 发文基金:上海市高新技术产业化重点项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- XML关键字检索系统的数据源选择被引量:4
- 2012年
- 随着互联网数据爆炸式的增长,信息检索系统逐步采用分布式多数据源架构存储数据,在关键字检索时,选择与用户查询的关键字相关度大的数据源进行查询对提高检索效率显得格为重要.提出一种基于关键字检索的XML数据源选择方法,针对XML文档结构的层次特性,提出一种递归定义的结果评分模型,将结点的关键字频率与路径长度递归地加入到评分模型中,使得评分模型能够准确地评判结果的优劣.同时,利用评分模型定义并提取了XML数据源的摘要,并给出了摘要存储中涉及的压缩、优化、更新等问题的解决方案及算法.根据摘要信息,提出4种数据源选择的方案,并使用DBLP数据集来验证了文章所提出的数据源选择算法的有效性.
- 朱冠胜黄浩杨卫东
- 关键词:XML数据源选择关键字检索
- 基于关键字检索的XML数据源选择
- 关键字检索由于其对用户友好的特点在信息检索领域得到了广泛的应用,用户不需要学习数据源底层的结构信息及繁琐的查询语言,如SQL、XPath等,提出相关的关键字就能查询到所需要的信息。XML由于其结构的灵活特性,很快成为了数...
- 朱冠胜
- 关键词:XML关键字检索数据源选择信息检索