广西壮族自治区自然科学基金(2012GXNSFAA053228)
- 作品数:2 被引量:4H指数:1
- 相关作者:王勇强保华谌超陶林更多>>
- 相关机构:桂林电子科技大学更多>>
- 发文基金:国家自然科学基金广西壮族自治区自然科学基金广西可信软件重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Lucene的Web服务查询系统设计与实现
- 2016年
- 针对用户需求复杂多变,提出了用户反馈2阶段Web服务查询方法。该方法引入基于Lucene规范的Web服务搜索引擎系统,该系统由WSDL处理模块、向量化模块、相似度计算模块和QoS模块组成,分别支持WSDL解析功能、WSDL索引建立与查询功能、自定义权重计算功能和QoS功能。在解析加拿大Guelph大学的2507个真实WSDL文档集合基础上,筛选出符合Web服务功能标准的WSDL文档集,并对其进行服务索引建立和查询测试。实验结果表明,系统Web服务发现性能具有较高P@N值和NDCP值,验证了系统的可行性和有效性。
- 叶骏宏王勇强保华
- 关键词:WEB服务WSDLLUCENE
- 基于Hadoop的Nutch网页排序算法研究与实现被引量:4
- 2013年
- 为了满足搜索引擎系统日益增长的高质量检索需求,针对Nutch搜索引擎框架没有实现Google的PageR-ank网页排序算法,分析了PageRank算法,并通过实验验证了PageRank算法的有效性,成功搭建Hadoop分布式集群,在Nutch框架中基于MapReduce分布式编程模式编码实现PageRank算法。实验结果表明,在Nutch搜索引擎系统中实现了PageRank算法后,系统的检索具有更高的准确率,能够更好地为用户提供检索服务。
- 陶林谌超强保华王勇
- 关键词:HADOOP集群MAPREDUCENUTCH网页排序算法PAGERANK