您的位置: 专家智库 > >

朱凯

作品数:1 被引量:0H指数:0
供职机构:西南交通大学信息科学与技术学院更多>>
发文基金:中央高校基本科研业务费专项资金铁道部科技研究开发计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息提取
  • 1篇内核
  • 1篇内核技术
  • 1篇WEB信息
  • 1篇WEB信息提...

机构

  • 1篇西南交通大学

作者

  • 1篇朱焱
  • 1篇朱凯

传媒

  • 1篇计算机科学

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
xScraper:基于Web-Harvest技术批量与深度获取无结构化Web信息
2012年
通过分析Web-Harvest数据提取规则的设计原理,设计实现了一个xScraper系统。该系统的主要功能有:(1)定制设计满足不同需求的Web数据提取规则模板,驱动Web-Harvest内核进行无结构化信息提取;(2)批量可控提取同一网址中的Web信息(含图像);(3)跨网站深度提取主题相关信息;(4)提取Web信息元数据并将其转换为XML标签;(5)实现无结构化多媒体信息的数据库管理。应用结果表明,系统提供了超出Web-Harvest的加值功能,可满足不同的信息提取需求,其简单实用,便于扩展。
朱焱朱凯
关键词:WEB信息提取
共1页<1>
聚类工具0