您的位置: 专家智库 > >

成曦

作品数:2 被引量:4H指数:1
供职机构:东南大学信息科学与工程学院更多>>
发文基金:上海市科委科研计划项目国家社会科学基金上海市高校选拔培养优秀青年教师科研专项基金更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文档
  • 1篇领域本体
  • 1篇本体
  • 1篇WEB
  • 1篇WEB文档
  • 1篇抽取
  • 1篇抽取算法

机构

  • 1篇东南大学
  • 1篇华东师范大学
  • 1篇华东政法大学

作者

  • 1篇成曦
  • 1篇王麒
  • 1篇陈海燕

传媒

  • 1篇南昌大学学报...

年份

  • 1篇2009
2 条 记 录,以下是 1-1
排序方式:
基于领域本体的WEB文档正文的抽取算法
2009年
通过分析当前Web文档抽取的主流方法以及存在的不足,提出了一种基于文本块的改进算法-BWTE(Block-base Web Text Extraction)。该算法首先采用过滤的方法去除广告、超链接等比较明显的噪音信息,然后通过自底向上的文本块分块算法抽取出Web文档的正文。
成曦陈海燕王麒
关键词:本体WEB文档
共1页<1>
聚类工具0