2024年11月16日
星期六
|
欢迎来到营口市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
成曦
作品数:
2
被引量:4
H指数:1
供职机构:
东南大学信息科学与工程学院
更多>>
发文基金:
上海市科委科研计划项目
国家社会科学基金
上海市高校选拔培养优秀青年教师科研专项基金
更多>>
相关领域:
电子电信
自动化与计算机技术
更多>>
合作作者
陈海燕
华东政法大学信息科学技术学院
王麒
华东师范大学信息科学技术学院计...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
文档
1篇
领域本体
1篇
本体
1篇
WEB
1篇
WEB文档
1篇
抽取
1篇
抽取算法
机构
1篇
东南大学
1篇
华东师范大学
1篇
华东政法大学
作者
1篇
成曦
1篇
王麒
1篇
陈海燕
传媒
1篇
南昌大学学报...
年份
1篇
2009
共
2
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于领域本体的WEB文档正文的抽取算法
2009年
通过分析当前Web文档抽取的主流方法以及存在的不足,提出了一种基于文本块的改进算法-BWTE(Block-base Web Text Extraction)。该算法首先采用过滤的方法去除广告、超链接等比较明显的噪音信息,然后通过自底向上的文本块分块算法抽取出Web文档的正文。
成曦
陈海燕
王麒
关键词:
本体
WEB文档
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张