2024年11月8日
星期五
|
欢迎来到营口市图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
邱荷花
作品数:
4
被引量:7
H指数:1
供职机构:
华中科技大学计算机科学与技术学院
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
李平
华中科技大学
邹复好
华中科技大学
凌贺飞
华中科技大学
刘学
华中科技大学
孔涛
中国船舶重工集团公司
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
专利
1篇
期刊文章
1篇
学位论文
领域
3篇
自动化与计算...
主题
4篇
爬虫
4篇
分布式
2篇
信息缺失
2篇
视频
2篇
爬虫系统
2篇
网络
2篇
结点
2篇
分布式网络
2篇
分布式文件
2篇
分布式文件系...
2篇
负载均衡
2篇
URL
2篇
HADOOP...
2篇
MAPRED...
1篇
HADOOP
机构
4篇
华中科技大学
1篇
中国船舶重工...
作者
4篇
邱荷花
2篇
刘学
2篇
凌贺飞
2篇
邹复好
2篇
李平
1篇
孔涛
传媒
1篇
华中科技大学...
年份
1篇
2015
2篇
2013
1篇
2012
共
4
条 记 录,以下是 1-4
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种分布式网络爬虫系统中的URL去重方法
本发明提供了一种分布式网络爬虫系统中的URL去重方法,通过引入虚拟爬行结点,实现了高效的任务划分策略,从而更好地适应分布式网络爬虫系统中实际爬行结点的动态变化,在任务划分策略基础上使用一种分布式的URL去重方式,从而避免...
邹复好
凌贺飞
李平
刘学
邱荷花
文献传递
一种分布式网络爬虫系统中的URL去重方法
本发明提供了一种分布式网络爬虫系统中的URL去重方法,通过引入虚拟爬行结点,实现了高效的任务划分策略,从而更好地适应分布式网络爬虫系统中实际爬行结点的动态变化,在任务划分策略基础上使用一种分布式的URL去重方式,从而避免...
邹复好
凌贺飞
李平
刘学
邱荷花
基于Hadoop的视频爬虫系统的设计与实现
随着网络的迅猛发展,网络使用人群日益扩大,数字媒体作品数量快速增长。面对网络上如此海量的媒体作品,版权保护成为了一个亟待解决的问题。运用拷贝检测技术实现内容拷贝追踪,是一种行之有效的数字内容版权保护方案。而如何获取海量媒...
邱荷花
关键词:
HADOOP
MAPREDUCE
HADOOP分布式文件系统
文献传递
基于MapReduce的视频爬虫系统研究
被引量:7
2015年
针对当前网络中视频媒体数量大、更新快、内容多、下载难,以及基于单机的视频网络爬虫系统中的处理速度慢、并发度低和下载速度慢等问题,提出了基于Hadoop框架的视频爬虫系统,为视频爬取提供了高并发度的处理和爬取速度.通过MapReduce计算模型实现网页抓取、分析、去重及下载等计算任务,Hadoop分布式文件系统(HDFS)存储各阶段计算任务的计算结果,运用多处备份机制,使得在某个结点退出时转移任务集,不影响整个系统的稳定性和有效性.实验结果表明完全分布式基于Hadoop的视频爬虫系统无论在单位时间内的视频下载速率还是爬取网页个数都明显高于未基于Hadoop的和伪分布式的视频爬虫系统.
孔涛
曹丙章
邱荷花
关键词:
视频
爬虫
分布式
HADOOP分布式文件系统
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张