期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Hadoop的可视化Deep Web采集平台设计
被引量:
4
1
作者
刘彤
张阳
+1 位作者
孙琦
袁翀
《计算机工程与科学》
CSCD
北大核心
2016年第2期217-223,共7页
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Had...
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Hadoop的可视化Deep Web采集平台是一种简单易操作的高效深度采集平台,运用Webkit技术作为核心引擎实现可视化配置和深度采集功能,同时通过优化采集算法,调整Hadoop任务分配策略提升效率。实验结果表明,设计的数据采集平台获得了较好的效果。
展开更多
关键词
数据采集
HADOOP
可视化
下载PDF
职称材料
题名
基于Hadoop的可视化Deep Web采集平台设计
被引量:
4
1
作者
刘彤
张阳
孙琦
袁翀
机构
北京市
计算中心
云
计算
关键技术
与应用
北京市
重点
实验室
北京市计算中心云计算关键技术与应用北京市重点实验室物联网与大数据应用事业部
出处
《计算机工程与科学》
CSCD
北大核心
2016年第2期217-223,共7页
基金
国家自然科学基金(71303023)
北京市科学技术研究院萌芽计划基金
文摘
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Hadoop的可视化Deep Web采集平台是一种简单易操作的高效深度采集平台,运用Webkit技术作为核心引擎实现可视化配置和深度采集功能,同时通过优化采集算法,调整Hadoop任务分配策略提升效率。实验结果表明,设计的数据采集平台获得了较好的效果。
关键词
数据采集
HADOOP
可视化
Keywords
data crawler
Hadoop
visualization
分类号
TP393.027 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Hadoop的可视化Deep Web采集平台设计
刘彤
张阳
孙琦
袁翀
《计算机工程与科学》
CSCD
北大核心
2016
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部