期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Hadoop的可视化Deep Web采集平台设计 被引量:4
1
作者 刘彤 张阳 +1 位作者 孙琦 袁翀 《计算机工程与科学》 CSCD 北大核心 2016年第2期217-223,共7页
随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Had... 随着信息技术的发展,互联网信息资源变得越来越丰富,大数据技术的发展使得我们能够从互联网复杂的信息数据中获得相应的知识。这其中最基本的技术就是大数据采集技术,它使我们能够将互联网数据快速采集下来并结构化存储。设计的基于Hadoop的可视化Deep Web采集平台是一种简单易操作的高效深度采集平台,运用Webkit技术作为核心引擎实现可视化配置和深度采集功能,同时通过优化采集算法,调整Hadoop任务分配策略提升效率。实验结果表明,设计的数据采集平台获得了较好的效果。 展开更多
关键词 数据采集 HADOOP 可视化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部