期刊文献+

火车浏览器在抓取网页数据中的研究思考

下载PDF
导出
摘要 互联网作为第四次工业革命的基石,已经深入到社会各行各业发展中。近几年“互联网+”概念的提出,加速了社会数字化、网络化、智能化转型升级的历史进程。大数据获取和大数据分析就是强有力的支撑之一。数据挖掘获取是数据分析的基础,在每天都会产生庞大的数据海洋中,准确获取所需要的数据信息,需要性能稳定的抓取工具和逻辑功能完善的抓取流程。数据分为结构化数据和非结构化数据,目前常用的火车浏览器是获取非结构化数据的工具之一,是将互联网上的网页信息,放到指定的位置,如数据库或下载到本地,形成一个互联网的镜像备份。本文重点讨论的是非结构化数据,如文本数据、图片数据在火车浏览器使用中的研究和优化的逻辑流程。
作者 贾英姿
出处 《移动信息》 2019年第5期45-47,共3页 MOBILE INFORMATION
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部