火车浏览器在抓取网页数据中的研究思考

下载PDF

导出

摘要互联网作为第四次工业革命的基石,已经深入到社会各行各业发展中。近几年“互联网+”概念的提出,加速了社会数字化、网络化、智能化转型升级的历史进程。大数据获取和大数据分析就是强有力的支撑之一。数据挖掘获取是数据分析的基础,在每天都会产生庞大的数据海洋中,准确获取所需要的数据信息,需要性能稳定的抓取工具和逻辑功能完善的抓取流程。数据分为结构化数据和非结构化数据,目前常用的火车浏览器是获取非结构化数据的工具之一,是将互联网上的网页信息,放到指定的位置,如数据库或下载到本地,形成一个互联网的镜像备份。本文重点讨论的是非结构化数据,如文本数据、图片数据在火车浏览器使用中的研究和优化的逻辑流程。

作者贾英姿

机构地区西安银河电信技术有限责任公司

出处《移动信息》 2019年第5期45-47,共3页 MOBILE INFORMATION

关键词互联网火车浏览器数据获取

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1李治杭.小学数学教学生活化的现状及解决策略[J].新教育时代电子杂志（学生版）,2019(26):64-64.
2苏彪.公共空间LED大屏交互技术的发展趋势[J].科技创新导报,2019,16(12):97-98.
3殷壮壮.信息化条件下车辆装备维修保障的相关研究思考[J].中国新通信,2019,0(14):182-183.
4刘金广.关于我国城市违停拖车相关问题的研究思考[J].道路交通管理,2019,0(7):34-35. 被引量：1
5任维红.幼儿园音乐活动游戏化的实践与思考探索[J].中华少年,2019,0(26):116-116.
6祝永志,荆静.基于Python语言的中文分词技术的研究[J].通信技术,2019,52(7):1612-1619. 被引量：56
7余惊雷,吴瑕瑜.从信贷审计角度谈如何做到“精准定责”[J].农业发展与金融,2019,0(8):76-78. 被引量：1
8向洋,董林鹭,宋弘.Scrapy框架下反反爬虫和数据有序性的实现[J].宜宾学院学报,2019,0(6):42-46. 被引量：1
9唐伟,翟国锋,谷红娟.大数据背景下的多来源数据融合研究[J].统计与管理,2019,0(5):18-25. 被引量：5
10刘金广,戴帅,毛志坚.大城市社会公众举报道路交通违法行为研究[J].综合运输,2019,0(8):18-22. 被引量：6

移动信息

2019年第5期

浏览历史

内容加载中请稍等...

火车浏览器在抓取网页数据中的研究思考

相关作者

相关机构

相关主题

浏览历史