-
题名基于逆向技术的深层网络爬虫与数据分析
被引量:2
- 1
-
-
作者
邢羽琪
杨柽
-
机构
云南民族大学数学与计算机科学学院
-
出处
《软件工程》
2023年第12期41-45,共5页
-
文摘
大数据时代,各行各业对数据采集的需求日益增多,其中使用JavaScript加密技术进行数据采集的需求广泛,但也存在不少瓶颈。文章采用JavaScript逆向爬虫技术还原参数加密过程,动态构造出某购物网站商品评价的统一资源定位系统(Uniform Resource Locator,URL),实现了指定分类下多商品评价数据的动态采集,为同类加密数据的采集提供了新的思路。使用SnowNLP[基于Python的中文自然语言处理(NLP)库]对采集到的乐高评论数据进行情感分析发现,约66%的购买者对商品给出了积极评论;情感分布呈极性,高段集中在0.8~1.0,低段集中在0.0~0.2;词云分析显示出购买者群体比较注重商品的快递包装外观。以上结论可为在线商家提升经营管理水平提供参考。
-
关键词
深层网络爬虫
JavaScript加密
逆向技术
AJAX
数据挖掘
-
Keywords
deep web crawler
JavaScript encryption
reverse technology
Ajax
data mining
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名网络爬虫技术研究
被引量:2
- 2
-
-
作者
王超群
-
机构
江汉大学数学与计算机科学学院
-
出处
《移动信息》
2016年第6期181-182,共2页
-
文摘
在互联网高速发展的今天,各类信息数据呈爆炸式增长,如何在信息繁杂的“大海”中快速并且准确的得到我们所需要的数据,成为了一大难题,并且在互联网加的时代,大数据云计算纷纷崛起,如何获取大量的数据基础,也成为了一大难题,而网络爬虫是解决这些问题最重要的技术,研究将论述网络爬虫的分类、原理以及其应用。
-
关键词
网络爬虫
高效性
深层网络爬虫
信息检索
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-