-
题名基于Nutch爬虫的电商交易价格统计研究
被引量:3
- 1
-
-
作者
阳黎明
苏理云
-
机构
重庆理工大学理学院
-
出处
《重庆理工大学学报(自然科学)》
CAS
2017年第1期152-157,共6页
-
基金
重庆市教委资助项目(15SKG136)
重庆理工大学研究生创新基金资助项目(YCX2015228)
+1 种基金
重庆理工大学高等教育教学改革研究项目(2014ZD03)
全国统计科学研究资助项目(2014LY069)
-
文摘
将电商交易数据纳入价格指数架构是目前统计工作关注的焦点。应用大数据技术,将Nutch爬虫搭建在分布式集群上,构建分布式网络数据抓取系统,同时结合最新的AP聚类算法对数据进行预处理,然后对网上数据进行价格指数建模,进行价格指数试算。试算结果表明:基于分布式集群下的Nutch网络爬虫技术较好地完成了网络交易数据抓取任务。因此,计算的网上交易数据价格指数可较好地反映市场价格变化趋势。
-
关键词
电商交易数据
分布式集群
NUTCH
价格指数
-
Keywords
electric business transaction data
distributed cluster
Nutch
price index
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
O21
[理学—概率论与数理统计]
-
-
题名电商数据的爬取及价格模型的建立
- 2
-
-
作者
尤天琪
冯思毓
周陈雯淑
潘润超
-
机构
南京师范大学
-
出处
《信息与电脑》
2019年第17期138-140,143,共4页
-
文摘
随着电商交易量和用户数的不断增加,一方面在电商营销过程中商家调价的频率和幅度都有所增加;另一方面面对众多选择消费者难以对自己所需的商品有准确的价格估计,也无从判断现在是否处于价格高地。笔者用网络爬虫程序获取了知名大型电子商务平台以电脑为例的多个时刻的商品数据,提取有效信息字段并进行量化,最终通过多元线性回归建立了商品价格模型,并对模型的进一步应用进行了展望。
-
关键词
电商交易数据
网络爬虫
数据处理
多元线性回归
价格模型
-
Keywords
E-commerce transaction data
web crawler
data processing
multiple linear regression
price model
-
分类号
F224
[经济管理—国民经济]
F724.6
[经济管理—产业经济]
-