基于集成学习算法的消费行为预测被引量：4

Consumer Behavior Prediction Based on Ensemble Learning Algorithm

下载PDF

导出

摘要消费行为预测在营销活动中具有重要的价值,其预测效果主要取决于特征工程与算法建模。通过特征提取与新特征发现,提出定长与变长滑动窗口相结合的特征提取方法和基于先验知识与矩阵分解的特征交叉方法。特征提取方法考虑样本不平衡和用户消费习惯,提取更多的样本数据并给特征加上时间属性,而特征交叉方法考虑商品与用户之间隐含的关联关系,提取有关联的新特征。对于单一模型预测效果较差的问题,采用stacking策略构建集成学习模型,以XGBoost、随机森林和梯度提升决策树作为初级学习器对特征进行变换,以逻辑回归作为元学习器对用户消费行为进行预测。实验结果表明,该特征工程方法在多个模型算法中均能明显提高精准率,该集成学习模型预测效果要比单个模型更好。 The prediction of consumption behavior is of great value in marketing activities, and its prediction effect mainly depends on feature engineering and algorithm modeling. Through feature extraction and new feature discovery, the feature extraction method combining fixed length and variable length sliding window and feature intersection method based on prior knowledge and matrix decomposition are proposed. Feature extraction method takes sample imbalance and consumer habits into account, extracts more sample data and adds time attribute to features. Feature intersection method takes the implicit relationship between goods and users into account to extract new features with relevance. For the first mock exam, the stacking model is used to build the ensemble learning model. The XGBoost, random forest and gradient decision tree are used as primary learning devices to transform the features, and logistic regression is used as a meta learning device to predict user consumption behavior. The experimental results show that the feature engineering method can improve the accuracy of the algorithm in many models, and the prediction effect of the integrated learning model is better than that of a single model.

作者贾志强李涛乐金祥 JIA Zhi-qiang;LI Tao;YUE Jin-xiang(School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China)

机构地区武汉科技大学计算机科学与技术学院

出处《计算机技术与发展》 2022年第5期141-146,共6页 Computer Technology and Development

基金国家自然科学基金资助项目(61702383) 湖北省教育厅重大项目(17ZD014)。

关键词行为预测特征工程算法建模 stacking策略集成学习 behavior prediction feature engineering algorithm modeling stacking strategy ensemble learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1李毅彩.医药电商冲击下我国零售连锁药店的竞争力提升策略[J].中国药房,2016,27(10):1438-1440. 被引量：9
2何喜军,马珊,武玉英,蒋国瑞.小样本下多维指标融合的电商产品销量预测[J].计算机工程与应用,2019,55(15):177-184. 被引量：16
3夏正新.一种基于滑动窗口技术的邮件特征选择方法[J].南京邮电大学学报（自然科学版）,2017,37(6):103-110. 被引量：3
4李旭阳,牛鑫,胡军星,袁俊锋,孟晗.基于集成学习的智能电网主机恶意软件检测方法[J].重庆大学学报,2021,44(3):144-150. 被引量：6
5游文霞,申坤,杨楠,李清清,吴永华,李文武.基于Bagging异质集成学习的窃电检测[J].电力系统自动化,2021,45(2):105-113. 被引量：37
6曹杰,邵笑笑.基于信息增益和Bagging集成学习算法的个人信用评估模型研究[J].数学的实践与认识,2016,46(8):90-98. 被引量：9
7邝萌,李英娜,李川,曹敏.基于多模型融合Stacking集成学习的异常用电检测方法研究[J].电力科学与工程,2021,37(3):23-29. 被引量：3
8封化民,李明伟,侯晓莲,徐治理.基于SMOTE和GBDT的网络入侵检测方法研究[J].计算机应用研究,2017,34(12):3745-3748. 被引量：40

二级参考文献74

1王纯麟,何建敏,钱苏丽.基于组合分类器的个人信用评估模型[J].现代管理科学,2006(11):13-14. 被引量：2
2戴小河.2015年中国医药行业四大领域孕育投资机会[EB/OL](.2014-12-22)[2015-08-30].http://www.stcn.com/2014/1222/11922170.shtml.
3马飞.零售集中度升级换档加速[N].医药经济报,2015-03-30(A05).
4张博.传统药店或临关闭潮[N].中国医药报,2015-01-20(008).
5赵宇飞.医药电商蓬勃兴起,发展壮大还需迈过几道坎[EB/OL].(2014-12-28)[2015-12-20].http://news.xinhuanet.com/2014-12/28/c_1113802477.html.
6中国医药物资协会.2014年中国医药互联网发展报告[EB/OL].(2015-02-04)[2015-12-10].http://news.pharmnet.com.cn/news/2015/02/04/414179.html.
7Fancia.传统药店迎来关店潮[EB/OL].(2015-01-06)[2015-10-30].http://www.ydzz.com/news.php?col=67&file=52714.39.
8张博.药房关张大潮汹涌,药企开始剥离线下渠道[N].中国企业报,2015-01-06(14).
9张敏.医药电商且行且观望,五大拦路虎还未解决[N].证券日报,2015-01-12(B04).
10李从选.连锁营销:新年新方向[N].医药经济报,2015-02-16(005).

共引文献115

1刘佳丽,段永辉,郭一斌,王翔.基于bagging-GWO-LightGBM模型的城市房地产风险测度与预警研究[J].商丘师范学院学报,2023,39(12):9-15.
2都珂珂,黄全生,张玥.我国个人信用评估模型综述[J].经营与管理,2021(1):166-172. 被引量：4
3贺远珍,樊重俊,熊红林.基于代价敏感的AdaBoost双层分类社会救助预测模型[J].计算机与数字工程,2023,51(1):156-162.
4王召义,刘玉林,薛晨杰,黄义兵.电商平台信息对商家营销决策优化研究——基于天猫平台数据的检验[J].价格理论与实践,2022(7):134-137. 被引量：3
5王毅,黄建北.适时适地造林育苗提高苗木成活率[J].林业月报,2000(4):24-24.
6陆剑锋,金红军.激光发生器中的数据分类数学模型设计[J].激光杂志,2018,39(12):125-129.
7杨正理,陈海霞,王长鹏,徐智.大数据背景下城市短时交通流预测[J].公路交通科技,2019,36(2):136-143. 被引量：17
8汤龙.基于Bagging算法霉烟叶自动识别系统开发[J].西安文理学院学报（自然科学版）,2018,21(1):40-44.
9闫瑞姣,尹四清.选择性神经网络集成的微博用户信用评估模型[J].计算机工程与设计,2018,39(5):1478-1483. 被引量：6
10何欢欢,林淑芳,刘佐仁.零售连锁药店承接社区卫生服务中心药房职能影响因素研究——基于零售连锁药店药师视角[J].中国药房,2018,29(9):1166-1170. 被引量：7

同被引文献33

1刘宝,车礼东,黄红花,郭兵,宋振乾,李红霞,范晓明,董瑞.基于自然语言处理(NLP)技术建立化学品危险评估知识图谱的研究[J].计算机与应用化学,2018,35(7):605-610. 被引量：6
2宋美琦,陈烨,张瑞.用户画像研究述评[J].情报科学,2019,37(4):171-177. 被引量：127
3史佳琪,张建华.基于多模型融合Stacking集成学习方式的负荷预测方法[J].中国电机工程学报,2019,39(14):4032-4041. 被引量：160
4姚双.双离合自动变速器结构原理及控制方式浅谈[J].汽车实用技术,2019,0(21):214-216. 被引量：3
5王辉,李昌刚.Stacking集成学习方法在销售预测中的应用[J].计算机应用与软件,2020,37(8):85-90. 被引量：10
6梁子超,李智炜,赖铿,林卓琛,李铁钢,张晋昕.10折交叉验证用于预测模型泛化能力评价及其R软件实现[J].中国医院统计,2020,27(4):289-292. 被引量：37
7巨星海,周刚,王婧,张凤娟.用户画像构建技术研究[J].信息工程大学学报,2020,21(2):242-250. 被引量：4
8汪倩,徐勇,张心蕊,李晓宇.用户画像研究进展综述[J].现代计算机,2020,26(24):60-63. 被引量：11
9安璐,胡俊阳,李纲.突发事件情境下社交媒体高影响力用户画像研究[J].情报资料工作,2020,41(6):6-16. 被引量：27
10周林兴,林腾虹.用户画像视域下智能化档案信息服务:现状、价值、运行逻辑与优化路径[J].档案学研究,2021(1):126-133. 被引量：21

引证文献4

1孙一文,罗戎蕾.基于Stacking集成学习的服装网络直播销量预测[J].染整技术,2023,45(4):1-5. 被引量：1
2杨雨晨,李涛,谢君臣,常远.融合领域知识的药店用户画像建模及应用[J].计算机系统应用,2023,32(6):99-106.
3李想,王鑫,蔡辰,赵宗琴,冉若愚,杨德,皮家甜.基于可解释极端随机树模型的DCT液压响应预测[J].汽车工程学报,2023,13(6):889-898.
4梁靖涵.汽车用户画像分析及多模型预测分类研究[J].郑州铁路职业技术学院学报,2024,36(2):37-40.

二级引证文献1

1韩铂,李沛.基于机器学习算法的服装直播销量预测模型[J].丝绸,2024,61(7):109-117.

1李保安,张雨祺,李培峦.基于贝叶斯优化的SVM-Xgboost移动支付风险预警模型[J].河南科技大学学报（自然科学版）,2022,43(5):50-56. 被引量：3
2胡兆宏,黄丽,丁天浩.基于人因疲劳的果农套袋设计与Jack仿真研究[J].农村科学实验,2022(10):227-230.
3齐梦楚.基于IE的RC鞋厂生产线效率改善[J].中国科技信息,2022(11):124-126.
4姜浩琛,王世成,李波,郝淋淋,孙辞,崔杰华,李国琛,徐志祥.基于碳、氮同位素和矿物元素的青萝卜产地判别[J].食品与发酵工业,2022,48(10):234-239. 被引量：9
5蔡念,李炜博,黄钦豪,周帅,邱宝军,何兆泉.基于扇区邻域特征工程的玻璃封装绝缘端子缺陷检测[J].电子与信息学报,2022,44(5):1548-1553. 被引量：1
6赵广军.金陵大学“新史派”与章开沅史学接受之初步[J].华中师范大学学报（人文社会科学版）,2022,61(3):24-37.

计算机技术与发展

2022年第5期

浏览历史

内容加载中请稍等...

基于集成学习算法的消费行为预测被引量：4

参考文献8

二级参考文献74

共引文献115

同被引文献33

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于集成学习算法的消费行为预测 被引量：4

参考文献8

二级参考文献74

共引文献115

同被引文献33

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于集成学习算法的消费行为预测被引量：4