基于深度置信网络的广告点击率预估的优化被引量：5

Click-through Rate Prediction Based on Deep Belief Nets and Its Optimization

下载PDF

导出

摘要随着互联网广告的飞速发展,如何预测目标用户对互联网广告的点击率(click-through rate,简称CTR),成为精确广告推荐投放的关键技术,并成为计算广告领域的研究热点和深度神经网络的应用热点.为了提高广告点击率预估的精确度,提出了基于深度置信网络的广告点击率预估模型,并通过基于Kaggle数据挖掘平台数据集的1000万条随机数据的实验,研究不同的隐藏层层数和隐含节点数目对预测结果的影响.为了解决深度置信网络在数据规模较大的工业界解决方案中的训练效率问题,通过实验证明:广告点击率预估中,深度置信网络的损失函数存在大量的驻点,并且这些驻点对网络训练效率有极大的影响.为了提高模型效率,从发掘网络损失函数特性入手,进一步提出了基于随机梯度下降算法和改进型粒子群算法的融合算法,以优化网络训练.融合算法在迭代步长小于阈值时可以跳出驻点平面,继续正常迭代.实验结果表明,与传统的基于梯度提升决策树和逻辑回归的广告点击率预估模型以及模糊深度神经网络模型相比,基于深度置信网络的预估模型具有更好的预估精度,在均方误差、曲线下面积和对数损失函数指标上分别提升2.39%,9.70%,2.46%和1.24%,7.61%,1.30%;使用融合方法训练深度置信网络,训练效率提高30%~70%. With the rapid development of Internet advertising,how to predict the target user's click-through rate of Internet advertisement has become a key technology for accurate advertising and has become a hot topic in the field of computational advertising and the application of deep neural networks.To improve the accuracy of CTR(click-through rate)prediction,this work proposed a prediction model based on deep belief nets and studied the influence of the number of hidden layers and the number of units in each layer on prediction results by taking experiments on the 10 million samples in the dataset provided by Kaggle Data Mining platform.In order to solve the problem of training efficiency of deep belief nets in large-scale industrial solutions,this study took wide experiments to prove that there are a lot of stagnation points in the loss function of deep belief nets and it has great negative effect on the training process.To improve the efficiency of training,starting from the characteristics of network loss function,this study further proposed a network optimization fusion model based on stochastic gradient descent algorithm and improved particle swarm optimization algorithm.The fusion algorithm can jump out of the stagnation ground and continue the normal training process.The experiment results show that compared with the traditional prediction model based on gradient boost regression tree and logistic regression,and the deep learning model based on fuzzy deep neural network,the proposed training model has better accuracy in prediction and performs 2.39%,9.70%,2.46%and 1.24%,7.61%,1.30%better in mean squared error,area under curves,and LogLoss.The fusion method will improve the training efficiency of deep belief nets at the level of 30%~70%.

作者陈杰浩张钦王树良史继筠赵子芊 CHEN Jie-Hao;ZHANG Qin;WANG Shu-Liang;SHI Ji-Yun;ZHAO Zi-Qian(School of Computer Science and Technology,Beijing Institute of Technology,Beijing 100081,China)

机构地区北京理工大学计算机学院

出处《软件学报》 EI CSCD 北大核心 2019年第12期3665-3682,共18页 Journal of Software

关键词广告点击率预估深度置信网络驻点粒子群算法融合算法 click-through rate prediction deep belief net stagnation point particle swarm algorithm fusion algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1朴海国,王志新,张华强.基于合作粒子群算法的PID神经网络非线性控制系统[J].控制理论与应用,2009,26(12):1317-1324. 被引量：34
2金海和,陈剑,唐政,郑国旗.基于Hopfield网络的极小值问题学习算法[J].清华大学学报（自然科学版）,2002,42(6):731-734. 被引量：8
3周傲英,周敏奇,宫学庆.计算广告:以数据为核心的Web综合应用[J].计算机学报,2011,34(10):1805-1819. 被引量：59

二级参考文献116

1FARDADI M, SELK GHAFARI A, HANNANI S K. PID neural network control of SUT building energy management system[C]//Proceedings of the 2005 IEEE/ASME International Conference on Advanced Intelligent Mechatronics. New York: IEEE Press, 2005:682 - 686.
2SHU H L, SHU H. Simulation study of PID neural network temperature control system in plastic injecting-moulding machine[C]//Proceedings of the 6th International Conference on Machine Learning and Cybernetics. New York: IEEE Press, 2007:492 - 497.
3KENNEDY J, EBERHART R C. Particle swarm optimization[C] //Proceedings of lEEE International Conference on Neural Networks. New York: IEEE Press, 1995:1942 - 1948.
4LI M, YANG C W. A modified PSO learning algorithm for PID neural network[C] //Proceedings of the 25th Chinese Control Conference. Beijing: Beijing University of Areonautics and Astronautics Press, 2006:1123 - 1125.
5CHEN J Y, ZHENG Q. Particle swarm optimization with Local Search[C]//Proceedings of International Conference on Neural Networks and Brain. New York: IEEE Press, 2005:481 - 484.
6SHI Y, KENNEDY R C. A modified particle swarm optimizer[C] //Proceedings of the IEEE Congress on Evolutionary Computation. New York: IEEE Press, 1998: 69- 73.
7ZHAO L, YANG Y E PSO-based single mulfiplicative neuron model for time series prediction[J]. Expert Systems with Applications, 2009, 36(2): 2805 - 2812.
8ZOU J, FU X. A particle swarm optimization approach of PID parameters in hydraulic servo control systemiC]//Proceeding of the 6th Worm Congress on Intelligent Control and Automation. New York: IEEE Press, 2006:7725 - 7729.
9[6]Lawler E L, Lenstra J K, Rinnooy A H G, et al. The Travelling Salesman Problem [M]. Chichester: Wiley, 1985.
10[7]Hopfield J J. Neurons with graded response have collective computational properties like those of two-state neurons [J]. Proc of Natl Acad of Sci USA, 1984, 81: 3088-3092.

共引文献98

1魏意隆.计算广告——构建双向互动的“用户画像”[J].新媒体研究,2020(10):77-79.
2尚燕敏,张鹏,曹亚男.基于社会正则的行为定向[J].计算机研究与发展,2013,50(S2):234-243.
3茆剑.基于遗传算法的供应链分销网络模型及其求解[J].价值工程,2006,25(2):27-29. 被引量：1
4高海昌,冯博琴,朱利b.智能优化算法求解TSP问题[J].控制与决策,2006,21(3):241-247. 被引量：120
5刘劲涛,刘铁男,周忠波,邵克勇（审稿）.求解非线性规划的Hopfield网络方法[J].大庆石油学院学报,2006,30(2):90-92. 被引量：1
6陈乔礼,吴怀宇,赵新.一种求解旅行商问题的贪婪边重组交叉算子[J].计算机工程与应用,2006,42(31):19-22. 被引量：1
7王国强,王志新.粒子群与PIDNN控制器在VSC-HVDC中的应用[J].中国电机工程学报,2011,31(3):8-13. 被引量：11
8李文,罗恩韬.改进的PSO算法在摊铺机行驶控制器中的应用[J].电子测量与仪器学报,2011,25(4):372-376. 被引量：7
9任子晖,王坚,高岳林.马尔科夫链的粒子群优化算法全局收敛性分析[J].控制理论与应用,2011,28(4):462-466. 被引量：29
10刘建昌,于霞,李鸿儒.一类离散时变系统的在线无限脉冲响应滤波逆控制[J].控制理论与应用,2011,28(8):1056-1062.

同被引文献25

1周傲英,周敏奇,宫学庆.计算广告:以数据为核心的Web综合应用[J].计算机学报,2011,34(10):1805-1819. 被引量：59
2伊雯雯.基于多维特征组合逻辑回归模型的广告点击率预测[J].通信技术,2016,49(9):1221-1228. 被引量：4
3田嫦丽,张珣,潘博,杨超,许彦茹.互联网广告点击率预估模型中特征提取方法的研究与实现[J].计算机应用研究,2017,34(2):334-338. 被引量：14
4王子豪,徐桂琼.基于高阶偏差的因子分解机推荐算法[J].计算机应用研究,2017,34(2):339-342. 被引量：5
5余永红,高阳,王皓,孙栓柱.融合用户社会地位和矩阵分解的推荐算法[J].计算机研究与发展,2018,55(1):113-124. 被引量：32
6潘博,张青川,于重重,谢小兰.FM集成模型在广告点击率预估中的应用[J].计算机应用与软件,2018,35(1):107-111. 被引量：5
7王斐玉,文华,王红梅.语义挖掘结合神经网络的电商网页推荐方案[J].控制工程,2018,25(1):149-153. 被引量：6
8肖鹏,潘燕桃,张久珍.中国大陆大学生学术阅读载体偏好与行为研究:基于全球调查数据的比较研究[J].中国图书馆学报,2018,44(1):62-75. 被引量：30
9匡俊,唐卫红,陈雷慧,陈辉,曾炜,董启民,高明.基于特征工程的视频点击率预测算法[J].华东师范大学学报（自然科学版）,2018(3):77-87. 被引量：10
10张泽林,韦斐琼,韩冀东,陈蔚妮.空气质量对消费者互联网搜索行为的影响[J].管理科学,2018,31(5):16-29. 被引量：5

引证文献5

1王喜宾,王玉标,杨剑锋.基于数据挖掘的网络情景化信息动态推荐系统[J].计算机仿真,2020,37(11):344-347. 被引量：7
2张换梅,董云云.关于点击率大数据的高阶深度分解机预测仿真[J].计算机仿真,2021,38(3):456-460.
3周菲,徐洪珍.基于改进Transformer的广告点击率预估模型[J].计算机应用研究,2021,38(8):2386-2389. 被引量：4
4李兴兵,谢珺,续欣莹,李小飞,赵旭栋.基于改进FM算法和注意力机制的深度点击率预估模型[J].南京理工大学学报,2021,45(4):429-438. 被引量：5
5章磊敏,董建锋,包翠竹,纪守领,王勋.面向视频冷启动问题的点击率预估[J].软件学报,2022,33(12):4838-4850. 被引量：2

二级引证文献17

1王杉文,欧鸥,张伟劲,欧阳飞.基于FG_DRFwFm模型的深度推荐[J].计算机应用研究,2021,38(10):3030-3034.
2张耀,王丹丹,梁志远,崔晓萌.智能运维平台协同过滤信息推荐系统设计[J].电子设计工程,2022,30(3):49-53. 被引量：4
3胡婷,许伟.基于数据挖掘的烟草行业网络安全动态监测[J].长江信息通信,2022,35(1):157-159. 被引量：1
4孙伟智,欧鸥,杜雪垒,罗凯耀.多层结合的多阶显式交互的融合推荐模型[J].计算机应用研究,2022,39(5):1349-1356. 被引量：1
5刘雪梅,胡博,吴慧玲.基于改进神经网络的高校就业信息推荐系统[J].信息与电脑,2022,34(9):80-82.
6黎丹冰,丁阳,陈怡华,吕雪松,黎丹雨.改进的矩阵分解与BP神经网络在电影推荐中的研究[J].现代计算机,2022,28(18):30-35.
7孙红,鹿梅珂.融合用户行为序列预测的混合推荐算法[J].电子科技,2023,36(4):84-89. 被引量：1
8王凯,沈艳.基于历史行为与高低阶特征的点击率预估模型[J].软件导刊,2023,22(5):7-13. 被引量：1
9罗凯耀,孙伟智,唐云.融合注意力机制的广告点击率预测模型[J].微型电脑应用,2023,39(5):36-38.
10尹蓉.云计算下的远距离无线混合传输数据弱关联挖掘算法[J].常州工学院学报,2023,36(3):20-24.

1夏云云.对在ICU接受机械通气的患者进行集束化护理的效果评价[J].当代医药论丛,2019,17(19):246-248.
2刘思彤.急性阑尾炎术后护理要点分析[J].医药前沿,2019,9(30):148-148.
3文艳霞.用户凭什么忠于你[J].企业家信息,2019,0(11):66-68.
4闫鑫.新媒体环境下VR的技术与应用分析[J].数字技术与应用,2019,37(9):225-225.
5梁乃兴,俞靖洋,于伟,李媛.基于实测数据的沥青路面温度场年变化回归分析[J].重庆交通大学学报（自然科学版）,2019,38(11):63-68. 被引量：11
6韩少功.当一只萤火虫也很好[J].学生天地（初中版）,2019,0(11):1-1.
7王彩霞,刘义艳.基于VMD和DBN的结构健康状态趋势预测[J].工业仪表与自动化装置,2019,0(6):24-29. 被引量：1
8姜涛,胡春磊,薛文晞,刘牧媛.新媒体背景下媒体传播效果评估指标体系及方法论[J].电视研究,2019,0(9):8-10. 被引量：8
9唐洪,曾辉,邓锋.Python课程的教学改革与研究[J].数码世界,2019,0(12):149-149.
10赵加成.销售预测及分析在企业物流管理中的作用研究[J].区域治理,2018,0(1):160-160.

软件学报

2019年第12期

浏览历史

内容加载中请稍等...

基于深度置信网络的广告点击率预估的优化被引量：5

参考文献3

二级参考文献116

共引文献98

同被引文献25

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于深度置信网络的广告点击率预估的优化 被引量：5

参考文献3

二级参考文献116

共引文献98

同被引文献25

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于深度置信网络的广告点击率预估的优化被引量：5