结合注意力机制和图神经网络的CTR预估模型

CTR Prediction Model Combining Attention Mechanism and Graph Neural Network

下载PDF

导出

摘要大多数CTR预测的算法都是将特征嵌入初始化为一个固定的维度,忽略了长尾物品特征的流行度不高。把它和头部物品的嵌入向量设置为相同长度会导致模型训练不平衡,影响最后的预测结果。基于此,本文首先使用一个端到端的可微框架,该框架可以根据特征的流行度自动选择不同的嵌入维度。其次,引入挤压激励网络机制和具有残差连接的多头自注意力机制,分别从不同角度动态地学习特征的重要性以及识别重要的特征组合,然后使用图神经网络代替传统内积和哈达玛积显式建模二阶特征交互。最后为了进一步提高性能,将DNN组件与浅层模型相结合形成深度模型,利用贝叶斯优化算法为深度模型选择一组超参数,避免复杂的调参过程,并且在2个基准数据集上实验,结果验证模型的有效性。 Most CTR prediction algorithms initialize the feature embedding as a fixed dimension,ignoring the low popularity of the long tail feature.Setting it to the same length as the head object embedding vector will lead to unbalanced model training and affect the final recommendation results.Based on this,this paper first uses an end-to-end differentiable framework,which can automatically select different embedded dimensions according to the popularity of features.Secondly,this paper introduces squeeze excitation network mechanism and multi-head self-attention mechanism with residual connection to dynamically learn the importance of features and identify important feature combinations from different angles,and then uses graph neural network to explicitly model the second-order feature interaction instead of traditional inner product and Hadamard product.Finally,in order to further improve the performance,this paper combines the DNN component with the shallow model to form the depth model,uses the Bayesian optimization algorithm to select a set of super parameters for the depth model to avoid the complex parameter adjustment process,and the experimental results on two benchmark datasets verify the effectiveness of the model.

作者夏义春李汪根李豆豆葛英奎王志格 XIA Yi-chun;LI Wang-gen;LI Dou-dou;GE Ying-kui;WANG Zhi-ge(School of Computer and Information,Anhui Normal University,Wuhu 241002,China)

机构地区安徽师范大学计算机与信息学院

出处《计算机与现代化》 2023年第3期29-37,共9页 Computer and Modernization

基金高校领军人才引进与培育计划项目(051619)。

关键词点击率预测自动嵌入搜索挤压激励网络多头自注意力机制图神经网络贝叶斯优化 CTR prediction automatic embedded search squeeze excitation network multi-head self-attention mechanism graph neural network Bayesian optimization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1陈彬,张荣梅,张琦.DCFM:基于深度学习的混合推荐模型[J].计算机工程与应用,2021,57(3):150-155. 被引量：10
2王瑞平,贾真,刘畅,陈泽威,李天瑞.基于DeepFM的深度兴趣因子分解机网络[J].计算机科学,2021,48(1):226-232. 被引量：6
3王越,于莲芝.一个以注意力机制结合隐式和显式的特征交叉的CTR预估模型[J].小型微型计算机系统,2021,42(9):1884-1890. 被引量：4
4邓路佳,刘平山.基于GMM-FMs的广告点击率预测研究[J].计算机工程,2019,45(5):122-126. 被引量：9
5冯勇,韩晓龙,顾兆旭,王龙,徐孟阳,刘志国.基于耦合CNN评分预测模型的个性化商品推荐[J].小型微型计算机系统,2020,41(2):393-398. 被引量：8

二级参考文献26

1李全,许新华,刘兴红,林松.融合隐含信任度和项目关联度的矩阵分解推荐算法[J].计算机应用研究,2020,37(2):401-406. 被引量：5
2徐风苓,孟祥武,王立才.基于移动用户上下文相似度的协同过滤推荐算法[J].电子与信息学报,2011,33(11):2785-2789. 被引量：34
3涂丹丹,舒承椿,余海燕.基于联合概率矩阵分解的上下文广告推荐算法[J].软件学报,2013,24(3):454-464. 被引量：50
4纪文迪,王晓玲,周傲英.广告点击率估算技术综述[J].华东师范大学学报（自然科学版）,2013(3):2-14. 被引量：17
5韩冬煦,常宝宝.中文分词模型的领域适应性方法[J].计算机学报,2015,38(2):272-281. 被引量：59
6程芳,沈红岩,赵艳.一种有效缓解数据稀疏问题的协同过滤推荐算法[J].现代情报,2016,36(3):76-79. 被引量：7
7朱志北,李斌,刘学军,胡平.基于LDA的互联网广告点击率预测研究[J].计算机应用研究,2016,33(4):979-982. 被引量：13
8张志强,周永,谢晓芹,潘海为.基于特征学习的广告点击率预估技术研究[J].计算机学报,2016,39(4):780-794. 被引量：20
9吴文明,刘茜萍.基于可信相似用户的服务推荐方法[J].计算机工程,2016,42(11):57-63. 被引量：3
10潘书敏,颜娜,谢瑾奎.基于用户相似度和特征分化的广告点击率预测研究[J].计算机科学,2017,44(2):283-289. 被引量：13

共引文献29

1杨妍婷,韩斌.基于增强型FNN的广告点击率预测模型[J].南京理工大学学报,2020,44(1):33-39. 被引量：4
2李遥,李烨.基于深度残差网络的DeepFM点击率预测模型[J].软件导刊,2020,19(3):74-78. 被引量：2
3廖含月,曾剑平,吴承荣.一种多模型集成的网络论坛流量预测模型[J].计算机工程,2020,46(12):60-66. 被引量：4
4许王昊,肖秦琨.基于注意力机制的兴趣网络点击率预估模型[J].计算机工程,2021,47(1):101-108. 被引量：4
5张换梅,董云云.关于点击率大数据的高阶深度分解机预测仿真[J].计算机仿真,2021,38(3):456-460.
6王帅,孙喜民,高亚斌,孙博.基于神经协同过滤的个性化商品推荐方法[J].信息技术,2021,45(6):143-147. 被引量：3
7蒋兴渝,黄贤英,陈雨晶,徐福.基于特征增强聚合的融合广告点击率预测模型[J].计算机工程,2022,48(1):312-320. 被引量：4
8陈志毅,隋杰.基于DeepFM和卷积神经网络的集成式多模态谣言检测方法[J].计算机科学,2022,49(1):101-107. 被引量：10
9申情,郭文宾,楼俊钢,余强国.考虑多层次潜在特征的个性化推荐模型[J].电信科学,2022,38(2):71-83. 被引量：2
10袁雪梅,程科,浦艺钟,徐子凡.基于注意力机制的深度协同推荐模型[J].软件导刊,2022,21(9):1-6. 被引量：2

1张智慧,杨燕,张熠玲.面向不完整多视图聚类的深度互信息最大化方法[J].智能系统学报,2023,18(1):12-22. 被引量：1
2袁立宁,刘钊.基于One-Shot聚合自编码器的图表示学习[J].计算机应用,2023,43(1):8-14. 被引量：2
3黄文英.分层教学在小学数学教学中的实践探究[J].中文科技期刊数据库（文摘版）教育,2021(3):59-59.
4蒋田凤.试论音乐游戏在小学音乐课堂中的有效应用[J].中国科技期刊数据库科研,2022(5):101-104.
5苏雪峰.结合注意力和双向LSTM的开放域问句分类研究[J].办公自动化,2023,28(3):6-10. 被引量：1
6李静,刘璐,窦兴红.迷糊一家购物记[J].东方娃娃（保育与教育）,2023(3):72-74.
7李张伟.基于深度学习的翻转课堂教学研究——以水处理概论课程为例[J].高教学刊,2023,9(11):108-111. 被引量：1
8刘浩,吕杰.粮食种植户化肥减量的嵌入逻辑:结构嵌入还是关系嵌入?[J].世界农业,2023(4):111-124. 被引量：3
9李东洋,吕明泽,郭艳蓉,郭嘉欣,刘晓彤.ALO优化下1DCNN-BiLSTM-Attention锂电池SOH预测[J].电工技术,2023(4):33-40. 被引量：2
10朱淑雯,罗戈,韦平,李晟,张新鹏,钱振兴.隐蔽图像后门攻击[J].中国图象图形学报,2023,28(3):864-877. 被引量：1

计算机与现代化

2023年第3期

浏览历史

内容加载中请稍等...

结合注意力机制和图神经网络的CTR预估模型

参考文献5

二级参考文献26

共引文献29

相关作者

相关机构

相关主题

浏览历史