-
题名结合注意力机制和图神经网络的CTR预估模型
- 1
-
-
作者
夏义春
李汪根
李豆豆
葛英奎
王志格
-
机构
安徽师范大学计算机与信息学院
-
出处
《计算机与现代化》
2023年第3期29-37,共9页
-
基金
高校领军人才引进与培育计划项目(051619)。
-
文摘
大多数CTR预测的算法都是将特征嵌入初始化为一个固定的维度,忽略了长尾物品特征的流行度不高。把它和头部物品的嵌入向量设置为相同长度会导致模型训练不平衡,影响最后的预测结果。基于此,本文首先使用一个端到端的可微框架,该框架可以根据特征的流行度自动选择不同的嵌入维度。其次,引入挤压激励网络机制和具有残差连接的多头自注意力机制,分别从不同角度动态地学习特征的重要性以及识别重要的特征组合,然后使用图神经网络代替传统内积和哈达玛积显式建模二阶特征交互。最后为了进一步提高性能,将DNN组件与浅层模型相结合形成深度模型,利用贝叶斯优化算法为深度模型选择一组超参数,避免复杂的调参过程,并且在2个基准数据集上实验,结果验证模型的有效性。
-
关键词
点击率预测
自动嵌入搜索
挤压激励网络
多头自注意力机制
图神经网络
贝叶斯优化
-
Keywords
CTR prediction
automatic embedded search
squeeze excitation network
multi-head self-attention mechanism
graph neural network
Bayesian optimization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-