-
题名基于多粒度特征交叉剪枝的点击率预测模型
- 1
-
-
作者
白婷
刘轩宁
吴斌
张梓滨
徐志远
林康熠
-
机构
北京邮电大学计算机学院(国家示范性软件学院)
微信事业群开放平台基础部
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第5期1290-1298,共9页
-
基金
国家自然科学基金项目(62102038,61972047)
腾讯微信开放平台项目(S2021120)。
-
文摘
在推荐系统中,学习有效的高阶特征交互是提升点击率预测的关键.现有的研究将低阶特征进行组合来学习高阶交叉特征表示,导致模型的时间复杂度随着特征维度的增加呈指数型增长;而基于深度神经网络的高阶特征交叉模型也无法很好地拟合低阶特征交叉,影响预测的准确率.针对这些问题,提出了基于多粒度特征交叉剪枝的点击率预测模型FeatNet.该模型首先在显式的特征粒度上,通过特征剪枝生成有效的特征集合,保持了不同特征组合的多样性,也降低了高阶特征交叉的复杂度;基于剪枝后的特征集合,在特征元素粒度上进一步进行隐式高阶特征交叉,通过滤波器自动过滤无效的特征交叉.在2个真实的数据集上进行了大量的实验,FeatNet都取得了最优的点击率预测效果.
-
关键词
点击率预测
高阶特征交叉
多粒度
特征剪枝
特征降噪
-
Keywords
CTR prediction
high-order feature interaction
multi-granularity
feature pruning
feature denoising
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-