期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于HoFiBiAFM的点击率预测模型
1
作者 马万民 王杉文 +2 位作者 陈建林 牛浩青 欧鸥 《计算机应用与软件》 北大核心 2024年第10期170-176,241,共8页
在推荐系统中,FiBiNET、AFM等深度学习模型能够关注特征的重要性进行点击率预测。其中FiBiNET的深层模型使用DNN网络相当隐式地对特征交互进行建模,但是使用DNN学习高阶特征可能导致低阶特征交叉被稀释。通过叠加多层SENET注意力机制的... 在推荐系统中,FiBiNET、AFM等深度学习模型能够关注特征的重要性进行点击率预测。其中FiBiNET的深层模型使用DNN网络相当隐式地对特征交互进行建模,但是使用DNN学习高阶特征可能导致低阶特征交叉被稀释。通过叠加多层SENET注意力机制的方式学习高阶重要性特征,并加入高阶注意力分解机共同更新特征表示,构成一种新的点击率预测模型HoFiBiAFM。通过在Movielens-100K和Movielens-1M数据集上分别与其他CTR预测模型进行分类任务和回归任务的对比实验,结果验证了HoFiBiAFM模型的点击率预测效果。 展开更多
关键词 推荐系统 点击率预测 特征重要性 SENET注意力机制 高阶注意力分解机
下载PDF
Predictive Model of Live Shopping Interest Degree Based on Eye Movement Characteristics and Deep Factorization Machine 被引量:1
2
作者 SHI Xiujin LI Hao +2 位作者 SHI Hang WANG Shaoyu SUN Guohao 《Journal of Donghua University(English Edition)》 CAS 2022年第4期353-360,共8页
In the live broadcast process,eye movement characteristics can reflect people’s attention to the product.However,the existing interest degree predictive model research does not consider the eye movement characteristi... In the live broadcast process,eye movement characteristics can reflect people’s attention to the product.However,the existing interest degree predictive model research does not consider the eye movement characteristics.In order to obtain the users’interest in the product more effectively,we will consider the key eye movement indicators.We first collect eye movement characteristics based on the self-developed data processing algorithm fast discriminative model prediction for tracking(FDIMP),and then we add data dimensions to the original data set through information filling.In addition,we apply the deep factorization machine(DeepFM)architecture to simultaneously learn the combination of low-level and high-level features.In order to effectively learn important features and emphasize relatively important features,the multi-head attention mechanism is applied in the interest model.The experimental results on the public data set Criteo show that,compared with the original DeepFM algorithm,the area under curve(AUC)value was improved by up to 9.32%. 展开更多
关键词 eye movement interest degree predictive deep factorization machine(DeepFM) multi-head attention mechanism
下载PDF
融合图注意力网络和注意力因子分解机的服务推荐方法 被引量:1
3
作者 黄德玲 童夏龙 杨皓栋 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期357-366,共10页
为了解决服务推荐过程中的特征稀疏问题、提高服务的语义表示能力,进而提升推荐的准确性和有效性,提出基于图注意力网络(graph attention networks,GAT)研究服务推荐方法,引入服务的组合权重和组合的结构信息,综合利用多种服务特征,提... 为了解决服务推荐过程中的特征稀疏问题、提高服务的语义表示能力,进而提升推荐的准确性和有效性,提出基于图注意力网络(graph attention networks,GAT)研究服务推荐方法,引入服务的组合权重和组合的结构信息,综合利用多种服务特征,提高服务推荐质量。将GAT和注意力因子分解机(attention factorization machine,AFM)结合在一起,利用多头自注意力机制,学习每个节点在图邻域中的重要性;进行信息聚合,处理网络中的不同图结构,以适应服务动态变化的场景。实验结果显示,在数据平衡的情况下,提出的方法性能表现均好于对比方法;在数据不平衡的情况下,提出的方法大部分性能指标也表现良好,达到了提升服务推荐准确性和有效性的目标。 展开更多
关键词 服务推荐 图注意力网络 注意力因子分解机 应用程序接口
下载PDF
面向点击率预测的自注意力深度域嵌入因子分解机
4
作者 李广丽 叶艺源 +3 位作者 许广鑫 张红斌 吴光庭 吕敬钦 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第5期287-296,共10页
点击率(CTR)预测通过预测用户对广告或商品的点击概率,实现数字广告精准推荐。针对现有CTR模型存在原始嵌入向量未精化、特征交互方式偏简单的问题,本文提出自注意力深度域嵌入因子分解机(self-attention deep field-embedded factoriza... 点击率(CTR)预测通过预测用户对广告或商品的点击概率,实现数字广告精准推荐。针对现有CTR模型存在原始嵌入向量未精化、特征交互方式偏简单的问题,本文提出自注意力深度域嵌入因子分解机(self-attention deep field-embedded factorization machine,Self-AtDFEFM)模型。首先,通过多头自注意力对原始嵌入向量加权,精化出关键低层特征;其次,构建深度域嵌入因子分解机(FEFM)模块,设计域对对称矩阵以提升不同特征域之间的交互强度,为高阶特征交互优选出低阶特征组合;再次,基于低阶特征组合构建深度神经网络(DNN),完成隐式高阶特征交互;然后,围绕精化后的嵌入向量,联合多头自注意力与残差机制堆叠多个显式高阶特征交互层,通过自注意力捕获同一特征在不同子空间上的互补信息,完成显示高阶特征交互;最后,联合显式与隐式高阶特征交互实现点击率预测。在Criteo和Avazu两大公开数据集上,将Self-AtDFEFM模型与主流基线模型在AUC和LogLoss指标上进行对比实验;为Self-AtDFEFM模型调制显式高阶特征交互层层数、注意力头数量、嵌入层维度及隐式高阶特征交互层层数等参数;对Self-AtDFEFM模型进行消融实验。实验结果表明:在两大数据集上,Self-AtDFEFM模型的AUC、LogLoss均优于主流基线模型;Self-AtDFEFM模型的全部参数已调为最佳;各模块形成合力以促使Self-AtDFEFM模型性能达到最优,其中显示高阶特征交互层的作用最大。Self-AtDFEFM模型各模块即插即用,易于构建和部署,且在性能与复杂度之间取得平衡,具备较高实用性。 展开更多
关键词 点击率预测 多头自注意力 特征交互 域嵌入因子分解机 深度神经网络
下载PDF
基于机器学习的注意力缺陷多动障碍风险预测研究
5
作者 赵健翔 吴振起 +3 位作者 王雪峰 王子 褚亚奇 游毅 《中国中西医结合儿科学》 2024年第2期130-136,共7页
目的探讨基于机器学习算法对儿童注意力缺陷多动障碍(ADHD)预测的可行性。方法回顾性分析我院于2022年11月至2023年8月儿科门诊就诊患者358例,其中ADHD患儿119例,非ADHD患儿239例,以人口学基本信息、儿童个人生活情况、母亲孕期情况、... 目的探讨基于机器学习算法对儿童注意力缺陷多动障碍(ADHD)预测的可行性。方法回顾性分析我院于2022年11月至2023年8月儿科门诊就诊患者358例,其中ADHD患儿119例,非ADHD患儿239例,以人口学基本信息、儿童个人生活情况、母亲孕期情况、家庭生活情况及遗传因素等31个变量作为危险因素,采用单因素分析筛选出具有明显差异的变量,然后分别建立决策树模型、随机森林模型、自适应提升算法及K近邻算法模型,采用受试者工作特征(ROC)曲线的面积(AUC)、特异度、准确性、F1分数及ROC曲线等进行模型预测效能评估。结果4种机器学习算法建立的ADHD的预测模型以随机森林算法最优,其AUC为0.955,特异度、准确性、F1分值分别为0.903、0.898、0.853;同时,根据随机森林模型筛选出的前五位特征变量为:教育方式、情绪稳定情况、每日看电子产品时长、学习困难情况、近期反复呼吸道感染。结论初步构建出基于机器学习算法建立儿童ADHD的预测模型,该模型对ADHD有良好的预测能力。 展开更多
关键词 注意力缺陷多动障碍 危险因素 机器学习 预测模型 儿童
下载PDF
基于因子分解机和图神经网络的推荐方法
6
作者 陈诚 陈珊珊 《软件》 2024年第6期46-49,共4页
本文提出了一种融合因子分解机和图神经网络的推荐模型。通过递归地传播图中节点邻居的特征交叉并使用交叉特征关系域获取注意力权重。实验结果表明,图结构中节点的特征交叉能够提升推荐性能与可解释性,对后续研究具有借鉴意义。
关键词 推荐系统 图神经网络 因子分解机 知识图谱 注意力机制
下载PDF
基于积注意力交互网络模型的点击率预测
7
作者 张安勤 王迎香 田秀霞 《计算机应用与软件》 北大核心 2024年第3期63-69,80,共8页
如何提高广告点击率是对大数据网络营销的一个具有挑战的问题。考虑到用户点击行为的不确定性,提出一种基于积注意力交互网络模型的点击率预测模型。将用户的行为向量进行内积或外积,并根据广告自身的特征赋予交互后向量相应权重,然后... 如何提高广告点击率是对大数据网络营销的一个具有挑战的问题。考虑到用户点击行为的不确定性,提出一种基于积注意力交互网络模型的点击率预测模型。将用户的行为向量进行内积或外积,并根据广告自身的特征赋予交互后向量相应权重,然后进行点击率预测。在两个数据集上进行实验验证,结果表明该模型相对于传统的点击率预测模型在归一化基尼系数上提高了2%以上,预测效果更好。 展开更多
关键词 点击率 注意力机制 因子分解机 内积 外积
下载PDF
基于DNN与注意力机制的推荐算法模型
8
作者 周超 丛鑫 +1 位作者 訾玲玲 肖谷平 《计算机与现代化》 2024年第6期1-7,114,共8页
为解决因子分解机在提取高阶组合特征的缺陷问题,更好地学习到更多有用的特征信息,尝试用因子分解机提取交叉特征,并结合注意力网络、深度神经网络和多头自注意力机制等方法,从低、高阶组合特征中学习关键特征信息,最后根据不同阶的组... 为解决因子分解机在提取高阶组合特征的缺陷问题,更好地学习到更多有用的特征信息,尝试用因子分解机提取交叉特征,并结合注意力网络、深度神经网络和多头自注意力机制等方法,从低、高阶组合特征中学习关键特征信息,最后根据不同阶的组合特征的重要性加权融合得到结果,以预估广告点击率。实验主要基于广告数据集Criteo展开,并在MovieLens数据集上进行类比实验,验证所提出算法模型的有效性,实验结果显示,本文提出的算法模型相较于基准模型,在2个数据集上的AUC指标提升分别有2.32个百分点和0.4个百分点。 展开更多
关键词 因子分解机 神经网络 注意力网络 特征提取
下载PDF
融入注意力网络的深度分解机推荐算法 被引量:1
9
作者 邬彤 于莲芝 《电子科技》 2023年第1期38-43,50,共7页
推荐系统能够在海量的信息中找到满足用户个性化需求的信息。随着深度学习的发展,深度学习也开始广泛被推荐系统所应用。CTR预估在推荐系统中起着重要作用,已被应用在个性化推荐、信息检索、在线广告等多个领域。针对推荐系统数据量大... 推荐系统能够在海量的信息中找到满足用户个性化需求的信息。随着深度学习的发展,深度学习也开始广泛被推荐系统所应用。CTR预估在推荐系统中起着重要作用,已被应用在个性化推荐、信息检索、在线广告等多个领域。针对推荐系统数据量大且稀疏的问题,文中将注意力网络和xDeepFM模型融合,提出了一种新的基于深度学习的CTR预估模型,即Atte-xDeepFM模型。该模型能够解决特征稀疏问题,有效学习特征之间的交互关系,且不需要手动提取特征工程中的有用信息。在Avazu数据集和Criteo数据集上进行的对比实验证明了文中提出的模型的有效性。与推荐系统CTR预估常用的算法模型对比,文中所提出的模型具有更好的推荐效果。 展开更多
关键词 推荐系统 深度学习 个性化推荐 计算广告 CTR预估 因子分解机 注意力网络 特征稀疏
下载PDF
多注意力机制融合低高阶特征的神经推荐算法 被引量:3
10
作者 崔少国 独潇 杨泽田 《计算机工程与应用》 CSCD 北大核心 2023年第8期192-199,共8页
针对因子分解机仅提取低阶组合特征的局限性,提出了一种基于多注意力机制融合低阶和高阶组合特征的深度神经推荐算法(deep neural recommendation method,DeepNRM)。分别运用因子分解机和多层前馈神经网络从稀疏及稠密特征中提取低阶和... 针对因子分解机仅提取低阶组合特征的局限性,提出了一种基于多注意力机制融合低阶和高阶组合特征的深度神经推荐算法(deep neural recommendation method,DeepNRM)。分别运用因子分解机和多层前馈神经网络从稀疏及稠密特征中提取低阶和高阶组合特征;采用注意力网络和多头自注意力机制从低阶和高阶组合特征中自动选取关键特征;将低、高阶组合特征根据重要性进行融合共同进行推荐。算法模型在MovieLens和Criteo公共数据集上进行了实验验证,消融和对比实验结果表明,提出的算法模型与基准模型相比在AUC指标上分别有1.964个百分点和0.773个百分点的提升。 展开更多
关键词 因子分解机 推荐系统 深度神经网络 多头自注意力机制 特征抽取
下载PDF
融合图神经网络与注意力机制的XdeepFM改进算法
11
作者 王英桥 武志峰 《天津职业技术师范大学学报》 2023年第3期42-48,共7页
针对XdeepFM模型将嵌入特征直接送入特征交互网络后使网络获取到大量冗余特征,同时模型二阶特征交叉能力不足的问题,采用图神经网络和注意力机制优化了模型的特征提取能力,并添加因子分解机算法提高了模型的二阶交叉能力,提出了GA-Xdeep... 针对XdeepFM模型将嵌入特征直接送入特征交互网络后使网络获取到大量冗余特征,同时模型二阶特征交叉能力不足的问题,采用图神经网络和注意力机制优化了模型的特征提取能力,并添加因子分解机算法提高了模型的二阶交叉能力,提出了GA-XdeepFM-FM新模型,并在公开数据集Criteo和Avazu上进行实验。实验结果表明:相比较XdeepFM算法以及经典算法,模型的AUC和Logloss皆有显著提高,证明了新模型在特征提取、特征交叉和预测广告点击率方面的有效性,为相关应用提供了更为有效的解决方案。 展开更多
关键词 点击率预估 图神经网络 因子分解机 注意力机制
下载PDF
基于自注意力机制的TransNet推荐模型
12
作者 马宏爽 刘其成 牟春晓 《烟台大学学报(自然科学与工程版)》 CAS 2023年第3期320-328,共9页
在神经网络的推荐模型基础上引入自注意力机制,提出一种改进的基于自注意力机制TransNet推荐模型SATransNet。SATransNet模型使用卷积神经网络提取评论特征,通过自注意力神经网络自动学习特征内部的依赖关系,由依赖关系来决定需要关注... 在神经网络的推荐模型基础上引入自注意力机制,提出一种改进的基于自注意力机制TransNet推荐模型SATransNet。SATransNet模型使用卷积神经网络提取评论特征,通过自注意力神经网络自动学习特征内部的依赖关系,由依赖关系来决定需要关注的特征,从而解决数据表达能力不足的缺陷。本文在不同数据集上进行了实验比较与分析,SATransNet推荐模型在不同数据集上的预测评分较好,均方误差总体呈优。与基于注意力机制的推荐模型相比,SATransNet推荐模型的归一化折损累计增益均有提升,具有较好的预测评分效果和推荐相关性。 展开更多
关键词 推荐模型 自注意力机制 因子分解机 神经网络 评论文本
下载PDF
基于交互注意力的可解释性推荐方法 被引量:1
13
作者 冯兴杰 崔桂颖 《计算机应用与软件》 北大核心 2022年第10期292-298,328,共8页
目前基于评论的推荐算法大多采用静态独立的方法提取用户和物品评论的潜在特征表示,将用户的偏好表示为静态特征向量,而用户在与不同的物品交互时通常表现出不同的偏好。因此,提出一种基于交互注意力的可解释性推荐方法,利用交互注意力... 目前基于评论的推荐算法大多采用静态独立的方法提取用户和物品评论的潜在特征表示,将用户的偏好表示为静态特征向量,而用户在与不同的物品交互时通常表现出不同的偏好。因此,提出一种基于交互注意力的可解释性推荐方法,利用交互注意力来研究用户评论和物品评论之间的相关性。另外,受LSTM中门控制的启发,模型还增加门控层来自适应地合并两边网络提取出的特征向量,利用注意力因子分解机进一步对高阶特征交互进行建模,实现评分预测。通过注意力权重衡量评论信息,提高预测评分的可解释性。实验结果表明,推荐结果准确性进一步提高,验证了该方法的有效性。 展开更多
关键词 推荐系统 深度学习 交互注意力 注意力因子分解机
下载PDF
基于注意力机制与评论文本深度模型的推荐方法 被引量:16
14
作者 黄文明 卫万成 +1 位作者 张健 邓珍荣 《计算机工程》 CAS CSCD 北大核心 2019年第9期176-182,共7页
传统推荐系统依赖人工进行规则设计和特征提取,对评论文本内容的特征和隐信息的提取能力有限。针对该问题,融合注意力机制并基于深度学习对推荐系统进行改进,提出一种对评论文本深度建模的推荐方法。使用词嵌入模型表达数据集评论中的语... 传统推荐系统依赖人工进行规则设计和特征提取,对评论文本内容的特征和隐信息的提取能力有限。针对该问题,融合注意力机制并基于深度学习对推荐系统进行改进,提出一种对评论文本深度建模的推荐方法。使用词嵌入模型表达数据集评论中的语义,引入注意力机制对输入内容进行重新赋权,通过并行的卷积神经网络挖掘用户和项目评论数据中的隐含特征,将两组特征耦合输入并采用因子分解机进行评分预测,得到推荐结果。实验结果表明,该方法可有效提高推荐准确率,均方误差较DeepCoNN方法提升2 %以上。 展开更多
关键词 推荐系统 特征提取 注意力机制 卷积神经网络 因子分解机
下载PDF
融合内容特征和时序信息的深度注意力视频流行度预测模型 被引量:7
15
作者 武维 李泽平 +2 位作者 杨华蔚 林川 王忠德 《计算机应用》 CSCD 北大核心 2021年第7期1878-1884,共7页
针对视频流行度动态变化过程中的时序信息难以捕捉的问题,提出一种融合内容特征和时序信息的深度注意力视频流行度预测模型(DAFCT)。首先,根据用户的反馈信息,构建基于注意力机制的长短期记忆网络(Attention-LSTM)模型来捕捉流行趋势并... 针对视频流行度动态变化过程中的时序信息难以捕捉的问题,提出一种融合内容特征和时序信息的深度注意力视频流行度预测模型(DAFCT)。首先,根据用户的反馈信息,构建基于注意力机制的长短期记忆网络(Attention-LSTM)模型来捕捉流行趋势并挖掘时序信息;然后,采用神经网络因子分解机(NFM)处理多模态的内容特征,并采用嵌入技术对稀疏的高维特征进行降维处理,从而降低模型的计算复杂性;最后,采用concatenate方法融合时序信息和内容特征,并设计了一种深度注意力视频流行度预测(DAVPP)算法来求解DAFCT。实验结果表明,与Attention-LSTM模型和NFM模型相比,DAFCT的召回率分别提高了10.82和3.31个百分点,F1分数分别提高了9.80和3.07个百分点。 展开更多
关键词 流行度预测 内容特征 时序信息 注意力机制 神经网络因子分解机
下载PDF
城市旅游餐饮体验的注意力机制模型建构——基于机器学习的网络文本深度挖掘 被引量:8
16
作者 张旭辉 张郴 +2 位作者 李雅南 徐梓榆 黄震方 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第1期32-39,共8页
良好的旅游餐饮体验对提升城市旅游竞争力的意义不可小觑.旅游餐饮文本记录了游客对旅游目的地餐饮店的产品和服务的真实体验,文本内容海量且受时空约束较小,颇具一定的分析价值.本文将Attention机制(注意力机制)融合机器学习方法中的... 良好的旅游餐饮体验对提升城市旅游竞争力的意义不可小觑.旅游餐饮文本记录了游客对旅游目的地餐饮店的产品和服务的真实体验,文本内容海量且受时空约束较小,颇具一定的分析价值.本文将Attention机制(注意力机制)融合机器学习方法中的卷积神经网络模型,旨在对餐饮文本背后的深层语义关联进行深度挖掘,探寻影响游客积极餐饮体验的激励因素和消极餐饮体验的保健因素及其影响机制,这适用于旅游餐饮文本自身特质.通过注意力机制模型建构,发现影响游客对南京餐饮体验评价的保健因素由价格、区位交通和服务组成,而激励因素则由口味、名气和文化环境组成.另外,本文对注意力权重排序,优先解决权重较高因素,提升游客餐饮体验. 展开更多
关键词 旅游餐饮体验 注意力机制 机器学习 双因素理论 网络文本
下载PDF
融合注意力胶囊的深度因子分解机模型 被引量:1
17
作者 顾亦然 姚朱鹏 杨海根 《通信学报》 EI CSCD 北大核心 2021年第10期130-139,共10页
针对深度学习中推荐模型特征组合单一、消解大量有价值特征信息以及过拟合等问题,设计了一种新型的注意力得分机制——注意力胶囊,提出了一种融合注意力胶囊的深度因子分解机模型。基于DeepFM模型,将用户历史点击行为与候选物品进行权... 针对深度学习中推荐模型特征组合单一、消解大量有价值特征信息以及过拟合等问题,设计了一种新型的注意力得分机制——注意力胶囊,提出了一种融合注意力胶囊的深度因子分解机模型。基于DeepFM模型,将用户历史点击行为与候选物品进行权重计算,降低了无关特征对模型的影响,充分挖掘了不同历史行为对用户兴趣的差异性影响。训练过程中加入自适应正则化式,在不影响训练速度的前提下,有效地减少了过拟合。在2个公开数据集上进行对比实验,实验结果表明,所提模型相对于其他模型在损失函数和GAUC上均有明显提升。 展开更多
关键词 推荐模型 深度学习 注意力胶囊 因子分解机 自适应正则化
下载PDF
一个以注意力机制结合隐式和显式的特征交叉的CTR预估模型 被引量:4
18
作者 王越 于莲芝 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1884-1890,共7页
随着深度学习的发展,近年来CTR预估模型的研究往往基于深度学习使用不同的特征交叉方式来实现CTR预估模型的性能提升.目前最新最有效的研究成果是xDeepFM,它综合了进行隐式和显式的高阶特征交叉方式的子模型.但经实验发现xDeepFM的子模... 随着深度学习的发展,近年来CTR预估模型的研究往往基于深度学习使用不同的特征交叉方式来实现CTR预估模型的性能提升.目前最新最有效的研究成果是xDeepFM,它综合了进行隐式和显式的高阶特征交叉方式的子模型.但经实验发现xDeepFM的子模型选择并不完美,而且子模型的组合策略过于简单.对此,本文提出了一种新模型,不仅改进了子模型的选择,而且用注意力机制改进子模型组合方式.为了方便,在本文中将提出的新模型叫做Attentional-xDeepFM-C.在Avazu和Criteo数据集上进行实验,新模型在两组数据集下的AUC得分分别比xDeepFM模型高2.17%和4.97%.本文已在公开网站#上发布了Attentional-xDeepFM-C模型的源代码. 展开更多
关键词 因子分解机 CTR预估 推荐系统 注意力机制 深度神经网络
下载PDF
增强型高阶注意力因子分解机点击率预测模型 被引量:1
19
作者 陈育康 龙慧云 +1 位作者 吴云 林建 《计算机工程与应用》 CSCD 北大核心 2022年第24期158-165,共8页
特征交互的建模对于推荐系统中预测用户的点击率至关重要。设计了增强型高阶注意力因子分解机模型EHAFM(enhanced high-order attentive factorization machine),其主要由Embedding层、显式特征交互层、输出层构成。在每个显式特征交互... 特征交互的建模对于推荐系统中预测用户的点击率至关重要。设计了增强型高阶注意力因子分解机模型EHAFM(enhanced high-order attentive factorization machine),其主要由Embedding层、显式特征交互层、输出层构成。在每个显式特征交互层中,通过聚合其他特征的表示来更新特征的表示,并针对无用特征交互对预测产生干扰的问题,提出了增强型元素级注意力机制,利用投影矩阵拓展特征表示空间,以增强注意力矩阵的学习能力。通过融合多个增强型元素级注意力头的信息,以解决模型泛化能力不足问题。通过堆叠显式特征交互层可以将特征表示更新到任意高阶,将高阶特征交互部分与一阶线性部分结合进行点击率预测。EHAFM模型在Criteo、Movielens-1M两个数据集上进行实验,结果表明相较基准模型在两个数据集上分别有0.21%和0.92%的AUC提升。 展开更多
关键词 深度学习 显式特征交互 高阶因子分解机 注意力机制
下载PDF
推荐系统中稀疏情景预测的特征-类别交互因子分解机 被引量:3
20
作者 黄若然 崔莉 韩传奇 《计算机研究与发展》 EI CSCD 北大核心 2022年第7期1553-1568,共16页
随着Web信息的不断增长与发展,对用户稀疏行为的预测已成为目前推荐系统的研究热点.近年来,因子分解机(factorization machine, FM)的提出在一定程度上缓解了稀疏场景下预测精度不准确的问题.它的主要思想是通过2阶特征交互来获取特征... 随着Web信息的不断增长与发展,对用户稀疏行为的预测已成为目前推荐系统的研究热点.近年来,因子分解机(factorization machine, FM)的提出在一定程度上缓解了稀疏场景下预测精度不准确的问题.它的主要思想是通过2阶特征交互来获取特征间丰富的语义关系.随后,感知交互因子分解机(interaction-aware factorization machines, IFM)在FM的特征交互基础上引入类别交互的概念来扩展潜在的交互特性,通过把特征和类别分别进行交互后再融合来得到更准确的预测结果.在IFM的基础上,提出了一种特征-类别交互因子分解机(FIFM)模型.FIFM不仅保留了特征交互和类别交互机制,还设计了一种新的特征-类别交互机制(FIM)来进一步挖掘交互信息中的有效信息,并利用融合交互感知来预测不同稀疏场景下的用户行为模式.此外,还基于深度学习提出了一种实现FIFM的神经网络模型GFIM.相比于FIFM,GFIM的参数量和时间复杂度更高,但同时也能捕获更多高阶的非线性特征交互信息,能适合算力较高的应用场景.在4个真实数据集上的实验结果表明,FIFM和GFIM在RMSE指标上超越了当前最好的方法IFM.实验工作探究了多类稀疏场景下的预测结果,记录了时间和空间复杂度的消耗情况,并进行了分析讨论. 展开更多
关键词 因子分解机 特征-类别交互 注意力网络 深度神经网络 稀疏情景预测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部