近年来,推荐系统逐渐成为电子商务、在线流媒体、新闻资讯等各大互联网平台不可缺少的关键技术。以协同过滤技术为代表的推荐系统主要研究用户-项目评分数据,但此类方法常常面临新加入用户与用户交互次数少而导致的冷启动问题和数据稀...近年来,推荐系统逐渐成为电子商务、在线流媒体、新闻资讯等各大互联网平台不可缺少的关键技术。以协同过滤技术为代表的推荐系统主要研究用户-项目评分数据,但此类方法常常面临新加入用户与用户交互次数少而导致的冷启动问题和数据稀疏问题。为解决上述问题,研究人员将用户和项目的上下文信息引入到协同过滤推荐系统中,丰富用户与项目表示。随着文本挖掘技术的发展,有研究发现用户对项目的评论文本不仅能够体现项目在不同方面的语义特征,也可以弥补用户-项目评分矩阵不能全面地反映用户语义偏好的局限,故可以将其应用到推荐系统中缓解数据稀疏性和冷启动问题。由于文本数据和用户-项目评分数据在用户偏好表示上存在差异,目前大多数模型在用户表示学习方面没有进行深层次的多次融合,为此,该文提出一种基于双头自编码器的评论感知推荐模型(Review Topic-aware Recommendation Model with Two-headed Autoencoder,TAAE)。该模型通过隐狄利克雷主题模型与BERT模型提取出用户评论的主题信息与语义信息,采用注意力机制与门控机制相结合的方式进行多模态特征对齐与融合,再利用多项式降噪自编码器进行用户评分预测。此外,为了缓解自编码器推荐模型中常见的流行度偏差问题,TAAE构建了一个负采样解码器,对推荐结果进一步优化。最后,在6组公开Amazon数据集上测试了TAAE模型的推荐性能,并对模型可能存在的变体及各解码器结构进行消融实验,实验结果表明,TAAE模型优于其他7个对比模型。展开更多
文摘近年来,推荐系统逐渐成为电子商务、在线流媒体、新闻资讯等各大互联网平台不可缺少的关键技术。以协同过滤技术为代表的推荐系统主要研究用户-项目评分数据,但此类方法常常面临新加入用户与用户交互次数少而导致的冷启动问题和数据稀疏问题。为解决上述问题,研究人员将用户和项目的上下文信息引入到协同过滤推荐系统中,丰富用户与项目表示。随着文本挖掘技术的发展,有研究发现用户对项目的评论文本不仅能够体现项目在不同方面的语义特征,也可以弥补用户-项目评分矩阵不能全面地反映用户语义偏好的局限,故可以将其应用到推荐系统中缓解数据稀疏性和冷启动问题。由于文本数据和用户-项目评分数据在用户偏好表示上存在差异,目前大多数模型在用户表示学习方面没有进行深层次的多次融合,为此,该文提出一种基于双头自编码器的评论感知推荐模型(Review Topic-aware Recommendation Model with Two-headed Autoencoder,TAAE)。该模型通过隐狄利克雷主题模型与BERT模型提取出用户评论的主题信息与语义信息,采用注意力机制与门控机制相结合的方式进行多模态特征对齐与融合,再利用多项式降噪自编码器进行用户评分预测。此外,为了缓解自编码器推荐模型中常见的流行度偏差问题,TAAE构建了一个负采样解码器,对推荐结果进一步优化。最后,在6组公开Amazon数据集上测试了TAAE模型的推荐性能,并对模型可能存在的变体及各解码器结构进行消融实验,实验结果表明,TAAE模型优于其他7个对比模型。