-
题名基于负反馈修正的多轮对话推荐系统
被引量:2
- 1
-
-
作者
朱立玺
黄晓雯
赵梦媛
桑基韬
-
机构
北京交通大学计算机与信息技术学院
交通数据分析与挖掘北京市重点实验室(北京交通大学)
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2023年第5期1086-1102,共17页
-
基金
中央高校基本科研专项资金(2021RC217)
国家自然科学基金(62202041)资助。
-
文摘
传统的推荐系统从交互历史中挖掘用户兴趣,面临着无法动态地获取用户实时偏好和细粒度偏好的问题,近年对话推荐系统领域的兴起为此问题提供了新的解决方案.对话推荐系统优势在于其可以动态地和用户进行交互,并在交互过程中获取用户的实时偏好,从而提高推荐系统准确率,提升用户体验.然而对话推荐系统相关研究工作中缺乏对负反馈的充分利用,难以对用户偏好表示进行细粒度的修正,即难以有效平衡用户长期偏好和实时偏好之间的关系,同时存在属性候选集过大导致交互轮次过多的问题.因此,本文基于经典的对话推荐框架CPR(Conversational Path Reasoning)提出了一种能够有效利用用户负反馈的对话推荐模型NCPR(Negative-feedback-guide Conversational Path Reasoning).不同于现有的对话推荐系统工作,NCPR能够充分利用用户在交互过程中给出的属性粒度和物品粒度的负反馈对用户的偏好表示进行动态的修正.此外,CPR将对话推荐建模为一个图上的路径推理问题,NCPR使用协同过滤算法基于属性粒度的负反馈对属性候选集进行重排序,在利用图结构的自然优势限制属性候选集大小的同时,进一步减少候选属性空间大小.四个基准数据集上的实验结果表明,NCPR在推荐准确率和平均交互轮次两个评价指标上的表现优于先进的基线模型.最后,我们设计并实现了一个网页端的对话推荐系统,与在线用户进行交互产生推荐结果,证明了NCPR在真实的对话推荐场景下的有效性.
-
关键词
对话推荐系统
强化学习
交互负反馈
知识图谱
协同过滤
-
Keywords
conversational recommendation systems
reinforcement learning
interactive negative feedback
knowledge graph
collaborative filtering
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-