近几年,推荐算法快速增长,但大多数研究都重点关注如何利用机器学习模型更好地拟合历史交互数据。然而,推荐系统中的历史交互数据往往是观察性的,而非实验性数据。观测数据存在多种偏差,其中最典型的是流行度偏差。大多数处理流行度偏...近几年,推荐算法快速增长,但大多数研究都重点关注如何利用机器学习模型更好地拟合历史交互数据。然而,推荐系统中的历史交互数据往往是观察性的,而非实验性数据。观测数据存在多种偏差,其中最典型的是流行度偏差。大多数处理流行度偏差的方法采用去除流行度偏差的策略,但是去偏策略本质上难以提升推荐精准性,这是因为推荐算法所引起的偏差会扩大。因此,同时在训练和推断阶段充分利用流行度偏差的纠偏策略更为可行。文中结合因果图分别从用户和物品两个角度来纠偏,提出了一个双偏去混及调整模型(Double Bias Deconfounding and Adjusting,DBDA)。在训练阶段剥离产生不利影响的流行度偏差,并在推断阶段根据流行度的变化趋势,对用户偏好做出更为精准的预测。在3个大规模公开数据集上进行实验,结果表明,相比目前的最优方法,所提方法在各个评价指标上提升了2.48%~19.70%。展开更多
文摘近几年,推荐算法快速增长,但大多数研究都重点关注如何利用机器学习模型更好地拟合历史交互数据。然而,推荐系统中的历史交互数据往往是观察性的,而非实验性数据。观测数据存在多种偏差,其中最典型的是流行度偏差。大多数处理流行度偏差的方法采用去除流行度偏差的策略,但是去偏策略本质上难以提升推荐精准性,这是因为推荐算法所引起的偏差会扩大。因此,同时在训练和推断阶段充分利用流行度偏差的纠偏策略更为可行。文中结合因果图分别从用户和物品两个角度来纠偏,提出了一个双偏去混及调整模型(Double Bias Deconfounding and Adjusting,DBDA)。在训练阶段剥离产生不利影响的流行度偏差,并在推断阶段根据流行度的变化趋势,对用户偏好做出更为精准的预测。在3个大规模公开数据集上进行实验,结果表明,相比目前的最优方法,所提方法在各个评价指标上提升了2.48%~19.70%。