-
题名融合物品热门因子的协同过滤改进算法
被引量:15
- 1
-
-
作者
孙红
韩震
-
机构
上海理工大学
上海现代光学系统重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第4期638-643,共6页
-
基金
国家自然科学基金项目(61472256
61170277)资助
+1 种基金
上海市教委科研创新重点项目(12zz137)资助
沪江基金项目(C14002)资助
-
文摘
协同过滤算法是推荐系统中比较古老的算法,原理是根据近邻用户或者相似物品对目标进行推荐,因此相似度计算方法是关键部分.由于互联网的高传播性,物品热门周期变短,影响了用户之间相似性度量,传统的协同过滤算法已经不能达到很好的推荐效果.针对相似度改进,在皮尔逊相似度原理上添加物品热门因子,优化皮尔逊相似度计算,提高推荐效果.采用大数据技术并搭建spark分布式平台.在spark大数据平台上使用Movie Lens电影推荐数据集上验证改进后的算法,采用准确率、召回率和平均绝对误差(MAE)等指标来评价改进算法.实验结果表明改进算法在准确率和召回率上都比传统算法有很大的提高,在平均绝对误差上也有所下降.
-
关键词
协同过滤
皮尔逊相似度
MovieLens数据集
spark平台
热门因子
-
Keywords
collaborative filtering
Pearson similarity
MovieLens datasets
spark platform
popularity factor
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于热门度修正因子和置信度的协同过滤算法
被引量:1
- 2
-
-
作者
刘昊东
王诚
-
机构
南京邮电大学通信与信息工程学院
-
出处
《计算机技术与发展》
2023年第3期127-132,共6页
-
基金
国家自然科学基金(61801240)。
-
文摘
协同过滤算法作为推荐系统的核心算法,其思想是运用用户的历史数据去挖掘用户的兴趣爱好。由于热门项目在传统协同过滤算法的计算过程中会被过分考虑,不能更好地反映用户的真实需求,并且该算法在收集用户评分信息时还存在数据稀疏性的问题,提出了一种结合热门度修正因子和置信度的协同过滤算法。在修正余弦相似度计算公式中引入Jaccard函数来缓解评分矩阵的稀疏性,为了抑制热门项目对实际推荐效果的影响,将热门度修正因子引入到皮尔逊相似度计算公式中,最终相似度计算公式是通过上述改进的公式按照权重进行融合所生成。在公开数据集上验证了引入因子的相似度计算公式以及最终改进相似度计算公式的有效性,从结果中可以清晰地看出其平均绝对误差MAE(Mean Absolute Error)有所降低。
-
关键词
协同过滤算法
数据稀疏
热门度修正因子
余弦相似度
置信度
-
Keywords
collaborative filtering algorithm
data sparsity
popularity correction factor
cosine similarity
confidence
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-