基于Spark的Slope One算法优化与实现被引量：1

Optimization and Implementationof Slope OneAlgorithm Based on Spark

下载PDF

导出

摘要传统Slope One算法未考虑用户相似性和项目相似性对评分效果的影响,从而导致推荐准确率不高,并且在当前大数据背景下,传统Slope One算法运行效率低下。针对以上问题,提出一种基于Spark的改进加权Slope One算法,该算法融入了相似性计算、活跃用户筛选和用户聚类等技术,并在Spark平台上实现了并行化。通过在MovieLens数据集上进行试验验证,并比较算法在Spark和Hadoop平台并行化的运行效率,证实了该算法可以有效降低MAE,且在Spark平台下运行效率更高,更适用于大数据处理场景。 The traditional slope one algorithm does not consider low user similarity and item similarity on scoring effect,which leads to low recommendation accuracy,and in the current big data background,it suffers from low efficiency of operation.In order to solve the above problems,an improved weighted Slope One algorithm based on Spark is proposed in this paper.The algorithm integrates similarity computing,active user filtering and user clustering technology,and implements parallelization on Spark platform.Through the experiments on MovieLens data sets,this article confirms that the algorithm can effectively reduce MAE,and compares the running efficiency of the parallel algorithm in Spark and Hadoop platform to confirm this algorithm in Spark platform runs more efficiently,more suitable for big data processing.

作者梁化强唐坚刚 LIANG Hua-qiang;TANG Jian-gang(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

机构地区上海理工大学光电信息与计算机工程学院

出处《软件导刊》 2018年第6期92-94,99,共4页 Software Guide

关键词 SLOPE ONE 聚类用户相似性项目相似度 SPARK Slope One clustering user similarity project similarity Spark

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1刘伟江,王颖.奇异值分解法在预测用户页面兴趣度中的应用[J].数理统计与管理,2012,31(2):325-332. 被引量：3
2蒋宗礼,杜倩.基于聚类和项目相似性的Slope One算法优化[J].计算机与现代化,2016(8):22-26. 被引量：3
3王毅,楼恒越.一种改进的Slope One协同过滤算法[J].计算机科学,2011,38(B10):192-194. 被引量：20
4陆胜伟,唐振民,吕建勇.基于时间因子的Slope One协同过滤推荐算法[J].信息技术,2016,40(10):1-5. 被引量：3
5李剑锋,秦拯.一种基于局部近邻Slope One协同过滤推荐算法[J].计算机工程与科学,2017,39(7):1346-1351. 被引量：10

二级参考文献42

1张莹.从商务网站用户行为数据提取用户兴趣[J].潍坊学院学报,2005,5(4):21-23. 被引量：6
2张新香.Web日志挖掘在电子商务中的应用研究[J].计算机系统应用,2006,15(1):52-55. 被引量：10
3张锋,常会友.使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J].计算机研究与发展,2006,43(4):667-672. 被引量：85
4刘志昆,王卫平.基于精确序列模式的网页个性化推荐[J].计算机系统应用,2006,15(5):32-35. 被引量：2
5张海燕,顾峰,姜丽红.基于模糊簇的个性化推荐方法[J].计算机工程,2006,32(12):65-67. 被引量：7
6周晓兰,王随平.WEB文本挖掘中用户兴趣模型的建立和更新[J].湘潭师范学院学报（自然科学版）,2006,28(3):33-36. 被引量：8
7李珊,袁方.基于Web日志挖掘的页面兴趣度方法的改进[J].计算机时代,2007(3):29-31. 被引量：5
8邢春晓,高凤荣,战思南,周立柱.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-301. 被引量：148
9吕佳.基于兴趣度的Web用户访问模式分析[J].计算机工程与设计,2007,28(10):2403-2404. 被引量：8
10吴颜,沈洁,顾天竺,陈晓红,李慧,张舒.协同过滤推荐系统中数据稀疏问题的解决[J].计算机应用研究,2007,24(6):94-97. 被引量：51

共引文献34

1杜茂康,刘苗,李韶华,浦琴.基于邻近项目的Slope One协同过滤算法[J].重庆邮电大学学报（自然科学版）,2014,26(3):421-426. 被引量：19
2张启宇,宋瑶,陈英义,封文杰.基于改进的双极Slope One算法的农业信息推荐模型研究[J].安徽农业科学,2014,42(29):10394-10396. 被引量：1
3胡旭,鲁汉榕,陈新,周国安.基于项目属性相似和MapReduce并行化的Slope One算法[J].空军预警学院学报,2015,29(1):54-58. 被引量：2
4陈洁,潘郁,张振海,潘芳.基于用户实时行为的Slope One模型与算法[J].运筹与管理,2015,24(1):89-92. 被引量：2
5柴华,刘建毅.一种改进的slope one推荐算法研究[J].信息网络安全,2015(2):77-81. 被引量：10
6贺怀清,李图波,李铁军.资源分配的改进Slope One算法[J].小型微型计算机系统,2015,36(5):1056-1058. 被引量：4
7马腾腾,朱庆华,曹菡,沈超.基于Hadoop的旅游景点推荐的算法实现与应用[J].计算机技术与发展,2016,26(3):47-52. 被引量：5
8刘亚东,何利力,高金标.基于Slope One的移动终端推荐算法研究[J].工业控制计算机,2016,29(2):107-108. 被引量：1
9蒋宗礼,杜倩.基于聚类和项目相似性的Slope One算法优化[J].计算机与现代化,2016(8):22-26. 被引量：3
10雷鸣,朱明.一种改进的基于项目语义的推荐算法[J].微电子学与计算机,2016,33(12):93-97.

同被引文献18

1汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：140
2郁雪,李敏强.一种结合有效降维和K-means聚类的协同过滤推荐模型[J].计算机应用研究,2009,26(10):3718-3720. 被引量：15
3王毅,楼恒越.一种改进的Slope One协同过滤算法[J].计算机科学,2011,38(B10):192-194. 被引量：20
4冯波,郝文宁,陈刚,占栋辉.K-means算法初始聚类中心选择的优化[J].计算机工程与应用,2013,49(14):182-185. 被引量：50
5赵庆.基于Hadoop平台下的Canopy-Kmeans高效算法[J].电子科技,2014,27(2):29-31. 被引量：39
6杜茂康,刘苗,李韶华,浦琴.基于邻近项目的Slope One协同过滤算法[J].重庆邮电大学学报（自然科学版）,2014,26(3):421-426. 被引量：19
7谢娟英,高瑞.方差优化初始中心的K-medoids聚类算法[J].计算机科学与探索,2015,9(8):973-984. 被引量：13
8张玉连,郇思思,梁顺攀.融合用户相似度与项目相似度的加权Slope One算法[J].小型微型计算机系统,2016,37(6):1174-1178. 被引量：9
9赖向阳,宫秀军,韩来明.一种MapReduce架构下基于遗传算法的K-Medoids聚类[J].计算机科学,2017,44(3):23-26. 被引量：18
10王潘潘,钱谦,王锋.改进加权Slope one协同过滤推荐算法研究[J].传感器与微系统,2017,36(7):138-141. 被引量：10

引证文献1

1刘佳耀,王佳斌.Slope One算法的改进及其在大数据平台的实现[J].计算机工程与应用,2020,56(1):83-91. 被引量：5

二级引证文献5

1钟志松,彭清桦,吴广潮.基于图嵌入的用户加权Slope One算法[J].计算机与现代化,2020(8):69-75. 被引量：1
2王玉贤.基于云计算的大数据并行搜索聚类算法研究[J].自动化与仪器仪表,2021(10):33-36. 被引量：2
3王俊宇,邢国栋,李海涛,付革民.结合离线计算与迁移学习的机务大数据闭环整合算法[J].微型电脑应用,2023,39(12):101-104.
4孙浩,周力青.基于IMD与Canopy的非均匀资源推荐算法[J].计算机仿真,2023,40(10):477-481.
5李剑锋,陈海龙,翟军,林岩.完全冷启动下的个性化推荐算法[J].计算机工程与设计,2024,45(8):2329-2335.

1周化,袁志.余弦相似度加权的Slope One协同过滤算法研究[J].计算机科学与应用,2017,7(10):1036-1044. 被引量：1
2何明,要凯升,杨芃,张久伶.基于标签信息特征相似性的协同过滤个性化推荐[J].计算机科学,2018,45(B06):415-422. 被引量：12
3黄源.移动SEO优化与实现[J].信息与电脑,2018,30(13):1-2.
4迟玉良,祝永志.项目相似度与ALS结合的推荐算法研究[J].软件导刊,2018,17(6):81-84. 被引量：4
5赵旭,李峥.IP城域网优化与实现[J].中国新通信,2018,20(10):62-62.
6黄福,侯海燕,胡志刚.五种关联强度指标对研究前沿时间特征的识别[J].情报学报,2018,37(6):561-568. 被引量：2
7王磊,瞿佳明.基于协同过滤和Slope One算法的Web服务可靠性预测[J].计算机工程与科学,2018,40(8):1390-1397. 被引量：2
8李晓光,孙洪庆,周雪妍.面向继续教育学生的图书推荐算法研究[J].哈尔滨学院学报,2018,39(6):113-116. 被引量：1
9关志芳,孟海东.融合用户聚类与项目聚类的加权Slope One算法[J].控制工程,2018,25(7):1297-1302. 被引量：4
10朱敬华,明骞.LBSN中融合信任与不信任关系的兴趣点推荐[J].通信学报,2018,39(7):157-165. 被引量：13

软件导刊

2018年第6期

浏览历史

内容加载中请稍等...

基于Spark的Slope One算法优化与实现被引量：1

参考文献5

二级参考文献42

共引文献34

同被引文献18

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Spark的Slope One算法优化与实现 被引量：1

参考文献5

二级参考文献42

共引文献34

同被引文献18

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于Spark的Slope One算法优化与实现被引量：1