Spark平台下电影推荐系统的设计被引量：3

DESIGN OF MOVIE RECOMMENDATION SYSTEM BASED ON SPARK PLATFORM

下载PDF

导出

摘要传统基于Hadoop或单机下基于Mahout构建的电影推荐系统面对数据量不断增大以及推荐算法模型需要大量迭代的情况时,会出现推荐效果差、运行速度明显下降、无法实时为用户进行个性化推荐的情况。针对以上问题,以电影评分数据集为背景,使用Hadoop、Spark、Kafka、Hive等大数据处理技术进行系统架构搭建,并采用改进后的余弦相似性的协同过滤和基于用户喜爱物品的物品协同过滤算法对MLlib协同过滤算法模型进行改进,对离线数据以及实时数据进行计算,产生TOP-N推荐结果,实现Spark平台下电影推荐系统。实验结果表明,在Spark平台下,该系统相较传统方法不仅数据处理速度和推荐准确性显著提升,而且稳定性更强。 When the traditional movie recommendation system based on Hadoop or single machine based on Mahout is faced with the increasing amount of data and the need for a large number of iterations of the recommendation algorithm model,it will lead to the situation that the recommendation effect is poor,the running speed is obviously reduced,and it is unable to make personalized recommendation for users in real time.Aiming at the above problems,based on the movie scoring data set,the system architecture is built by using Hadoop,Spark,Kafka,Hive and other big data processing technologies.The improved cosine similarity collaborative filtering algorithm and the item collaborative filtering algorithm based on user s favorite items were used to improve the MLlib collaborative filtering algorithm model.The offline data and real-time data were computed to generate the TOP-N recommendation results,and the movie recommendation system based on Spark platform was realized.The experimental results show that,compared with the traditional methods,this system improves the data processing speed and recommendation accuracy,and has stronger stability on the Spark platform.

作者李光明房靖力 Li Guangming;Fang Jingli(School of Electronic Information and Artificial Intelligence,Shaanxi University of Science and Technology,Xi’an 710021,Shaanxi,China)

机构地区陕西科技大学电子信息与人工智能学院

出处《计算机应用与软件》北大核心 2020年第11期28-34,共7页 Computer Applications and Software

关键词 SPARK HADOOP MLlib 协同过滤电影推荐系统 Spark Hadoop MLlib Collaborative filtering Movie recommendation system

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1许智宏,蒋新宇,董永峰,赵嘉伟.一种基于Spark的改进协同过滤算法研究[J].计算机应用与软件,2017,34(5):247-254. 被引量：8
2赵桂升,潘善亮.基于IRGAN模型和Hadoop的电影推荐系统的设计[J].计算机应用与软件,2019,36(5):43-50. 被引量：7

二级参考文献9

1吴湖,王永吉,王哲,王秀利,杜栓柱.两阶段联合聚类协同过滤算法[J].软件学报,2010,21(5):1042-1054. 被引量：83
2朱锐,王怀民,冯大为.基于偏好推荐的可信服务选择[J].软件学报,2011,22(5):852-864. 被引量：69
3朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012,41(2):163-175. 被引量：251
4赵琴琴,鲁凯,王斌.SPCF：一种基于内存的传播式协同过滤推荐算法[J].计算机学报,2013,36(3):671-676. 被引量：49
5郭磊,马军,陈竹敏,姜浩然.一种结合推荐对象间关联关系的社会化推荐算法[J].计算机学报,2014,37(1):219-228. 被引量：73
6马瑞敏,卞艺杰,陈超,吴慧.基于Hadoop的电子商务个性化推荐算法——以电影推荐为例[J].计算机系统应用,2015,24(5):111-117. 被引量：12
7何洁月,马贝.利用社交关系的实值条件受限玻尔兹曼机协同过滤推荐算法[J].计算机学报,2016,39(1):183-195. 被引量：40
8汤伟.基于Web挖掘的个性化视频推荐系统设计与实现[J].电子设计工程,2018,26(18):102-106. 被引量：9
9缪雪峰,陈群辉,胡罗凯,刘进.Spark平台下基于上下文信息的影片混合推荐[J].计算机工程与应用,2017,53(10):79-84. 被引量：4

共引文献13

1宋泊东,张立臣,江其洲.基于Spark的分布式大数据分析算法研究[J].计算机应用与软件,2019,36(1):39-44. 被引量：21
2周显春,邓雨,吴世雄,杨宇鑫,王晗.基于改进协同过滤算法的个性化美食推荐APP开发[J].软件导刊,2019,18(2):88-90. 被引量：4
3顾军华,谢志坚,武君艳,许馨匀,张素琪.基于图游走的并行协同过滤推荐算法[J].智能系统学报,2019,14(4):743-751. 被引量：4
4王辉,潘俊辉,王浩畅,张强.基于Hadoop的数据挖掘实践平台研究与应用[J].赤峰学院学报（自然科学版）,2020,36(2):51-53. 被引量：2
5邹红旭,潘冠华,李吟.基于Spark框架的改进协同过滤算法[J].计算机技术与发展,2020,30(5):38-42. 被引量：1
6冯辉,陈磊,孙妍姑.基于Hadoop的电影用户行为预测系统设计[J].淮南师范学院学报,2020,22(2):142-148. 被引量：1
7葛苏慧,万泉,白成杰.基于交替最小二乘法的Spark个性化影片推荐系统[J].南京理工大学学报,2020,44(5):583-589. 被引量：6
8蒲晔芬.基于动态关联计算的图书馆个性推荐系统研究[J].电子测量技术,2020,43(18):39-42. 被引量：2
9黄冬平,周夏冰,刘冠峰.基于Spark的并行信任进化算法[J].计算机应用与软件,2021,38(3):243-248.
10褚宏林.协同过滤推荐算法研究分析[J].福建电脑,2021,37(6):51-54. 被引量：5

同被引文献19

1叶小榕,邵晴.基于Spark的大规模社交网络社区发现原型系统[J].科技导报,2018,36(23):93-101. 被引量：8
2吴毅涛,张兴明,王兴茂,李晗.基于用户模糊相似度的协同过滤算法[J].通信学报,2016,37(1):198-206. 被引量：31
3王嵘冰,徐红艳,冯勇,郭浩.融合似然比相似度的协同过滤推荐算法研究[J].小型微型计算机系统,2018,39(7):1478-1481. 被引量：7
4冯晨娇,梁吉业,宋鹏,王智强.基于极端评分行为的相似度计算[J].计算机科学,2020,47(2):31-36. 被引量：4
5余以胜,陈咏晖.基于用户属性—关系相似度的好友推荐模型研究[J].情报理论与实践,2020,43(2):137-142. 被引量：5
6张许,虞慧群,范贵生.基于相似性度量的用户推荐方法[J].计算机工程与设计,2020,41(7):1872-1876. 被引量：3
7王岩,张杰,许合利.结合用户兴趣和改进的协同过滤推荐算法[J].小型微型计算机系统,2020,41(8):1665-1669. 被引量：18
8朵琳,杨丙.基于概念格的稀疏数据协同过滤校正自然噪声方法[J].吉林大学学报（理学版）,2020,58(5):1173-1180. 被引量：6
9滕传志,赵月旭.基于随机森林-马尔可夫用户冷启动推荐系统[J].计算机工程与设计,2020,41(11):3094-3098. 被引量：7
10缪祥华,单小撤.基于密集连接卷积神经网络的入侵检测技术研究[J].电子与信息学报,2020,42(11):2706-2712. 被引量：21

引证文献3

1杨亚洲,MARIFEL GRACE CKUMMER.使用机器学习技术的基于网络的电影推荐系统[J].科学大众（科技创新）,2021(10):100-101.
2李鹏,苏忻洁,白世贞.基于单值中智集的协同过滤推荐算法[J].计算机应用研究,2021,38(12):3667-3672. 被引量：4
3赵峰.混合推荐算法在基于机器学习的影片推荐系统中的应用[J].泰州职业技术学院学报,2023,23(4):52-55.

二级引证文献4

1杨晓敏.基于矩阵分解和蚁群算法的旅游路线优化算法[J].信息技术与信息化,2022(3):138-141. 被引量：2
2侯立,王健.基于协同过滤的用户大数据周期智能推荐算法[J].计算机仿真,2023,40(3):476-479. 被引量：3
3夏阳,于鹏.基于逻辑蕴涵算子的汽轮机故障诊断研究[J].西安理工大学学报,2023,39(1):60-68. 被引量：2
4刘承佳,吴鹏,郑晓娟.基于协同过滤和深度学习的信息分析算法[J].电子设计工程,2024,32(3):92-96. 被引量：1

1肖灿.刍议“大智移云”对企业财务管理的影响[J].全国流通经济,2020(18):173-174.
2李奋华,赵润林.一种基于领域知识的链路预测方法[J].计算机应用与软件,2020,37(11):206-208. 被引量：2
3稳定的单分子自旋开关[J].光学精密机械,2020(2):31-31.
4叶茂林.大数据时代人工智能在计算机网络技术中的应用研究[J].进展,2020(17):70-72.
5王丽娜.污染源信息推荐的协同过滤算法应用模型[J].软件工程与应用,2020,9(5):345-351.
6辛建波,陈田,许奕斌,郭创新,谢斌,康琛,翁新林.基于CIM和REST的输变电设备全景信息集成方法[J].电力科学与技术学报,2020,35(5):11-19. 被引量：8
7陈星星,袁光华,魏啸.配电生产运行风险综合管控处理平台分析[J].科技创新与应用,2020(34):195-196.
8张新雨,王露,宋念龙,常帅,张东坤.基于电涡流传感器的温度位移智能检测方法[J].传感技术学报,2020,33(8):1176-1182. 被引量：5
9张晟,曹俏,张超,原寒.基于在线地图的厂址周围环境数据采集系统[J].科技创新与应用,2020(34):1-3. 被引量：1
10王丽娜.基于UTFB算法的污染源信息推荐[J].数据挖掘,2020,10(4):277-281.

计算机应用与软件

2020年第11期

浏览历史

内容加载中请稍等...

Spark平台下电影推荐系统的设计被引量：3

参考文献2

二级参考文献9

共引文献13

同被引文献19

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

Spark平台下电影推荐系统的设计 被引量：3

参考文献2

二级参考文献9

共引文献13

同被引文献19

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

Spark平台下电影推荐系统的设计被引量：3