一种改进Minhash的分布式协同过滤推荐算法被引量：1

Collaborative filtering recommendation based on improved Minhash algorithm

下载PDF

导出

摘要协同过滤推荐算法通过研究用户的喜好,实现从海量数据资源中为用户推荐其感兴趣的内容。衡量用户(资源)的相似性是协同过滤算法的核心内容,在数据量大的系统中,用户(资源)的相似性度量会面临准确性和计算复杂性等问题,影响到推荐效果。提出一种改进的协同过滤推荐算法,提取用户兴趣偏好的多值信息,运用改进Minhash算法度量用户相似性,并结合Mapreduce分布式计算,合理、高效地产生用户邻居,实现对用户的评分推荐。实验结果表明:改进算法能有效改善大数据集的推荐准确性并提高推荐效率,降低了推荐耗时。 Collaborative filtering recommendation algorithm recommends interesting content for users from a massive data resource, by studying the user’s preferences. Measuring similarity of user(resource)is the core of collaborative filtering algorithms. In the large volume of data systems, the accuracy and computational complexity are faced in similarity measuring, which thus affect the recommendation results. This paper proposes an improved collaborative filtering algorithm by extracting multi-valued information of user interest preferences, uses improved Minhash algorithm to measure user similarity, and combines with Mapreduce distributed computing, to generate neighbor rationally and effectively, and finishes user ratings recommendations. Experimental results show that the improved algorithm can improve the recommendation accuracy and efficiency, reduce the recommended time-consuming for large data sets.

作者吴博文陈曦

机构地区长沙理工大学计算机与通信工程学院

出处《计算机工程与应用》 CSCD 北大核心 2016年第12期95-100,共6页 Computer Engineering and Applications

关键词协同过滤兴趣偏好相似度计算分布式计算 collaborative filtering interest preferences similarity calculation distributed computing

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献13

1Gao Ming,Cao Fuyuan,Zhe Joshua.A cross cluster-basedcollaborative filtering method for recommendation[C]//Proceedings of the IEEE International Conference on Informationand Automation,Yinchuan,China,2013.
2Bell R M,Koren Y.Improved neighborhood-based collaborativefiltering[C]//Proceedings of the 13th ACMSIGKDDInternational Conference on Knowledge Discovery andData Mining,California,2007:7-14.
3贺银慧,陈端兵,陈勇,傅彦.一种结合共同邻居和用户评分信息的相似度算法[J].计算机科学,2010,37(9):184-186. 被引量：13
4Resnick P.GroupLens:an open architecture for collaborativefiltering of net news[C]//Proc of the 1994 ACMConf on Computer Supported Cooperative Work,1994.
5Broder A Z.On the resemblance and containment of documents[C]//Proceedings of the Compression and Complexityof Sequences,1997:21-29.
6Elsayed T,Lin J.Pairwise document similarity in largecollections with MapReduce[C]//Proceedings of ACL-08:HLT,Columbus,Ohio,USA,2008.
7Hsieh L C,Wu G L.Two-stage sparse gragh constructionusing Minhash on MapReduce[C]//2012 IEEE InternationalConference on Acoustics,Speech and Signal Processing(ICASSP),2012.
8马小军,赵伟.改进相似度的分布式个性化推荐[J].计算机工程与应用,2014,50(4):126-131. 被引量：5
9赵琴琴,鲁凯,王斌.SPCF：一种基于内存的传播式协同过滤推荐算法[J].计算机学报,2013,36(3):671-676. 被引量：49
10杨博,赵鹏飞.推荐算法综述[J].山西大学学报（自然科学版）,2011,34(3):337-350. 被引量：87

二级参考文献35

1王茜,杨莉云,杨德礼.面向用户偏好的属性值评分分布协同过滤算法[J].系统工程学报,2010,25(4):561-568. 被引量：24
2张锋,常会友.基于分布式数据的隐私保持协同过滤推荐研究[J].计算机学报,2006,29(8):1487-1495. 被引量：17
3贾丽会,张修如.BP算法分析与改进[J].计算机技术与发展,2006,16(10):101-103. 被引量：47
4陈刚,刘发升.基于BP神经网络的数据挖掘方法[J].计算机与现代化,2006(10):20-22. 被引量：14
5邢春晓,高凤荣,战思南,周立柱.适应用户兴趣变化的协同过滤推荐算法[J].计算机研究与发展,2007,44(2):296-301. 被引量：148
6陈健,印鉴.基于影响集的协作过滤推荐算法[J].软件学报,2007,18(7):1685-1694. 被引量：59
7Adomavicius G,Tuzhilin A.Expert-driven validation of rule-based user models in personalization applications[J].Data Mi-ning and Knowledge Discovery,2001,5(1/2):33-58.
8Adomavicius G,Tuzhilin A.Toward the next generation of reco-mmender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transaction on Knowledge and Data Engineering,2005,17(6):734-749.
9梅田望夫.网络巨变元年-你必须参加的大未来[M].先觉:先觉出版社,2006.
10Breese J S,Heckerman D,Kadie C.Empirical analysis of predictive algorithms for collaborative filtering[C] //The 14th Confe-rence on Uncertainty in Artificial Intelligence.1998:43-52.

共引文献169

1梁莉莉,布瑞丰.非遗视频直播的技术逻辑及其潜在风险——基于抖音平台的“田野”观察[J].青海民族研究,2022,33(3):136-141. 被引量：5
2熊忠阳,刘芹,张玉芳,李文田.基于项目分类的协同过滤改进算法[J].计算机应用研究,2012,29(2):493-496. 被引量：39
3杨丽丽,年梅,杨婷婷.个性化网络教学资源系统[J].计算机系统应用,2012,21(6):174-177. 被引量：2
4程红斌,黄美荣,杨瑞娟,张晓丰.基于自主化情报定制的新型发布/订阅系统研究[J].空军雷达学院学报,2012,26(3):185-188. 被引量：6
5李东勤.电子商务中个性化推荐系统的研究[J].现代计算机（中旬刊）,2012(10):3-8. 被引量：2
6占亿民,李鑫,胡俊,冒海波.基于大数据的云媒体电视全局业务智能技术[J].广播与电视技术,2013(9):83-84. 被引量：10
7王冠楠,陈端兵,傅彦.新闻推荐的多维兴趣模型与传播分析[J].计算机科学,2013,40(11):126-130. 被引量：5
8李芳,李永进.一种基于随机游走的多维数据推荐算法[J].计算机科学,2013,40(11):304-307. 被引量：3
9吴志强.数字化科学交流中的信息推荐服务[J].信息资源管理学报,2013,3(4):79-83.
10申艳光,郭高尚,吴晶晶.结合情景和协同过滤的移动推荐算法[J].科学技术与工程,2014,22(8):49-52. 被引量：6

同被引文献11

1董爱美,王士同,蒋亦樟,黄成泉.基于最小包含球的异质空间大数据集快速相似度学习算法[J].控制与决策,2014,29(9):1553-1561. 被引量：1
2高升,任思婷,郭军.基于潜在因子模型的跨领域信息推荐算法[J].电信科学,2015,31(7):75-79. 被引量：6
3李佳玮,郝悍勇,李宁辉.工业控制系统信息安全防护[J].中国电力,2015,48(10):139-143. 被引量：35
4彭勇,向憧,张淼,陈冬青,高海辉,谢丰,戴忠华.工业控制系统场景指纹及异常检测[J].清华大学学报（自然科学版）,2016,56(1):14-21. 被引量：19
5贾忠涛,吴颖川,刘志勤.一种协同过滤算法在网络干扰过滤中的应用[J].计算机仿真,2016,33(1):284-287. 被引量：5
6陆坤,谢玲,李明楚.一种融合隐式信任的协同过滤推荐算法[J].小型微型计算机系统,2016,37(2):241-245. 被引量：12
7蓝冬梅.大数据量图书下多数据集的二部图多样化推荐[J].情报理论与实践,2016,39(2):69-72. 被引量：6
8黄璐,林川杰,何军,刘红岩,杜小勇.融合主题模型和协同过滤的多样化移动应用推荐[J].软件学报,2017,28(3):708-720. 被引量：44
9李改,陈强,李磊.基于评分预测与排序预测的协同过滤推荐算法[J].电子学报,2017,45(12):3070-3075. 被引量：20
10王永贵,宋真真,肖成龙.基于改进聚类和矩阵分解的协同过滤推荐算法[J].计算机应用,2018,38(4):1001-1006. 被引量：28

引证文献1

1王烨,郭玲利,宋文超,杨善友,程龙.基于大数据技术的专家知识库设备画像推荐算法研究[J].计算机测量与控制,2018,26(12):225-229. 被引量：2

二级引证文献2

1冯益林,余粟,王盟,赵玉强,王凯.人体测量及智能购衣的专家控制系统设计[J].智能计算机与应用,2019,9(4):280-283.
2徐榕青,张晏铭,王辉,李杨,庞婷.面向微波组件工艺失效分析的大数据建模技术[J].计算机测量与控制,2020,28(9):238-242. 被引量：1

1日本研发出凹坑多值记录光盘技术[J].电视技术,2008,32(7):16-16.
2王丹,吴孟达,刘银山.粗糙关系数据库空间结构及其粗糙集模型[J].计算机工程与应用,2005,41(34):163-167. 被引量：8

计算机工程与应用

2016年第12期

浏览历史

内容加载中请稍等...

一种改进Minhash的分布式协同过滤推荐算法被引量：1

参考文献13

二级参考文献35

共引文献169

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种改进Minhash的分布式协同过滤推荐算法 被引量：1

参考文献13

二级参考文献35

共引文献169

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一种改进Minhash的分布式协同过滤推荐算法被引量：1