基于用户信息向量聚类和改进SAMME的推荐算法

Recommendation Algorithm Based on User Information Vector Clustering and Improved SAMME

下载PDF

导出

摘要针对目前主流的推荐算法中获取的用户信息不完整以及推荐时间过长的问题,本文提出一种基于用户信息向量聚类和改进SAMME的推荐算法,该算法通过分析用户基本信息(地域、时间、兴趣、标签等),找出用户信息关键词;对不同用户信息关键词基于TF-IDF方法进行加权构建用户信息向量;接着使用K-means算法进行用户聚类分析,将用户聚类结果作为改进SAMME训练样本集;最后通过改进SAMME算法将预测结果对用户进行好友推荐,并在训练过程中保存模型,大大减少推荐时间。最终将本文算法在真实的微博用户数据集上进行实验,并与其他主流算法进行对比,结果显示本文算法在准确率、召回率、F值上都取得了不错的效果。 Aiming at the problem of imperfect user information acquisition and long recommendation time in the current mainstream recommendation algorithms,this paper proposes a recommendation algorithm based on user information vector clustering and improved SAMME.The algorithm analyzes basic user information(region,time,interest,tags,etc)to find user information keywords;weights different user information keywords based on the TF-IDF method to construct user information vectors;then uses the K-means algorithm to perform user clustering analysis,and uses the user clustering results as improved SAMME training sample set;finally,the prediction results are recommended to the user by the improved SAMME algorithm,and the model is saved during the training process,which greatly reduces the recommendation time.Finally,the algorithm of this paper is tested on the real Weibo user data set and compared with other mainstream algorithms.The results show that the algorithm of this paper achieves good results in accuracy,recall and F-value.

作者王杉文欧鸥马万民陈建林 WANG Shan-wen;OU Ou;MA Wan-min;CHEN Jian-lin(College of Information Science and Technology(College of Internet Security),Chengdu University of Technology,Chengdu 610051,China)

机构地区成都理工大学信息科学与技术学院(网络安全学院)

出处《计算机与现代化》 2021年第7期23-28,94,共7页 Computer and Modernization

基金国家重点研发计划资助项目(2018YFF01013304)。

关键词推荐系统 SAMME算法用户信息聚类分析 recommendation system SAMME algorithm user information cluster analysis

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1苑宁萍,辛力坚,王呼生,宁鹏飞.融合用户兴趣度和信任度的协同过滤推荐算法[J].计算机工程与设计,2020,41(7):1967-1974. 被引量：11
2姚彬修,倪建成,于苹苹,李淋淋,曹博.基于多源信息相似度的微博用户推荐算法[J].计算机应用,2017,37(5):1382-1386. 被引量：11
3黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
4田保军,胡培培,杜晓娟,苏依拉.Hadoop下基于聚类协同过滤推荐算法优化的研究[J].计算机工程与科学,2016,38(8):1615-1624. 被引量：18
5付永平,邱玉辉.一种基于贝叶斯网络的个性化协同过滤推荐方法研究[J].计算机科学,2016,43(9):266-268. 被引量：12
6杨尊琦,张倩楠.基于k-means算法的微博用户推荐功能研究[J].情报杂志,2013,32(8):142-144. 被引量：16
7王永贵,刘凯奇.一种优化聚类的协同过滤推荐算法[J].计算机工程与应用,2020,56(15):66-73. 被引量：17
8杨兴雨,李华平,张宇波.基于聚类和随机森林的协同过滤推荐算法[J].计算机工程与应用,2018,54(16):152-157. 被引量：10
9范奥哲,何利力.一种双向聚类协同过滤推荐算法研究[J].软件导刊,2020,19(5):78-82. 被引量：5

二级参考文献103

1张丹,何跃.基于聚类分析的SNS网络研究[J].情报杂志,2012,31(5):62-65. 被引量：3
2邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
3张锋,常会友.使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J].计算机研究与发展,2006,43(4):667-672. 被引量：85
4徐义峰,陈春明,徐云青.一种基于分类的协同过滤算法[J].计算机系统应用,2007,16(1):47-50. 被引量：8
5李涛,王建东,叶飞跃,冯新宇,张有东.一种基于用户聚类的协同过滤推荐算法[J].系统工程与电子技术,2007,29(7):1178-1182. 被引量：70
6张光卫,李德毅,李鹏,康建初,陈桂生.基于云模型的协同过滤推荐算法[J].软件学报,2007,18(10):2403-2411. 被引量：193
7苏娜,张志强,刘志辉.基于链接分析的图林博客显著度分析[J].情报资料工作,2010,31(1):98-102. 被引量：10
8黄国言,李有超,高建培,常旭亮.基于项目属性的用户聚类协同过滤推荐算法[J].计算机工程与设计,2010,31(5):1038-1041. 被引量：28
9吴湖,王永吉,王哲,王秀利,杜栓柱.两阶段联合聚类协同过滤算法[J].软件学报,2010,21(5):1042-1054. 被引量：83
10李大学,谢名亮,赵学斌.基于朴素贝叶斯方法的协同过滤推荐算法[J].计算机应用,2010,30(6):1523-1526. 被引量：21

共引文献88

1黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
2黄东,陈光,李海滨,杨朔.Spark个性化地点推荐系统[J].辽宁工程技术大学学报（自然科学版）,2020(6):533-540. 被引量：1
3马心儒,丁伟.用户行为数据统计的案例分析[J].电子技术（上海）,2021,50(8):180-181.
4罗治彬,吴嘉惠,徐采朴.过量锌对大鼠小肠粘膜粘液分泌的影响[J].第三军医大学学报,2000,22(5):459-461. 被引量：3
5林晓丽,胡可可,胡青.基于Python的微博用户关系挖掘研究[J].情报杂志,2014,33(6):144-148. 被引量：15
6徐则阳,刘博.百度贴吧用户兴趣分类[J].福建电脑,2014,30(11):44-46.
7崔金栋,于圆美,王新媛,孙遥遥.信息管理技术视角下微博研究综述与趋势分析[J].图书馆论坛,2015,35(4):92-99. 被引量：11
8李勇,田晶晶.基于UTAUT模型的政务微博接受度影响因素研究[J].电子政务,2015(6):39-48. 被引量：22
9谭思妮,陈平华.蛛网态微博关系网中有影响力用户的识别研究[J].广东工业大学学报,2015,32(3):61-66.
10黄太波,汪毓铎.基于邻居模型的协同过滤算法的应用研究[J].北京信息科技大学学报（自然科学版）,2017,32(4):90-94. 被引量：5

1王小青,苏锋,蔡传根.基于数据挖掘技术的影视智能推荐算法[J].现代电子技术,2021,44(11):98-101. 被引量：1
2纪程,李坤,赵玉强,郑红娟,顾琳琳.负荷侧需求中家庭用电诱导性抑制模式自动匹配方法[J].自动化技术与应用,2021,40(6):149-153. 被引量：1
3王彦,董育宁,葛军.实现网络视频流多分类的迁移学习算法[J].计算机工程与应用,2021,57(14):164-168. 被引量：2
4张铁,廖才磊,邹焱飚,康中强.采用强化学习的多轴运动系统时间最优轨迹优化[J].西安交通大学学报,2021,55(7):33-40. 被引量：3
5吴虹颖,郑山红,苏珂.改进SOM和快速K中心点银行客户细分[J].长春工业大学学报,2021,42(3):279-284.
6代继鹏,邵峰晶,孙仁诚.基于改进CHI和TF-IDF的短文本分类的研究[J].计算机与现代化,2021(6):6-11. 被引量：2

计算机与现代化

2021年第7期

浏览历史

内容加载中请稍等...

基于用户信息向量聚类和改进SAMME的推荐算法

参考文献9

二级参考文献103

共引文献88

相关作者

相关机构

相关主题

浏览历史