Q-learning算法优化的SVDPP推荐算法被引量：3

SVDPP Recommendation Algorithm Optimized by Q-learning Algorithm

下载PDF

导出

摘要为进一步改善个性化推荐系统的推荐效果,通过使用强化学习方法对SVDPP算法进行优化,提出一种新的协同过滤推荐算法。考虑用户评分的时间效应,将推荐问题转化为马尔科夫决策过程。在此基础上,利用Q-learning算法构建融合时间戳信息的用户评分优化模型,同时通过预测评分取整填充和优化边界补全方法预测缺失值,以解决数据稀疏性问题。实验结果显示,该算法的均方根误差较SVDPP算法降低了0.005 6,表明融合时间戳并采用强化学习方法进行推荐性能优化是可行的。 To futher improve the recommendation performance of personalized recommendation systems,this paper proposes a Collaborative Filtering(CF)recommendation algorithm based on SVDPP algorithm optimized by reinforcement learning.Considering the time effect of user ratings,the recommendation problem is transformed into a Markov Decision Process(MDP).On this basis,the Q-learning algorithm is used to construct a user rating optimization model fused with timestamp information.At the same time,in order to solve the data sparse problem,the prediction score is rounded to the nearest integer to fill and optimize the boundary to make up for the missing value in the process of prediction.Experimental results show that the RMSE of this algorithm is0.005 6 lower than that of SVDPP algorithm,which demonstrates that it is feasible to use the reinforcement learning method and timestamp to optimize the recommendation performance.

作者周运腾张雪英李凤莲刘书昌焦江丽田豆 ZHOU Yunteng;ZHANG Xueying;LI Fenglian;LIU Shuchang;JIAO Jiangli;TIAN Dou(School of Information and Computer,Taiyuan University of Technology,Taiyuan 030600,China)

机构地区太原理工大学信息与计算机学院

出处《计算机工程》 CAS CSCD 北大核心 2021年第2期46-51,共6页 Computer Engineering

基金山西省重点研发计划(社会发展领域)(201803D31045) 山西省自然科学基金(201801D121138) 山西省科技重大专项(20181102008)。

关键词协同过滤奇异值分解强化学习马尔科夫决策过程 Q-learning算法 Collaborative Filtering(CF) Singular Value Decomposition(SVD) reinforcement learning Markov Decision Process(MDP) Q-learning algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1张文旭,马磊,贺荟霖,王晓东.强化学习的地–空异构多智能体协作覆盖研究[J].智能系统学报,2018,13(2):202-207. 被引量：7
2郭晶晶,马建峰.面向虚拟社区物联网的信任推荐算法[J].西安电子科技大学学报,2015,42(2):52-57. 被引量：10
3李卓远,曾丹,张之江.基于协同过滤和音乐情绪的音乐推荐系统研究[J].工业控制计算机,2018,31(7):127-128. 被引量：10
4王燕,李凤莲,张雪英,田玉楚.改进学习率的一种高效SVD++算法[J].现代电子技术,2018,41(3):146-150. 被引量：4
5陈兴国,俞扬.强化学习及其在电脑围棋中的应用[J].自动化学报,2016,42(5):685-695. 被引量：32
6尹航,常桂然,王兴伟.采用聚类算法优化的K近邻协同过滤算法[J].小型微型计算机系统,2013,34(4):806-809. 被引量：20
7王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(7):66-76. 被引量：334
8王晓雷,陈云杰,王琛,牛犇.基于Q-learning的虚拟网络功能调度方法[J].计算机工程,2019,45(2):64-69. 被引量：35
9王小豪,孙彦武,胡浩明,王蕊蕊,乐光学.基于信誉度的商品推荐建模与仿真分析[J].电脑知识与技术,2019,15(5):294-296. 被引量：1
10周翼,陈渤.一种改进dueling网络的机器人避障方法[J].西安电子科技大学学报,2019,46(1):46-50. 被引量：5

二级参考文献60

1庞秀丽,冯玉强,姜维.电子商务个性化文档推荐技术研究[J].中国管理科学,2008,16(S1):581-586. 被引量：10
2刘玮.电子商务系统中的信息推荐方法研究[J].情报科学,2006,24(2):300-303. 被引量：31
3陈君,唐雁.基于Web社会网络的个性化Web信息推荐模型[J].计算机科学,2006,33(4):185-187. 被引量：11
4李宝林,兰芸,张翼英.基于动态遗传算法的用户模型进化研究[J].计算机工程与应用,2006,42(14):200-203. 被引量：7
5周涓,熊忠阳,张玉芳,任芳.基于最大最小距离法的多中心聚类算法[J].计算机应用,2006,26(6):1425-1427. 被引量：72
6赵鹏,耿焕同,王清毅,蔡庆生.基于聚类和分类的个性化文章自动推荐系统的研究[J].南京大学学报（自然科学版）,2006,42(5):512-518. 被引量：13
7余力,董斯维,郭斌.电子商务推荐攻击研究[J].计算机科学,2007,34(5):134-138. 被引量：11
8张玉连,王权.基于浏览行为和浏览内容的用户兴趣建模[J].现代图书情报技术,2007(6):52-55. 被引量：24
9Lee G M,Crespi N,Choi J K,et al.Internet of Things[J].Evolution of Telecommunication Services,2013,7768:257-282.
10Jara A J,Zamora-Izquierdo M A,Skarmeta A F.Interconnection Framework for mHealth and Remote Monitoring Based on the Internet of Things[J].IEEE Journal on Selected Areas in Communications,2013,31(9):47-65.

共引文献446

1唐宁.融合视听传播的创新逻辑与价值再造[J].中国新闻传播研究,2019,0(4):171-180. 被引量：3
2杨梦月,何洪波,王闰强.基于反事实学习及混淆因子建模的文章个性化推荐[J].计算机系统应用,2020(10):53-60. 被引量：1
3吴飞贤,段华斌,扈乐华,朱珍珠,宋均.基于Spark的商品推荐系统的设计与实现[J].办公自动化,2021,26(3):60-62. 被引量：3
4宋雅婷,徐天伟.基于用户兴趣的个性化推荐技术综述[J].云南大学学报（自然科学版）,2012,34(S1):20-23. 被引量：6
5张慧勇,郭小燕.基于个性化服务的农产品商城设计与实现[J].自动化与仪器仪表,2016(2):80-82. 被引量：1
6张慧勇,郭小燕.基于个性化服务的农产品商城设计与实现[J].自动化与仪器仪表,2016(5):157-159.
7陈德成.土耳其的多党制半总统制政体[J].西亚非洲,2000(2):46-50. 被引量：8
8胡祥仁,陆林,王云生,商军,王保文,黄礼法.急性鱼胆中毒86例临床分析[J].中华内科杂志,2000,39(4):273-274. 被引量：86
9黄建贤,蔡祥梧.腹腔镜胆囊切除220例临床分析[J].广东医学,2000,21(5):414-415.
10诚然.关于情人[J].岁月,2000(7):22-23.

同被引文献27

1闫龙川,白东霞,刘万涛,刘殷,李莉敏.人工智能技术在云计算数据中心能量管理中的应用与展望[J].中国电机工程学报,2019,39(1):31-42. 被引量：37
2董玉明,俞立,朱俊威.基于自适应滑模的移动机械臂跟踪控制[J].控制工程,2019,26(1):43-49. 被引量：27
3韦炜,全渝娟,卓奕涛,陈学亮,林艳.基于多阶马尔可夫预测的个性化推荐算法[J].计算机工程,2015,41(11):59-66. 被引量：9
4刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：468
5张红,王玉峰.基于雾计算的NB-IoT框架、关键技术及应用[J].中兴通讯技术,2017,23(1):32-36. 被引量：19
6严浙平,杨泽文,王璐,岳立冬,潘晓丽.马尔科夫理论在无人系统中的研究现状[J].中国舰船研究,2018,13(6):9-18. 被引量：4
7李艳,孟凡强,陈军才.新生代农民工劳资冲突行为决策——基于适应性马尔科夫链的解释[J].西北人口,2019,40(1):61-70. 被引量：3
8覃艳明,赵静一,仝少帅,王建军.八自由度机械臂位置运动学模型解析解[J].农业机械学报,2019,50(1):400-405. 被引量：15
9王辉,李小亮,洪波.马尔科夫决策过程在移动端云存储策略中的应用[J].工业仪表与自动化装置,2018(6):117-121. 被引量：1
10朱斐,吴文,伏玉琛,刘全.基于双深度网络的安全深度强化学习方法[J].计算机学报,2019,42(8):1812-1826. 被引量：26

引证文献3

1郑忠斌,宋青青,熊增薪.基于雾计算的NB-IoT资源优化模型及仿真[J].粘接,2021(4):87-90. 被引量：2
2李井林.基于模糊变结构补偿的机械臂运动路径避障规划算法[J].机械设计与制造工程,2024,53(1):46-50.
3张斯力,李梓健,蔡瑞初,郝志峰,闫玉光.基于因果机制约束的强化推荐系统[J].计算机工程,2024,50(5):279-290.

二级引证文献2

1孟祥武,陈俊,李旭,卫新来,金杰.智慧环境治理在生态环境监测和保护方面的构建分析[J].洛阳师范学院学报,2023,42(2):27-33. 被引量：4
2高晓彬,马大奎,吴旻.基于物联网技术的工程目标风险预测方法[J].粘接,2024,51(6):174-177.

计算机工程

2021年第2期

浏览历史

内容加载中请稍等...

Q-learning算法优化的SVDPP推荐算法被引量：3

参考文献10

二级参考文献60

共引文献446

同被引文献27

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Q-learning算法优化的SVDPP推荐算法 被引量：3

参考文献10

二级参考文献60

共引文献446

同被引文献27

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

Q-learning算法优化的SVDPP推荐算法被引量：3