Item2vec与改进DDPG相融合的推荐算法被引量：2

Recommendation Algorithm Combining Item2vec with Improved DDPG

导出

摘要传统的推荐算法能够有效解决信息过载问题,但在冷启动和数据稀疏的情况下,传统方法仍有其局限性。针对以上问题本文提出一种基于深度强化学习理论的推荐算法,该算法使用深度确定性策略梯度(DDPG,deep deterministic policy gradient,DDPG)算法来解决推荐问题,使用Item2vec将离散的动作空间转换为连续的表示,同时提出了一种余弦距离和欧氏距离相结合的奖励函数,能够保障神经网络不会过早的收敛于局部最优。应用该算法进行电影的推荐,实验结果表明本文提出的算法能够产生较好的推荐并能缓解冷启动所带来的影响。 The traditional recommendation algorithm can effectively solve the problem of information overload, but in the case of cold start and data sparse, the traditional method still has its limitations. For these problems, this paper proposed a recommendation algorithm based on deep reinforcement learning theory, which using the deep deterministic policy gradient (DDPG) algorithm to solve the recommendation problem and using Item2vec to transform the discrete action space into a continuous representation. A reward function combining cosine distance and Euclidean distance is proposed to ensure that the neural network does not converge to local optimum prematurely. This paper applied the algorithm to movie recommender system. The final experiment proved that the proposed algorithm can generate better recommendation results and alleviate the impact of cold start.

作者刘文竹黄勃高永彬姜晓燕张娟余宇新 LIU Wenzhu;HUANG Bo;GAO Yongbin;JIANG Xiaoyan;ZHANG Juan;YU Yuxin(School of Electronic and Electrical Engineering, Shanghai University of Engineering Science, Shanghai 201620, China;Center of Economic Crime Detection and Prevention and Control Technology Collaborative Innovation,Nanchang 330103, Jiangxi, China;School of Economics and Finance, Shanghai International Studies University, Shanghai 201620, China)

机构地区上海工程技术大学电子电气工程学院江西省经济犯罪侦查与防控技术协同创新中心上海外国语大学国际金融贸易学院

出处《武汉大学学报（理学版）》 CAS CSCD 北大核心 2019年第3期297-302,共6页 Journal of Wuhan University:Natural Science Edition

基金国家自然科学基金青年基金(61603242) 江西省经济犯罪侦查与防控技术协同创新中心开放基金(JXJZXTCX-030)

关键词推荐系统深度强化学习冷启动 recommender system deep reinforcement learning cold start

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献3

1张文彬,王春梅,王静,陈托,智佳.基于Spark的有效载荷参数解析处理方法[J].计算机工程与设计,2020,41(2):587-591. 被引量：4
2申艳梅,姜冰倩,敖山,刘志中.基于遗忘函数的均值贝叶斯个性化排序算法研究[J].计算机应用研究,2021,38(5):1350-1354. 被引量：3
3赵润发,娄渊胜,叶枫,石宏.基于Flink的工业大数据平台研究与应用[J].计算机工程与设计,2022,43(3):886-894. 被引量：18

引证文献2

1官蕊,丁家满,贾连印,游进国,姜瑛.融合序列模式评分的策略梯度推荐算法[J].计算机应用与软件,2022,39(3):223-228. 被引量：1
2赵华锐,于瓅.基于改进的深度兴趣网络推荐系统研究[J].现代信息科技,2023,7(12):81-84.

二级引证文献1

1申菲.改进LDA模型在影视作品推荐中的应用研究[J].微型电脑应用,2024,40(6):61-64. 被引量：1

1陈彦韬.基于深度学习的协同过滤推荐算法的改进和优化[J].电子制作,2019,27(12):40-42. 被引量：2
2郝璞.基于咸阳本土文化的校本课程开发和实践[J].试题与研究,2018(25):48-48.
3万里鹏,兰旭光,张翰博,郑南宁.深度强化学习理论及其应用综述[J].模式识别与人工智能,2019,32(1):67-81. 被引量：72
4周颖芮,孙锐,袁圆.个性化推荐研究热点及学术群探析——基于1990—2017年数据统计及可视化研究[J].科技与经济,2019,32(3):1-5. 被引量：1
5王亚东,黄云峰,李晓彤,赵建立,奚培锋.基于强化学习的复合储能微电网控制技术[J].山东工业技术,2019(6):159-159. 被引量：1
6刘晴晴,罗永龙,汪逸飞,郑孝遥,陈文.基于SVD填充的混合推荐算法[J].计算机科学,2019,46(B06):468-472. 被引量：14
7朱文跃,刘炜,刘宗田.基于事件本体的新闻个性化推荐[J].计算机工程,2019,45(6):267-272. 被引量：17
8杨淑珍,韩建宇,梁盼,古彭,杨发展,吕萍丽.基于深度强化学习的机器人手臂控制[J].福建电脑,2019,35(1):28-29. 被引量：1
9郭伟,于小涵,张锐晨,熊轲.无线RF能量收集异构网络中基于Q-Learning的自适应功率控制[J].新型工业化,2019,9(1):112-119.
10袁雯,刘惠义.基于深度Q网络的仿人机器人步态优化[J].计算机与现代化,2019(4):47-51. 被引量：1

武汉大学学报（理学版）

2019年第3期

浏览历史

内容加载中请稍等...

Item2vec与改进DDPG相融合的推荐算法被引量：2

同被引文献3

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

Item2vec与改进DDPG相融合的推荐算法 被引量：2

同被引文献3

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

Item2vec与改进DDPG相融合的推荐算法被引量：2