-
题名融合协同过滤的神经Bandits推荐算法
被引量:2
- 1
-
-
作者
张婷婷
欧阳丹彤
孙成林
白洪涛
-
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
吉林大学白求恩第一医院内分泌与代谢科
-
出处
《吉林大学学报(理学版)》
CAS
北大核心
2024年第1期92-99,共8页
-
基金
吉林省自然科学基金(批准号:20210101181JC)。
-
文摘
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用;最后,构造决策器进行最终决策.实验结果表明,该方法在累积遗憾上优于4种基线算法,推荐效果较好.
-
关键词
协同过滤
多臂老虎机算法
推荐系统
冷启动
-
Keywords
collaborative filtering
multi-armed Bandit algorithm
recommendation system
cold start
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多臂赌博机算法的异构群智感知任务分配
- 2
-
-
作者
姚秋言
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《软件》
2022年第5期79-81,140,共4页
-
文摘
为了在有限的预算内尽可能提高标签任务的可靠性,考虑异构群智感知中的任务分配问题。使用多臂赌博机算法,通过加权投票机制得到任务的信誉得分,对模型使用UCI真实数据集进行验证。实验结果表明,多臂赌博机算法在动态学习工人能力、提高标签任务可靠性方面表现较好。随着预算的增加,准确性趋于最优任务分配策略。因此,该算法不仅能够动态学习工人能力,而且能进行有效任务分配,解决群智感知异构性问题。
-
关键词
多臂赌博机算法
群智感知
异构性
任务分配
-
Keywords
multi arm bandit
crowdsensing
heterogeneity
task allocation
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于多臂赌博机算法的推荐系统研究
被引量:1
- 3
-
-
作者
陈珂
-
机构
南京邮电大学通信与信息工程学院
-
出处
《长江信息通信》
2021年第3期43-46,共4页
-
文摘
随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问题并提供给用户更为精确的推荐效果都已经成为推荐问题中亟待解决的问题。同时各种推荐系统技术不断发展,文章对近年来各种基于MAB算法的推荐系统的研究动态和最新进展进行了综述,对其基本概念和算法的核心思想以及评价指标诸如点击率,运行时长以及累积遗憾等方面进行了分析比较,并对推荐系统技术的发展趋势和应用前景进行了预测。
-
关键词
多臂赌博机算法
UCB算法
Lin-UCB算法
推荐系统
汤普森抽样算法
-
Keywords
Multi-Armed Bandit Algorithm
UCB
Lin-UCB Algorithm
Thompson Sampling Algorithm
-
分类号
TN929.5
[电子电信—通信与信息系统]
-
-
题名基于用户中心访问行为的多臂缓存方法
被引量:1
- 4
-
-
作者
黄国豪
江昊
弈舒文
曾园园
-
机构
武汉大学电子信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第14期34-40,共7页
-
基金
国家高技术研究发展计划(863)(No.2014AA01A707)
-
文摘
针对现有的边缘缓存策略无法有效预测短时热内容集和冷内容集流行度时变规律,而基于探索的多臂算法缺乏有效机制解决探索过程的过量探索问题,提出了基于用户中心访问行为的多臂缓存方法(MACB)。MACB利用用户中心访问上下文缩小群体访问偏好内容集,在此基础上采用多臂算法的探索开发过程,有效学习短时热内容集和冷内容集的内容流行度变化规律。实验采用了中国移动用户记录数据集,并与相关缓存算法进行对比。结果显示MACB在缓存击中率上均高于其他对比缓存方法,表明了MACB缓存方法的有效性和优越性。
-
关键词
边缘缓存
用户中心访问行为
多臂算法
缓存击中率
-
Keywords
edge caching
central behavior
multi-arm bandit
hit rate
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多臂赌博机的信道选择
被引量:2
- 5
-
-
作者
叶孟宇
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《软件》
2018年第4期196-200,共5页
-
文摘
针对非合作模式下的认知无线网络中信道的选择问题,提出了一个动态信道分配策略。由于认知无线电环境中存在主用户使用授权信道的情况,通过多臂赌博机算法搭建认知无线网络系统模型,认知用户通过多臂赌博机算法实现在认知无线电系统中对空闲信道的学习和感知,认知用户能够通过学习和感知避开主用户占用概率高的信道,更多的通过主用户占用概率低的信道进行传输,以此实现对空闲信道的动态选择和利用。仿真结果表明,在信道信息不完全可知的情况下,次用户通过强化学习算法所提供的信道选择策略,能够提高空闲信道利用率,使得次用户有较为稳定的成功传输率。
-
关键词
认知无线电
多臂赌博机算法
非合作
-
Keywords
Cognitive radio
Multi-armed bandit
Non-operation
-
分类号
TN92
[电子电信—通信与信息系统]
-