期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
深度强化学习结合图注意力模型求解TSP问题 被引量:4
1
作者 王扬 陈智斌 +1 位作者 杨笑笑 吴兆蕊 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期420-429,共10页
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等... 旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法. 展开更多
关键词 深度强化学习 旅行商问题 图注意力模型 神经网络 组合最优化
下载PDF
基于原型学习改进的伪标签半监督学习算法 被引量:5
2
作者 杨雨龙 郭田德 韩丛英 《中国科学院大学学报(中英文)》 CSCD 北大核心 2021年第6期841-851,共11页
近年来,基于图像增广和一致性正则化的半监督学习(semi-supervised learning,SSL)方法被广泛应用并取得了很大的成功。然而,由于伪标签算法存在“认知偏误”问题,即模型的错误通过伪标签累积从而难以改正,因此很少有人关注基于伪标签(ps... 近年来,基于图像增广和一致性正则化的半监督学习(semi-supervised learning,SSL)方法被广泛应用并取得了很大的成功。然而,由于伪标签算法存在“认知偏误”问题,即模型的错误通过伪标签累积从而难以改正,因此很少有人关注基于伪标签(pseudo-labeling,PL)的半监督学习方法。提出一种特征图的原型图注意力特征修正模型(prototype attention layer,PAL):即在神经网络映射的特征空间上学习一个图注意力模型,将此模型应用于特征空间中,可以充分利用原型的信息来修正特征,将修正后的特征所产生的伪标签与原型分配产生的伪标签随机线性组合,从而得到新的伪标签。将这一模型应用到2种伪标签半监督学习框架上所得到的算法(prototype attention improved pseudo-labeling,PAIPL),在CIFAR-10和CIFAR-100的多个半监督分类问题上进行测试,分类准确率都得到了显著提升。特别地,将提出的修正模型应用于伪标签半监督学习PLCB框架时,又提出相互混合的监督技术,从而取得了更好的效果。还将提出的模型应用到其他多个伪标签半监督学习框架上,并在多个数据集上进行实验,验证了所提出的模型作为一个附加模块是普适且有效的。 展开更多
关键词 半监督学习 伪标签 MixUp 图注意力模型 原型学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部