期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
深度强化学习结合图注意力模型求解TSP问题
被引量:
4
1
作者
王扬
陈智斌
+1 位作者
杨笑笑
吴兆蕊
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第3期420-429,共10页
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等...
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法.
展开更多
关键词
深度强化学习
旅行商问题
图注意力模型
图
神经网络
组合最优化
下载PDF
职称材料
基于原型学习改进的伪标签半监督学习算法
被引量:
5
2
作者
杨雨龙
郭田德
韩丛英
《中国科学院大学学报(中英文)》
CSCD
北大核心
2021年第6期841-851,共11页
近年来,基于图像增广和一致性正则化的半监督学习(semi-supervised learning,SSL)方法被广泛应用并取得了很大的成功。然而,由于伪标签算法存在“认知偏误”问题,即模型的错误通过伪标签累积从而难以改正,因此很少有人关注基于伪标签(ps...
近年来,基于图像增广和一致性正则化的半监督学习(semi-supervised learning,SSL)方法被广泛应用并取得了很大的成功。然而,由于伪标签算法存在“认知偏误”问题,即模型的错误通过伪标签累积从而难以改正,因此很少有人关注基于伪标签(pseudo-labeling,PL)的半监督学习方法。提出一种特征图的原型图注意力特征修正模型(prototype attention layer,PAL):即在神经网络映射的特征空间上学习一个图注意力模型,将此模型应用于特征空间中,可以充分利用原型的信息来修正特征,将修正后的特征所产生的伪标签与原型分配产生的伪标签随机线性组合,从而得到新的伪标签。将这一模型应用到2种伪标签半监督学习框架上所得到的算法(prototype attention improved pseudo-labeling,PAIPL),在CIFAR-10和CIFAR-100的多个半监督分类问题上进行测试,分类准确率都得到了显著提升。特别地,将提出的修正模型应用于伪标签半监督学习PLCB框架时,又提出相互混合的监督技术,从而取得了更好的效果。还将提出的模型应用到其他多个伪标签半监督学习框架上,并在多个数据集上进行实验,验证了所提出的模型作为一个附加模块是普适且有效的。
展开更多
关键词
半监督学习
伪标签
MixUp
图注意力模型
原型学习
下载PDF
职称材料
题名
深度强化学习结合图注意力模型求解TSP问题
被引量:
4
1
作者
王扬
陈智斌
杨笑笑
吴兆蕊
机构
昆明理工大学理学院
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第3期420-429,共10页
基金
国家自然科学基金(11761042)。
文摘
旅行商问题(Traveling Salesman Problem,TSP)是组合最优化问题(Combinatorial Optimization Problem,COP)中的经典问题,多年以来一直被反复研究.近年来深度强化学习(Deep Reinforcement Learning,DRL)在无人驾驶、工业自动化、游戏等领域的广泛应用,显示了强大的决策力和学习能力.结合DRL和图注意力模型,通过最小化路径长度求解TSP问题.改进REINFORCE算法,训练行为网络参数,可以有效地减小方差,防止局部最优;在编码结构中采用位置编码(Positional Encoding,PE),使多重的初始节点在嵌入的过程中满足平移不变性,可以增强模型的稳定性;进一步结合图神经网络(Graph Neural Network,GNN)和Transformer架构,首次将GNN聚合操作处理应用到Transformer的解码阶段,有效捕捉图上的拓扑结构及点与点之间的潜在关系.实验结果显示,模型在100-TSP问题上的优化效果超越了目前基于DRL的方法和部分传统算法.
关键词
深度强化学习
旅行商问题
图注意力模型
图
神经网络
组合最优化
Keywords
Deep Reinforcement Learning(DRL)
Travel Salesman Problem(TSP)
graph attention model
Graph Neural Network(GNN)
Combinatorial Optimization(CO)
分类号
O22 [理学—运筹学与控制论]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于原型学习改进的伪标签半监督学习算法
被引量:
5
2
作者
杨雨龙
郭田德
韩丛英
机构
中国科学院大学数学科学学院
中国科学院大数据挖掘与知识管理重点实验室
出处
《中国科学院大学学报(中英文)》
CSCD
北大核心
2021年第6期841-851,共11页
基金
国家自然科学基金(11731013,U19B2040,11991022)
中国科学院战略性先导科技专项(XDA27000000)资助。
文摘
近年来,基于图像增广和一致性正则化的半监督学习(semi-supervised learning,SSL)方法被广泛应用并取得了很大的成功。然而,由于伪标签算法存在“认知偏误”问题,即模型的错误通过伪标签累积从而难以改正,因此很少有人关注基于伪标签(pseudo-labeling,PL)的半监督学习方法。提出一种特征图的原型图注意力特征修正模型(prototype attention layer,PAL):即在神经网络映射的特征空间上学习一个图注意力模型,将此模型应用于特征空间中,可以充分利用原型的信息来修正特征,将修正后的特征所产生的伪标签与原型分配产生的伪标签随机线性组合,从而得到新的伪标签。将这一模型应用到2种伪标签半监督学习框架上所得到的算法(prototype attention improved pseudo-labeling,PAIPL),在CIFAR-10和CIFAR-100的多个半监督分类问题上进行测试,分类准确率都得到了显著提升。特别地,将提出的修正模型应用于伪标签半监督学习PLCB框架时,又提出相互混合的监督技术,从而取得了更好的效果。还将提出的模型应用到其他多个伪标签半监督学习框架上,并在多个数据集上进行实验,验证了所提出的模型作为一个附加模块是普适且有效的。
关键词
半监督学习
伪标签
MixUp
图注意力模型
原型学习
Keywords
semi-supervised learning
pseudo-labeling
MixUp
graph attention model
prototype learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
深度强化学习结合图注意力模型求解TSP问题
王扬
陈智斌
杨笑笑
吴兆蕊
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2022
4
下载PDF
职称材料
2
基于原型学习改进的伪标签半监督学习算法
杨雨龙
郭田德
韩丛英
《中国科学院大学学报(中英文)》
CSCD
北大核心
2021
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部