期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于最大策略熵深度强化学习的通信干扰资源分配方法
被引量:
12
1
作者
饶宁
许华
+2 位作者
齐子森
宋佰霖
史蕴豪
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2021年第5期1077-1086,共10页
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法。该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探...
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法。该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探索性加速收敛至全局最优。该方法将干扰资源分配建模为马尔可夫决策过程,通过建立干扰策略网络输出分配方案,构建剪枝孪生结构的干扰效果评估网络完成方案效能评估,以策略熵最大化和累积干扰效能最大化为目标训练策略网络和评估网络,决策干扰资源最优分配方案。仿真结果表明,所提出的方法能有效解决组网对抗中的干扰资源分配问题,且相比于已有的深度强化学习方法具有学习速度更快,训练过程波动性更小等优点,干扰效能高出DDPG方法15%。
展开更多
关键词
干扰资源分配
深度强化学习
最大策略熵
神经网络
下载PDF
职称材料
基于多智能体深度强化学习的分布式协同干扰功率分配算法
被引量:
9
2
作者
饶宁
许华
+2 位作者
蒋磊
宋佰霖
史蕴豪
《电子学报》
EI
CAS
CSCD
北大核心
2022年第6期1319-1330,共12页
针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统...
针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统环境非平稳、决策维度高的问题,减少智能体之间的通信开销,并加入最大策略熵准则控制各智能体的探索效率,以最大化累积干扰奖励和最大化干扰策略熵为优化目标,加速各智能体间协同策略的学习.仿真结果表明,所提出的分布式算法能有效解决高维协同干扰功率分配难题,相比于已有的集中式分配算法具有学习速度更快、波动性更小等优点,且相同条件下干扰效率可高出集中式算法16.8%.
展开更多
关键词
通信对抗
协同功率分配
多智能体深度强化学习
分布式
策略
最大策略熵
下载PDF
职称材料
题名
基于最大策略熵深度强化学习的通信干扰资源分配方法
被引量:
12
1
作者
饶宁
许华
齐子森
宋佰霖
史蕴豪
机构
空军工程大学信息与导航学院
出处
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2021年第5期1077-1086,共10页
基金
国家自然科学基金(61601500)资助。
文摘
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法。该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探索性加速收敛至全局最优。该方法将干扰资源分配建模为马尔可夫决策过程,通过建立干扰策略网络输出分配方案,构建剪枝孪生结构的干扰效果评估网络完成方案效能评估,以策略熵最大化和累积干扰效能最大化为目标训练策略网络和评估网络,决策干扰资源最优分配方案。仿真结果表明,所提出的方法能有效解决组网对抗中的干扰资源分配问题,且相比于已有的深度强化学习方法具有学习速度更快,训练过程波动性更小等优点,干扰效能高出DDPG方法15%。
关键词
干扰资源分配
深度强化学习
最大策略熵
神经网络
Keywords
interference resource allocation
deep reinforcement learning
maximum policy entropy
deep neural network
分类号
TN975 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
基于多智能体深度强化学习的分布式协同干扰功率分配算法
被引量:
9
2
作者
饶宁
许华
蒋磊
宋佰霖
史蕴豪
机构
空军工程大学信息与导航学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2022年第6期1319-1330,共12页
文摘
针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统环境非平稳、决策维度高的问题,减少智能体之间的通信开销,并加入最大策略熵准则控制各智能体的探索效率,以最大化累积干扰奖励和最大化干扰策略熵为优化目标,加速各智能体间协同策略的学习.仿真结果表明,所提出的分布式算法能有效解决高维协同干扰功率分配难题,相比于已有的集中式分配算法具有学习速度更快、波动性更小等优点,且相同条件下干扰效率可高出集中式算法16.8%.
关键词
通信对抗
协同功率分配
多智能体深度强化学习
分布式
策略
最大策略熵
Keywords
communication countermeasures
cooperative resource allocation
multi-agent deep reinforcement learning
distributed strategy
maximum policy entropy
分类号
TN975 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于最大策略熵深度强化学习的通信干扰资源分配方法
饶宁
许华
齐子森
宋佰霖
史蕴豪
《西北工业大学学报》
EI
CAS
CSCD
北大核心
2021
12
下载PDF
职称材料
2
基于多智能体深度强化学习的分布式协同干扰功率分配算法
饶宁
许华
蒋磊
宋佰霖
史蕴豪
《电子学报》
EI
CAS
CSCD
北大核心
2022
9
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部