检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到9篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种融合噪声网络的深度强化学习通信干扰资源分配算法被引量：1: 1; 作者彭翔许华 +2 位作者蒋磊饶宁宋佰霖《电子与信息学报》 EI CSCD 北大核心 2023年第3期1043-1054,共12页; 针对传统干扰资源分配算法在处理非线性组合优化问题时需要较完备的先验信息,同时决策维度小,无法满足现代通信对抗要求的问题,该文提出一种融合噪声网络的深度强化学习通信干扰资源分配算法(FNNDRL)。借鉴噪声网络的思想,该算法设计了... 展开更多; 关键词干扰资源分配深度强化学习噪声网络策略分布熵; 下载PDF 职称材料

一种通信对抗干扰资源分配智能决策算法被引量：9: 2; 作者许华宋佰霖 +2 位作者蒋磊饶宁史蕴豪《电子与信息学报》 EI CSCD 北大核心 2021年第11期3086-3095,共10页; 针对战场通信对抗智能决策问题,该文基于整体对抗思想提出一种基于自举专家轨迹分层强化学习的干扰资源分配决策算法(BHJM),算法针对跳频干扰决策难题,按照频点分布划分干扰频段,再基于分层强化学习模型分级决策干扰频段和干扰带宽,最... 展开更多; 关键词智能干扰决策分层强化学习干扰资源分配专家轨迹; 下载PDF 职称材料

一种基于深度强化学习的通信抗干扰智能决策方法被引量：10: 3; 作者宋佰霖许华 +1 位作者蒋磊饶宁《西北工业大学学报》 EI CAS CSCD 北大核心 2021年第3期641-649,共9页; 为解决战场通信智能抗干扰决策问题,设计了一种基于深度强化学习的通信抗干扰决策方法。该方法在DQN算法架构下引入经验回放和基于爬山策略(PHC)的动态ε机制,提出动态ε-DQN智能决策算法,该算法能够根据决策网络状态更优地选择ε值,提... 展开更多; 关键词通信抗干扰智能决策深度强化学习; 下载PDF 职称材料

一种基于深度强化学习的协同通信干扰决策算法被引量：3: 4; 作者宋佰霖许华 +2 位作者齐子森饶宁彭翔《电子学报》 EI CAS CSCD 北大核心 2022年第6期1301-1309,共9页; 针对协同电子战中跳频通信干扰协同决策难题,通过构建“整体优化、逐站决策”的协同决策模型,基于深度强化学习技术,设计了在Actor-Critic算法架构下融合优势函数的决策算法,并在奖励函数中嵌入专家激励机制以提高算法的探索能力,采用... 展开更多; 关键词深度强化学习通信干扰决策干扰资源分配优势函数专家激励; 下载PDF 职称材料

柱面共形阵列DOA与极化参数高效联合估计算法: 5; 作者齐子森彭大林 +1 位作者许华宋佰霖《空军工程大学学报（自然科学版）》 CSCD 北大核心 2021年第3期55-61,共7页; 针对共形阵列天线信源方位与极化状态联合估计算法计算量大的问题,给出了一种基于多级维纳滤波器前向递推的柱面共形阵列天线信源方位与极化参数高效联合估计算法。新算法推导了柱面共形阵列天线多级维纳滤波器的前向递推。算法以某一... 展开更多; 关键词柱面共形阵列天线联合估计 DOA 快速子空间估计; 下载PDF 职称材料

基于最大策略熵深度强化学习的通信干扰资源分配方法被引量：10: 6; 作者饶宁许华 +2 位作者齐子森宋佰霖史蕴豪《西北工业大学学报》 EI CAS CSCD 北大核心 2021年第5期1077-1086,共10页; 针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法。该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探... 展开更多; 关键词干扰资源分配深度强化学习最大策略熵神经网络; 下载PDF 职称材料

基于多智能体深度强化学习的分布式协同干扰功率分配算法被引量：4: 7; 作者饶宁许华 +2 位作者蒋磊宋佰霖史蕴豪《电子学报》 EI CAS CSCD 北大核心 2022年第6期1319-1330,共12页; 针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统... 展开更多; 关键词通信对抗协同功率分配多智能体深度强化学习分布式策略最大策略熵; 下载PDF 职称材料

融合有效方差置信上界的Q学习智能干扰决策算法被引量：2: 8; 作者饶宁许华宋佰霖《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2022年第5期162-170,共9页; 为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法。该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,... 展开更多; 关键词干扰决策强化学习有效方差置信上界 Q学习干扰动作剔除马尔科夫决策过程; 下载PDF 职称材料

融合动作剔除的深度竞争双Q网络智能干扰决策算法被引量：1: 9; 作者饶宁许华宋佰霖《空军工程大学学报（自然科学版）》 CSCD 北大核心 2021年第4期92-98,共7页; 为解决战场通信干扰决策问题,设计了一种融合动作剔除的深度竞争双Q网络智能干扰决策方法。该方法在深度双Q网络框架基础上采用竞争结构的神经网络决策最优干扰动作,并结合优势函数判断各干扰动作的相对优劣,在此基础上引入无效干扰动... 展开更多; 关键词干扰决策深度双Q网络竞争网络干扰动作剔除; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部