-
题名基于近端策略优化的智能抗干扰决策算法
- 1
-
-
作者
马松
李黎
黎伟
黄巍
王军
-
机构
中国西南电子技术研究所
电子科技大学通信抗干扰全国重点实验室
中国西南电子设备研究所
-
出处
《通信学报》
EI
CSCD
北大核心
2024年第8期249-257,共9页
-
基金
国家自然科学基金资助项目(No.62131005,No.62071096)。
-
文摘
针对现有基于深度强化学习的智能抗干扰方法应用于天地测控通信链路时,用于决策的深度神经网络结构复杂,卫星等飞行器资源受限,难以在有限的复杂度约束下独立完成复杂神经网络的及时训练,抗干扰决策无法收敛的问题,提出了一种基于近端策略优化的智能抗干扰决策算法。分别在飞行器和地面站部署决策神经网络和训练神经网络,地面站根据飞行器反馈的经验信息进行最优化离线训练,辅助决策神经网络进行参数更新,在满足飞行器资源约束的同时实现有效的抗干扰策略选择。仿真结果表明,与基于策略梯度和基于深度Q学习的决策算法相比,所提算法收敛速度提升37%,收敛后的系统容量提升25%。
-
关键词
近端策略优化
深度强化学习
智能抗干扰
抗干扰决策
-
Keywords
proximal policy optimization
deep reinforcement learning
intelligent anti-jamming
anti-jamming decision
-
分类号
TN92
[电子电信—通信与信息系统]
-
-
题名面向异构传输需求的多无人机通信协同抗干扰决策方法
- 2
-
-
作者
姚昌华
巫刚
李家强
祁博宇
苏婷
刘鑫
付澍
-
机构
南京信息工程大学电子与信息工程学院
海南大学信息与通信工程学院
桂林理工大学信息科学与工程学院
重庆大学微电子与通信工程学院
-
出处
《电讯技术》
北大核心
2024年第7期1015-1024,共10页
-
基金
国家自然科学基金资助项目(61971439,U22B2002)
通信抗干扰全国重点实验室基础科研创新基金(稳定支持)项目(IFN20230207)。
-
文摘
干扰条件下的多无人机通信中,用户根据业务有不同的通信需求,而各个信道质量也不同,对抗干扰通信决策提出了业务需求与资源匹配的新要求。针对外部对抗性干扰场景下,多个用户如何选择适合的信道和功率,在干扰躲避、内部冲突控制以及功率优化的同时实现有限资源的高效利用这一问题进行研究,提出了一种面向传输需求匹配的抗干扰决策方法。首先,利用部分重叠信道的特性进行信道资源复用;然后,运用多用户协同强化学习训练用户信道选择策略,并使用斯坦伯格博弈对功率进行优化,实现对用户异构传输需求进行资源匹配。所提方法能实现干扰条件下的多用户异构传输需求的信道和功率联合优化,提升资源利用合理性,实现传输效果的提升。
-
关键词
多无人机通信
协同抗干扰决策
用户需求匹配
强化学习
斯坦伯格博弈
-
Keywords
multi-UAV communication
collaborative anti-jamming decision-making
user demand matching
reinforcement learning
Stackelberg game
-
分类号
TN975
[电子电信—信号与信息处理]
-
-
题名战术跳频系统智能抗干扰决策
被引量:4
- 3
-
-
作者
王瑞东
张彦龙
魏鹏
王世练
张炜
-
机构
国防科技大学电子科学学院
中国人民解放军
国防科技大学第六十三研究所
-
出处
《信号处理》
CSCD
北大核心
2023年第1期84-95,共12页
-
基金
国家自然科学基金(62171445)。
-
文摘
作为一种有效的抗干扰方法,跳频(Frequency hopping, FH)技术已被广泛应用于战术通信系统来提高在强对抗环境下军事通信网络的可靠性。跳频通信网络面临的主要威胁是具有灵敏的频谱侦察和频率捷变能力的跟踪干扰机。为提高战术跳频通信系统在跟踪干扰攻击环境中的抗脆性和吞吐量,本文提出了一种基于双深度Q网络(Double deep Q-network, DDQN)的功率和跳速联合抗干扰决策方法。该算法将战术电台发射机与跟踪干扰机之间的对抗建模为马尔可夫决策过程(Markov decision process, MDP),其中干扰器通过调整频谱扫描速率提高干扰效能,战术电台终端则将接收状态反馈信息作为算法输入,根据决策网络的输出调整数据传输的发射功率和跳频速率。该算法模型在未知环境状态和干扰参数的情况下,通过与环境的交互学习更新网络参数,逐渐收敛于最佳功率和跳速联合控制策略,以使跳频通信系统的平均吞吐量最大化。仿真结果表明,相比传统的无模型抗干扰方法,本文所提算法在跟踪干扰环境下能够更有效改善跳频系统的抗干扰性能。
-
关键词
战术跳频系统
跟踪干扰
深度强化学习
抗干扰决策
-
Keywords
tactical frequency-hopping system
follower jamming
deep reinforcement learning
anti-jamming strategy
-
分类号
TN971
[电子电信—信号与信息处理]
-
-
题名基于离线学习的无人机网络抗干扰通信方案
- 4
-
-
作者
唐韬
赵润晖
冯学炜
石伟宏
文红
彭钰琳
-
机构
电子科技大学航空航天学院
电子科技大学飞行器集群智能感知与协同控制四川省重点实验室
电子科技大学四川省智慧物联通信技术工程研究中心
-
出处
《通信技术》
2024年第5期495-499,共5页
-
基金
国家自然科学基金(U23B2021,62201132)。
-
文摘
无人机面临先进干扰技术的挑战,易受恶意节点攻击、数据截取和篡改,传统的抗干扰决策存在一定局限,无法根据干扰信号的变化进行自适应调整,而基于深度强化学习(Deep Reinforcement Learning,DRL)的抗干扰通信模型需要长时间与环境交互,对抗干扰的环境要求较高。研究了基于Decision Transformer的离线抗干扰方法,其能快速稳定地获得实用的抗干扰决策模型。仿真试验验证了该算法在加性高斯白噪声信道和衰落信道环境下抗干扰决策的有效性,且该离线方案在训练迭代次数较少时便能达到预期奖励目标。
-
关键词
无人机
抗干扰决策
深度强化学习
Decision
Transformer
-
Keywords
UAV
anti-interference decision
deep reinforcement learning
Decision Transformer
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
TN975
[电子电信—信号与信息处理]
-
-
题名基于深度强化学习的通信抗干扰系统
- 5
-
-
作者
冯学炜
文红
唐韬
石伟宏
赵润晖
彭钰琳
-
机构
电子科技大学航空航天学院
电子科技大学飞行器集群智能感知与协同控制四川省重点实验室
电子科技大学四川省智慧物联通信技术工程研究中心
-
出处
《通信技术》
2024年第6期563-568,共6页
-
基金
国家自然科学基金(U23B2021,62201132)。
-
文摘
由于电磁信道的开放特征,存在恶意节点对正常数据流实施干扰,阻止合法接收者获得信息,进而截获并篡改数据,因此针对通信抗干扰的研究非常重要。传统的抗干扰方法采用单一抗干扰方式,并不能根据环境自适应改变抗干扰策略,因此难以在复杂通信环境中达到较好的抗干扰效果。为应对这些挑战,研究了基于深度强化学习(Deep Reinforcement Learning,DRL)的抗干扰通信模型,并搭建仿真系统,利用DRL算法实现智能抗干扰决策。仿真结果表明,提出的智能抗干扰决策能够在复杂环境下根据环境选择最优抗干扰方案,有效提升通信质量。
-
关键词
通信抗干扰
抗干扰决策
深度强化学习
衰落信道
-
Keywords
communication anti-jamming
anti-jamming decision-making
deep reinforcement learning
fading channel
-
分类号
TN975
[电子电信—信号与信息处理]
-
-
题名基于强化学习的雷达多域抗干扰策略生成技术
- 6
-
-
作者
张连炜
董阳阳
李明
王贤铧
董春曦
苏欣桐
-
机构
西安电子科技大学电子工程学院
中国电子信息产业集团有限公司国营第七二二厂
-
出处
《电子信息对抗技术》
2024年第6期1-5,共5页
-
基金
国家自然科学基金资助项目(61901332)。
-
文摘
雷达抗干扰能力的高低决定了其在复杂电磁环境下是否能正常完成探测、跟踪、制导等工作。针对雷达抗干扰问题,提出了基于强化学习的多域抗干扰策略生成技术。该方法通过对时域、频域、空间域和极化域进行优选,建立多域联合的雷达干扰-抗干扰规则库。通过强化学习得到动作价值矩阵,确定抗干扰策略,在极大降低后续决策复杂度的同时更能贴近战场情况,克服了强化学习算法难以适应大状态空间的问题。实验结果表明,与传统单一域的抗干扰决策相比,此方法可以较为准确地进行决策。
-
关键词
雷达抗干扰
模板匹配
强化学习
抗干扰决策
-
Keywords
radar anti-interference
template matching
reinforcement learning
anti-jamming decision-making
-
分类号
TN973
[电子电信—信号与信息处理]
-
-
题名雷达智能博弈抗干扰技术综述与展望
被引量:13
- 7
-
-
作者
李康
纠博
赵宇
刘宏伟
-
机构
西安电子科技大学信息感知集成攻关研究院
西安电子科技大学雷达信号处理全国重点实验室
-
出处
《现代雷达》
CSCD
北大核心
2023年第5期15-26,共12页
-
基金
国家自然科学基金资助项目(62201429,62192714)
高等学校学科创新引智计划(B18039)
+1 种基金
中央高校基本科研业务费专项资金资助项目(QTZX22160,XJSJ23133)
雷达信号处理国家级重点实验室支持计划项目(KGJ202X0X)。
-
文摘
随着认知电子战技术的发展,干扰机电磁对抗能力大幅提升,为有效对抗智能化干扰机,雷达需采取智能博弈抗干扰技术。文中围绕雷达智能博弈抗干扰技术发展现状,从相关理论基础、干扰感知、智能抗干扰策略学习方法、雷达/干扰博弈抗干扰方法梳理相关技术原理和代表性工作,并进一步分析了该领域的发展趋势,为后续理论研究提供必要参考。
-
关键词
电磁对抗
智能博弈抗干扰技术
干扰感知
雷达抗干扰决策
认知电子战
-
Keywords
electromagnetic countermeasure
intelligent game⁃based anti⁃jamming technology
interference perception
radar anti⁃jamming decision⁃making
cognitive electronic warfare
-
分类号
TN973
[电子电信—信号与信息处理]
-
-
题名雷达低截获波形抗主瓣干扰技术研究与试验
被引量:4
- 8
-
-
作者
晏艺翡
苏军海
李英军
-
机构
中国电子科技集团公司第二十研究所
-
出处
《火控雷达技术》
2021年第2期31-35,共5页
-
文摘
针对雷达面临灵巧多样的强主瓣干扰这一严峻问题,以提高雷达抗主瓣干扰性能的紧迫性为需求,基于多域联合捷变波形设计的抗干扰思想,提出了一整套基于干扰环境感知和低截获波形调度的抗主瓣干扰雷达设计方法。经过充分的仿真验证及方案论证,从时域、频域、空域、极化域四个维度对单站抗干扰技术进行了梳理,并从多域联合处理的角度,着重分析了复合捷变波形对抗干扰的优势、波形设计准则及其相参处理方法;同时搭建试验环境,进行了多种主瓣干扰环境下的目标跟踪试验,验证了该技术的有效性。
-
关键词
低截获波形
主瓣抗干扰
多域联合捷变
干扰感知
抗干扰决策
-
Keywords
Low-acquisition wave
main lobe anti-interference
multi-domain agility
perception of interference
anti-interference decision making
-
分类号
TN95
[电子电信—信号与信息处理]
-