期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种融合噪声网络的深度强化学习通信干扰资源分配算法
被引量:
3
1
作者
彭翔
许华
+2 位作者
蒋磊
饶宁
宋佰霖
《电子与信息学报》
EI
CSCD
北大核心
2023年第3期1043-1054,共12页
针对传统干扰资源分配算法在处理非线性组合优化问题时需要较完备的先验信息,同时决策维度小,无法满足现代通信对抗要求的问题,该文提出一种融合噪声网络的深度强化学习通信干扰资源分配算法(FNNDRL)。借鉴噪声网络的思想,该算法设计了...
针对传统干扰资源分配算法在处理非线性组合优化问题时需要较完备的先验信息,同时决策维度小,无法满足现代通信对抗要求的问题,该文提出一种融合噪声网络的深度强化学习通信干扰资源分配算法(FNNDRL)。借鉴噪声网络的思想,该算法设计了孪生噪声评估网络,在避免Q值高估的基础上,通过提升评估网络的随机性,保证了训练过程的探索性;基于概率熵的物理意义,设计了基于策略分布熵改进的策略网络损失函数,在最大化累计奖励的同时最大化策略分布熵,避免策略优化过程中收敛到局部最优。仿真结果表明,该算法在解决干扰资源分配问题时优于所对比的平均分配和强化学习方法,同时算法稳定性较高,对高维决策空间适应性强。
展开更多
关键词
干扰资源分配
深度强化学习
噪声网络
策略分布熵
下载PDF
职称材料
基于可迁移强化学习的断面输电极限计算方法
被引量:
1
2
作者
李康文
邱高
+3 位作者
刘挺坚
刘友波
刘俊勇
丁理杰
《电网技术》
EI
CSCD
北大核心
2023年第12期5147-5157,共11页
断面输电极限是电网安全边界在断面割集的降维投影,其实质是考虑电压无功优化和多类稳定约束的复杂混合整数非凸非线性问题,而新能源的引入进一步扩大了其计算维度,传统方法难以求解。为此,提出一种基于可迁移强化学习的断面输电极限计...
断面输电极限是电网安全边界在断面割集的降维投影,其实质是考虑电压无功优化和多类稳定约束的复杂混合整数非凸非线性问题,而新能源的引入进一步扩大了其计算维度,传统方法难以求解。为此,提出一种基于可迁移强化学习的断面输电极限计算方法。首先,考虑暂态功角及电压稳定约束,计及包括电容器组等无功资源,建立含微分代数方程的输电极限混合整数计算模型;然后,将该模型转化为混合整数的马尔科夫决策过程,提出基于混合Categorical分布的近端策略优化求解方法;最后,引入策略分布熵最大化目标,确保智能计算模型在未见运行方式下的迁移能力,实现运行方式或边界条件切换下的输电极限快速分析。IEEE39节点系统的算例结果表明,相比传统元启发式黑盒优化算法,所提方法在几乎不牺牲精度的前提下效率提升了97.15%。
展开更多
关键词
输电极限
无功优化
可迁移强化学习
近端
策略
优化
策略分布熵
下载PDF
职称材料
题名
一种融合噪声网络的深度强化学习通信干扰资源分配算法
被引量:
3
1
作者
彭翔
许华
蒋磊
饶宁
宋佰霖
机构
空军工程大学信息与导航学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第3期1043-1054,共12页
文摘
针对传统干扰资源分配算法在处理非线性组合优化问题时需要较完备的先验信息,同时决策维度小,无法满足现代通信对抗要求的问题,该文提出一种融合噪声网络的深度强化学习通信干扰资源分配算法(FNNDRL)。借鉴噪声网络的思想,该算法设计了孪生噪声评估网络,在避免Q值高估的基础上,通过提升评估网络的随机性,保证了训练过程的探索性;基于概率熵的物理意义,设计了基于策略分布熵改进的策略网络损失函数,在最大化累计奖励的同时最大化策略分布熵,避免策略优化过程中收敛到局部最优。仿真结果表明,该算法在解决干扰资源分配问题时优于所对比的平均分配和强化学习方法,同时算法稳定性较高,对高维决策空间适应性强。
关键词
干扰资源分配
深度强化学习
噪声网络
策略分布熵
Keywords
Jamming resource allocation
Deep Reinforcement Learning(DRL)
Noise network
Entropy of strategy distribution
分类号
TN975 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
基于可迁移强化学习的断面输电极限计算方法
被引量:
1
2
作者
李康文
邱高
刘挺坚
刘友波
刘俊勇
丁理杰
机构
四川大学电气工程学院
国网四川省电力科学研究院
出处
《电网技术》
EI
CSCD
北大核心
2023年第12期5147-5157,共11页
基金
国家自然科学基金资助项目(52307124)
中央高校基本科研业务费专项资金资助项目(YJ2021162)
四川省科技厅项目(2021LDTD0016-LH)。
文摘
断面输电极限是电网安全边界在断面割集的降维投影,其实质是考虑电压无功优化和多类稳定约束的复杂混合整数非凸非线性问题,而新能源的引入进一步扩大了其计算维度,传统方法难以求解。为此,提出一种基于可迁移强化学习的断面输电极限计算方法。首先,考虑暂态功角及电压稳定约束,计及包括电容器组等无功资源,建立含微分代数方程的输电极限混合整数计算模型;然后,将该模型转化为混合整数的马尔科夫决策过程,提出基于混合Categorical分布的近端策略优化求解方法;最后,引入策略分布熵最大化目标,确保智能计算模型在未见运行方式下的迁移能力,实现运行方式或边界条件切换下的输电极限快速分析。IEEE39节点系统的算例结果表明,相比传统元启发式黑盒优化算法,所提方法在几乎不牺牲精度的前提下效率提升了97.15%。
关键词
输电极限
无功优化
可迁移强化学习
近端
策略
优化
策略分布熵
Keywords
transmission limit
reactive power optimization
transferable reinforcement learning
proximal policy optimization
policy distribution entropy
分类号
TM721 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种融合噪声网络的深度强化学习通信干扰资源分配算法
彭翔
许华
蒋磊
饶宁
宋佰霖
《电子与信息学报》
EI
CSCD
北大核心
2023
3
下载PDF
职称材料
2
基于可迁移强化学习的断面输电极限计算方法
李康文
邱高
刘挺坚
刘友波
刘俊勇
丁理杰
《电网技术》
EI
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部