期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
频分多址系统分布式强化学习功率控制方法
1
作者 李烨 司轲 《计算机应用研究》 CSCD 北大核心 2023年第12期3772-3777,共6页
近年来,深度强化学习作为一种无模型的资源分配方法被用于解决无线网络中的同信道干扰问题。然而,基于常规经验回放策略的网络难以学习到有价值的经验,导致收敛速度较慢;而人工划定探索步长的方式没有考虑算法在每个训练周期上的学习情... 近年来,深度强化学习作为一种无模型的资源分配方法被用于解决无线网络中的同信道干扰问题。然而,基于常规经验回放策略的网络难以学习到有价值的经验,导致收敛速度较慢;而人工划定探索步长的方式没有考虑算法在每个训练周期上的学习情况,使得对环境的探索存在盲目性,限制了系统频谱效率的提升。对此,提出一种频分多址系统的分布式强化学习功率控制方法,采用优先经验回放策略,鼓励智能体从环境中学习更重要的数据,以加速学习过程;并且设计了一种适用于分布式强化学习、动态调整步长的探索策略,使智能体得以根据自身学习情况探索本地环境,减少人为设定步长带来的盲目性。实验结果表明,相比于现有算法,所提方法加快了收敛速度,提高了移动场景下的同信道干扰抑制能力,在大型网络中具有更高的性能。 展开更多
关键词 分布式强化学习 频分多址系统 功率控制 贪心策略 优先经验回放 动态步长调整
下载PDF
基于ISSA-BP神经网络的滑坡区输电铁塔状态预测模型 被引量:2
2
作者 李梦源 董瑞科 +2 位作者 王彦海 周冬阳 邹梦健 《电子测量技术》 北大核心 2023年第11期74-82,共9页
滑坡区输电铁塔基础发生位移时,会导致铁塔的最大位移及杆件所受最大应力发生变化,建立铁塔状态预测模型可得到铁塔的最大位移及杆件所受最大应力变化趋势,进而预防灾害事故的发生。提出一种改进麻雀搜索算法优化BP神经网络的预测模型,... 滑坡区输电铁塔基础发生位移时,会导致铁塔的最大位移及杆件所受最大应力发生变化,建立铁塔状态预测模型可得到铁塔的最大位移及杆件所受最大应力变化趋势,进而预防灾害事故的发生。提出一种改进麻雀搜索算法优化BP神经网络的预测模型,首先利用Sin混沌序列与步长因子动态调整策略对麻雀搜索算法进行优化,其次用优化后的模型对BP神经网络的权值及阈值进行参数寻优,得到预测模型。将铁塔基础在XYZ方向的位移值作为预测模型的输入量,得到铁塔最大位移值及铁塔杆件最大应力的预测值。本预测模型较BP神经网络模型相比,方根误差RSME值最高下降了63.4%,平均相对误差MAPE值最高下降了60.4%,绝对值平均绝对误差MAE值最高下降了62.6%,同时本文预测模型预测值符合真实值的变化趋势,综上本预测模型能较准确地预测输电铁塔运行状态,为其安全运行提供有力保障。 展开更多
关键词 滑坡区输电铁塔 BP神经网络 麻雀搜索算法 步长因子动态调整
下载PDF
复杂环境下改进APF的机器人路径规划 被引量:3
3
作者 卢恩超 张万绪 《计算机工程与应用》 CSCD 2013年第24期45-48,共4页
针对移动机器人在有大型障碍物和运动空间相对狭窄的复杂环境中,人工势场法(APF)容易出现反复震荡、路径规划时间较长以及大型障碍物附近避障困难的问题,提出了在结合边缘探测法的APF路径规划基础上,加入自适应动态步长调整算法来克服AP... 针对移动机器人在有大型障碍物和运动空间相对狭窄的复杂环境中,人工势场法(APF)容易出现反复震荡、路径规划时间较长以及大型障碍物附近避障困难的问题,提出了在结合边缘探测法的APF路径规划基础上,加入自适应动态步长调整算法来克服APF的上述缺陷,实现移动机器人在复杂环境下的平滑路径规划,在确保路径近似最优的同时提高APF算法的收敛速度和路经规划的避障性能。实验结果证明了上述方法的有效性。 展开更多
关键词 人工势场法 路径规划 边缘探测 自适应动态步长调整
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部