期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
煤矿采空区智能充填深度神经网络算法 被引量:1
1
作者 周忠斌 梁卫国 +1 位作者 郭凤岐 阎雾龙 《太原理工大学学报》 CAS 北大核心 2024年第2期223-230,共8页
【目的】采空区智能充填是煤炭资源绿色安全智能高效开采的重要方向,其关键在于对井下采空区矸石充填过程进行智能决策与控制。【方法】为实现该目标,以采空区充填后围岩应力及变形作为监测指标,建立了一种采空区智能充填深度神经网络算... 【目的】采空区智能充填是煤炭资源绿色安全智能高效开采的重要方向,其关键在于对井下采空区矸石充填过程进行智能决策与控制。【方法】为实现该目标,以采空区充填后围岩应力及变形作为监测指标,建立了一种采空区智能充填深度神经网络算法,该算法可以通过输入煤层埋深、厚度、工作面长度、直接顶厚度等关键基本参数,进行相应条件下不同充填方案的采场应力及围岩变形计算分析。将FLAC3D模拟400种不同条件下的充填开采结果作为数据集,对建立的智能充填深度神经网络算法进行训练测试,并和其余3种不同算法进行对比分析。【结果】结果表明:建立的智能充填深度神经网络算法总体优于随机森林、决策树和多元线性回归算法,每组数据运算平均速度仅为0.013 s;智能充填深度神经网络算法计算的顶板最大变形、工作面煤壁压力峰值、巷道超前支护距离等关键参数误差均值介于2%~8%之间;应用该算法针对现场实际条件进行测试,结果与现场实际结果基本吻合,表明该算法科学可行。【结论】本研究对煤矿绿色智能开采具有重要意义与价值。 展开更多
关键词 采空区充填 绿色开采 智能充填 深度神经网络算法
下载PDF
无人机高光谱遥感和集成深度置信神经网络算法用于密云水库水质参数反演
2
作者 乔智 姜群鸥 +1 位作者 律可心 高峰 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第7期2066-2074,共9页
随工业化及社会经济迅速发展,水源地面临的水体污染、恶化不断加剧,开展有效的水质监测是水源保护的重要前提。密云水库是北京重要的地表水源地,在保护首都水源安全方面发挥着重要作用。为更精准的监测密云水库水质参数及污染程度,采用... 随工业化及社会经济迅速发展,水源地面临的水体污染、恶化不断加剧,开展有效的水质监测是水源保护的重要前提。密云水库是北京重要的地表水源地,在保护首都水源安全方面发挥着重要作用。为更精准的监测密云水库水质参数及污染程度,采用4期无人机高光谱遥感数据,基于随机子空间的集成深度置信神经网络算法(EDBN),构建密云水库水质参数反演模型,对密云水库总氮(TN)、总磷(TP)两项水质参数进行反演。首先,采用基于递归特征消除法对高光谱影像降维处理,将光谱数据与地面水质监测数据进行叠加,通过最小化训练过程中误差来确定隐藏层数、神经节点数等网络结构参数;然后采用由知识源域向网络迁移方式逐步拓展网络,对密云水库总氮和总磷两个水质参数进行训练并对结果进行验证;最后,反演密云水库潮河大坝和白河大坝区域水质参数,揭示其主要水质参数时空演变规律。研究结果显示:(1)构建总氮、总磷反演模型R^(2)分别为0.8355、0.7703,MSE分别为0.0153、0.0008,这表明基于随机子空间的集成深度置信神经网络算法模型对密云水库水质参数反演效果较好;(2)密云水库总氮浓度变化随季节发生一定波动,在夏季浓度较低,秋季相对较高。总磷浓度变化相对平稳,表明密云水库周边区域对磷污染控制效果良好;(3)白河大坝区域水质优于潮河大坝区域,总氮浓度相对偏高,整体处于Ⅲ类水平。而总磷浓度较低,整体处于Ⅱ类水平,较好时可以达到Ⅰ类水平。整体水质可以满足饮用水源的标准,但仍需加强对氮、磷污染物有效监管。研究结果将为密云水库水质高效监测与水源保护提供重要科学依据。 展开更多
关键词 无人机高光谱 深度神经网络算法 水质反演 密云水库
下载PDF
基于双深度Q网络算法的多用户端对端能源共享机制研究
3
作者 武东昊 王国烽 +2 位作者 毛毳 陈玉萍 张有兵 《高技术通讯》 CAS 北大核心 2024年第7期755-764,共10页
端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷... 端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷变动问题。为此,本文建立了一种以多类型用户为基础的多用户P2P能源社区交易模型,并引入基于双深度Q网络(DDQN)的强化学习(RL)算法对其进行求解。所提方法通过DDQN算法中的预测网络以及目标网络读取多用户P2P能源社区中的环境信息,训练后的神经网络可通过实时的光伏、负荷以及电价数据对当前社区内的多用户P2P交易问题进行求解。案例仿真结果表明,所提方法在促进社区内用户间P2P能源交易共享的同时,保证了多用户P2P能源社区的经济性。 展开更多
关键词 端对端(P2P)能源共享 强化学习(RL) 能源交易市场 深度Q网络(DDQN)算法
下载PDF
基于深度学习算法的无线通信网络入侵路径辨识
4
作者 杜慧珺 王安洋 +2 位作者 刘越 董洋 袁传新 《无线互联科技》 2024年第15期39-41,共3页
由于不同类型的入侵攻击意图差异,在网络中的入侵路径也存在明显的不同,为此,文章提出了基于深度学习算法的无线通信网络入侵路径辨识研究。以入侵意图为基础,将具有相同行为的攻击进行交集计算后,建立以入侵意图为中心的网络入侵行为... 由于不同类型的入侵攻击意图差异,在网络中的入侵路径也存在明显的不同,为此,文章提出了基于深度学习算法的无线通信网络入侵路径辨识研究。以入侵意图为基础,将具有相同行为的攻击进行交集计算后,建立以入侵意图为中心的网络入侵行为聚类。对于存在交叉关系的入侵,利用网络入侵行为的节点分布概率进行细分。在入侵路径辨识阶段,引入灰色深度神经网络算法,在隐含层计算入侵意图。结合无线通信网络节点与当前入侵行为所处节点之间的欧氏距离,将对应聚类的最小欧氏距离节点作为入侵路径下一节点的辨识结果,循环上述操作,实现对整体入侵路径的辨识。在测试结果中,整体入侵路径覆盖节点对于辨识结果并未产生影响,能够实现对入侵路径的100%准确辨识。 展开更多
关键词 深度学习算法 无线通信网络 入侵行为聚类 灰色深度神经网络算法
下载PDF
基于深度置信网络算法的面向铁磁材料旋转磁滞损耗的矢量磁滞模型 被引量:1
5
作者 马阳阳 李永建 +2 位作者 孙鹤 杨明 窦润田 《电工技术学报》 EI CSCD 北大核心 2023年第15期4063-4075,共13页
铁磁材料磁滞建模是电气工程领域的基础性理论研究之一。该文基于深度置信网络(DBN)算法结合磁滞算子空间理论提出一种矢量磁滞模型。在模型结构中,引入郎之万函数作为映射函数对磁滞数据进行输入转换计算。利用多个磁滞算子构建算子空... 铁磁材料磁滞建模是电气工程领域的基础性理论研究之一。该文基于深度置信网络(DBN)算法结合磁滞算子空间理论提出一种矢量磁滞模型。在模型结构中,引入郎之万函数作为映射函数对磁滞数据进行输入转换计算。利用多个磁滞算子构建算子空间生成高维算子数据,算子空间的数据输出作为DBN模型的输入,结合DBN算法表征算子数据与模型输出的非线性关系。利用样本的磁感应强度数据和生成的算子数据训练模型,获得模型参数。通过仿真表明构建的模型可以有效地描述铁磁材料在旋转磁化情况下的非线性特性和各项异性。同时,结合磁损分离理论改进磁损模型中相应的损耗系数,构建动态磁损计算模型,并将磁滞模型获得的数据应用于动态损耗计算。仿真表明,构建的磁滞模型可以有效地表征铁磁材料的实际磁化特性和损耗情况。 展开更多
关键词 磁滞模型 深度置信网络算法 磁滞算子 磁滞损耗
下载PDF
基于联合增强图像对的红外可见光深度展开图像融合网络
6
作者 袁天蕙 干宗良 《计算机科学》 CSCD 北大核心 2024年第10期311-319,共9页
受到采集环境的影响,红外可见光融合图像有时会存在亮度不足、细节信息不够的问题。为此,提出了一种基于联合增强图像对的红外可见光深度展开图像融合网络,同时将原始红外-可见光图像对和红外-可见光图像增强对作为输入,提高网络信息融... 受到采集环境的影响,红外可见光融合图像有时会存在亮度不足、细节信息不够的问题。为此,提出了一种基于联合增强图像对的红外可见光深度展开图像融合网络,同时将原始红外-可见光图像对和红外-可见光图像增强对作为输入,提高网络信息融合能力。文中首先提出了一种残差展开模块,在此基础上构建了基于迭代的残差展开卷积网络用于特征提取,使其根据不同的初始化参数提取对应图像的背景和细节信息。此外,在特征融合卷积融合网络中引入了维度拼接操作和上下采样卷积块,实现联合红外-可见光图像增强对的特性汇聚,最大限度地保留源图像的差异特征。同时,优化了损失函数权重设计,以获得最佳的融合结果。在多个数据库上进行了大量实验,结果表明,与现有典型的融合方法相比,所提算法的融合图像在主观视觉和客观指标评价上均具有较好性能,在暗照度环境下优于其他方法。 展开更多
关键词 图像融合 深度算法展开网络 图像增强 特征提取 特征融合
下载PDF
基于多重检测的复杂网络监控场景目标跟踪算法研究
7
作者 屈宏伟 《信息技术与信息化》 2024年第10期40-43,共4页
铁塔视联业务正在数字镇街治理中发挥越来越大的作用。针对目前复杂网络监控场景中单一双目视觉相机监控存在目标对象遮挡不佳等问题,提出适用于小范围区域的相机与雷达融合的图像目标跟踪检测方案。首先,基于激光雷达的扇形区域内目标... 铁塔视联业务正在数字镇街治理中发挥越来越大的作用。针对目前复杂网络监控场景中单一双目视觉相机监控存在目标对象遮挡不佳等问题,提出适用于小范围区域的相机与雷达融合的图像目标跟踪检测方案。首先,基于激光雷达的扇形区域内目标反射信号探测原理,监测与输出多目标位置数据和动态噪点信息;然后,使用卡尔曼滤波算法剔除虚假的干扰噪声信号,对周期内动态目标状态进行更新,同时基于可视摄像机拍摄动态目标,将相机坐标系下的图像转换为世界坐标系对应的位置图像;最后,采用YOLOv5对灰度化处理后的融合图像目标进行检测识别。实验结果表明,基于YOLOv5深度学习算法的目标跟踪检测准确率为95%左右,可满足公共空间场域下运动目标的检测识别需求。 展开更多
关键词 多重检测 复杂网络监控 YOLOv5深度神经网络算法 目标跟踪
下载PDF
基于Im2col的并行深度卷积神经网络优化算法 被引量:9
8
作者 胡健 龚克 +2 位作者 毛伊敏 陈志刚 陈亮 《计算机应用研究》 CSCD 北大核心 2022年第10期2950-2956,2961,共8页
针对大数据环境下并行深度卷积神经网络(DCNN)算法中存在数据冗余特征多、卷积层运算速度慢、损失函数收敛性差等问题,提出了一种基于Im2col方法的并行深度卷积神经网络优化算法IA-PDCNNOA。首先,提出基于Marr-Hildreth算子的并行特征... 针对大数据环境下并行深度卷积神经网络(DCNN)算法中存在数据冗余特征多、卷积层运算速度慢、损失函数收敛性差等问题,提出了一种基于Im2col方法的并行深度卷积神经网络优化算法IA-PDCNNOA。首先,提出基于Marr-Hildreth算子的并行特征提取策略MHO-PFES,提取数据中的目标特征作为卷积神经网络的输入,有效避免了数据冗余特征多的问题;其次,设计基于Im2col方法的并行模型训练策略IM-PMTS,通过设计马氏距离中心值去除冗余卷积核,并结合MapReduce和Im2col方法并行训练模型,提高了卷积层运算速度;最后提出改进的小批量梯度下降策略IM-BGDS,排除异常节点的训练数据对批梯度的影响,解决了损失函数收敛性差的问题。实验结果表明,IA-PDCNNOA算法在大数据环境下进行深度卷积神经网络计算具有较好的性能表现,适用于大规模数据集的并行化深度卷积神经网络模型训练。 展开更多
关键词 大数据 深度卷积神经网络算法 并行计算 特征提取 图像分类
下载PDF
深度神经网络算法研究及应用
9
作者 刘念 王枫 《科技资讯》 2017年第27期243-243,245,共2页
深度神经网络通过低层特征组合从而形成高层特征,以此来找出数据分布特征形式,深度神经网络同时也是人工智能研究领域的重点。伴随计算机技术发展以及数字设备数量增长,数据以非常快的速度增长,如何对快速增长的数据进行有效利用并且挖... 深度神经网络通过低层特征组合从而形成高层特征,以此来找出数据分布特征形式,深度神经网络同时也是人工智能研究领域的重点。伴随计算机技术发展以及数字设备数量增长,数据以非常快的速度增长,如何对快速增长的数据进行有效利用并且挖掘其价值,是面对海量数据需要思考的问题。本文就深度神经网络算法研究及应用做简要阐述。 展开更多
关键词 深度神经网络算法 研究 应用
下载PDF
基于多新息理论的深度信念网络算法 被引量:5
10
作者 李萌 秦品乐 李传朋 《计算机应用》 CSCD 北大核心 2016年第9期2521-2525,2534,共6页
针对深度信念网络(DBN)算法在采用反向传播修正网络的连接权值和偏置的过程中,容易产生梯度小、学习率低、误差收敛速度慢等问题,提出一种结合多新息理论对标准DBN算法进行改进的算法,即多新息DBN(MIDBN)。MI-DBN算法是对标准DBN算法中... 针对深度信念网络(DBN)算法在采用反向传播修正网络的连接权值和偏置的过程中,容易产生梯度小、学习率低、误差收敛速度慢等问题,提出一种结合多新息理论对标准DBN算法进行改进的算法,即多新息DBN(MIDBN)。MI-DBN算法是对标准DBN算法中反向传播的过程重新建模,使得算法在原先只利用单个新息的情况下,扩展为能够充分利用之前多个周期的新息,从而大幅提高误差收敛速度。通过实验对MI-DBN算法和其他分类算法进行了数据集分类的比较,实验结果表明,MI-DBN算法相较其他分类算法,其误差收敛速度较快,而且最终对MNIST数据集和Caltech101数据集的识别中误差结果相对更小。 展开更多
关键词 深度信念网络算法 误差收敛速度 多新息理论 反向传播
下载PDF
基于改进竞争深度Q网络算法的微电网能量管理与优化策略 被引量:16
11
作者 黎海涛 申保晨 +3 位作者 杨艳红 裴玮 吕鑫 韩雨庭 《电力系统自动化》 EI CSCD 北大核心 2022年第7期42-49,共8页
可再生能源发电的随机波动性和储能运行控制的时间序列耦合特性给微电网的能量管理与最优运行带来了诸多挑战,成为学术界研究的热点问题。文中提出一种基于改进竞争深度Q网络算法的微电网能量管理与优化方法,采用多参数动作探索机制和... 可再生能源发电的随机波动性和储能运行控制的时间序列耦合特性给微电网的能量管理与最优运行带来了诸多挑战,成为学术界研究的热点问题。文中提出一种基于改进竞争深度Q网络算法的微电网能量管理与优化方法,采用多参数动作探索机制和优化设计的神经网络结构,对分布式可再生能源的功率输出、能源交易市场的电价和电力负荷的状态等环境信息进行学习,并运用学习到的策略进行微电网能量管理与优化。仿真结果表明,基于改进竞争深度Q网络算法的微电网能量管理与优化策略的性能优于基于场景的随机规划算法、深度Q网络算法和竞争深度Q网络算法。 展开更多
关键词 微电网 能量管理 深度强化学习 竞争深度Q网络算法 神经网络结构 多参数动作探索机制
下载PDF
基于改进DQN强化学习算法的弹性光网络资源分配研究 被引量:2
12
作者 尚晓凯 韩龙龙 翟慧鹏 《光通信技术》 2023年第5期12-15,共4页
针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现... 针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现了最优的动作值函数,并较好地解决了路由与频谱分配问题。此外,采用了不同的经验池取样方法,以提高迭代训练的收敛速度。仿真结果表明:改进DQN强化学习算法不仅能够使弹性光网络训练模型快速收敛,当业务量为300 Erlang时,比DQN算法频谱资源利用率提高了10.09%,阻塞率降低了12.41%,平均访问时延减少了1.27 ms。 展开更多
关键词 弹性光网络 改进深度Q网络强化学习算法 资源分配
下载PDF
深度学习神经网络在火电厂阀门故障诊断与预警中的应用 被引量:1
13
作者 周传杰 王嘉琪 +1 位作者 马运保 杜伟 《科技风》 2023年第20期4-7,59,共5页
针对燃煤发电机组的重要执行机构阀门,通过深度神经网络算法对机组大量运行数据进行学习,构建重要执行机构阀门在全负荷工况下的精准数学模型,以深度神经网络模型预测值和皮尔逊相关系数判别为依据,实现重要执行机构阀门的故障诊断和早... 针对燃煤发电机组的重要执行机构阀门,通过深度神经网络算法对机组大量运行数据进行学习,构建重要执行机构阀门在全负荷工况下的精准数学模型,以深度神经网络模型预测值和皮尔逊相关系数判别为依据,实现重要执行机构阀门的故障诊断和早期预警。结果表明,基于大数据,学习和深度神经网络算法的数学模型有效地实现了对执行机构阀门的故障诊断和提前预警,指导运行人员进行提前干预和检修,减少机组的故障率。执行机构阀门故障预警的深度神经网络模型以执行机构阀门前的相关DCS参数、系统主要运行参数作为模型的输入变量;以执行机构阀门之后的参数作为输出量。选择机组在不同负荷工况下,执行机构阀门系统从打开到关闭的完整时间段内的大量数据,作为深度神经网络模型的训练数据。该方法具有较强的通用性,可以方便地平行移植至火电机组的其他重要辅机设备中。皮尔逊相关系数能反映数据变化的趋势信息,能判断两个向量或者两个数组相似度。以皮尔逊相关系数作为深度神经网络模型预测输出值与系统实际输出偏差距离的判据,可以很好地解决系统发生偏离后的预警问题,有效地提高模型预测的精度。 展开更多
关键词 深度神经网络算法 皮尔逊相关系数 执行机构阀门故障预警 多维度距离偏差监测 大数据分析
下载PDF
深度强化学习驱动下的智能电网通信网业务路由分配方法研究
14
作者 胡楠 张维 《通信电源技术》 2024年第10期43-45,共3页
在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析... 在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析,以提高通信资源利用率,提升业务路由方法的稳定性和可靠性。 展开更多
关键词 智能电网 通信网 深度Q网络(DQN)算法 异步优势演员-评论家(A3C)算法 深度学习
下载PDF
梯级水库深度强化学习长期随机优化调度研究 被引量:1
15
作者 李文武 周佳妮 +1 位作者 裴本林 张一凡 《水力发电学报》 CSCD 北大核心 2023年第11期21-32,共12页
梯级水库调度相较于单库调度状态空间呈指数级增大,为解决基于表格的强化学习方法在解决梯级水库长期随机优化调度问题时面临的维数灾问题,提出采用深度强化学习中的深度Q网络算法求解。首先基于Copula函数分析梯级水库随机入库径流的... 梯级水库调度相较于单库调度状态空间呈指数级增大,为解决基于表格的强化学习方法在解决梯级水库长期随机优化调度问题时面临的维数灾问题,提出采用深度强化学习中的深度Q网络算法求解。首先基于Copula函数分析梯级水库随机入库径流的联合分布函数;再根据时序差分思想分别建立目标神经网络和主神经网络,分别逼近当前和下一状态对应的动作状态价值,并采用ε-贪婪探索利用策略获取最优调度策略;最后将主要参数分步调优保障调度效益。算例对比表明,深度Q网络算法相较于Q学习算法及其改进算法提升了优化调度目标值,加快收敛速度,有效解决了梯级水库随机优化调度中的维数灾问题. 展开更多
关键词 梯级水库随机优化调度 深度强化学习 深度Q网络算法 时序差分思想 探索利用策略
下载PDF
基于深度强化学习的云制造产品配置
16
作者 童晓薇 刘艳斌 《湖北理工学院学报》 2023年第6期46-51,共6页
针对云制造环境下供应商加入退出、制造成本变动等因素导致的传统产品配置方法不适用的问题,提出了一种以全过程服务质量最大化为目标的产品配置建模方法,建立了适应动态变化的云制造环境的产品配置模型。文章将云制造产品配置问题视为... 针对云制造环境下供应商加入退出、制造成本变动等因素导致的传统产品配置方法不适用的问题,提出了一种以全过程服务质量最大化为目标的产品配置建模方法,建立了适应动态变化的云制造环境的产品配置模型。文章将云制造产品配置问题视为马尔可夫决策过程,阐明了面向产品配置优化问题的智能体、环境、动作、奖励、转移等强化学习关键概念,设计了基于深度Q网络的产品配置优化求解算法。轮式装载机产品配置仿真实验表明,基于深度强化学习的云制造产品配置方法的模型全局奖励值接近且收敛于理论奖励值上限,很好地适应了云制造环境的动态变化特征。 展开更多
关键词 产品配置 云制造 强化学习 深度Q网络算法
下载PDF
基于DQN的旋翼无人机着陆控制算法 被引量:2
17
作者 唐进 梁彦刚 +1 位作者 白志会 黎克波 《系统工程与电子技术》 EI CSCD 北大核心 2023年第5期1451-1460,共10页
针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法。利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自主着陆控制。首先,基于随机过程理论,将旋翼无人机的着陆控制问题转化... 针对无人机的着陆控制问题,研究了一种基于深度强化学习理论的旋翼无人机着陆控制算法。利用深度强化学习训练生成无人机智能体,根据观测结果给出动作指令,以实现自主着陆控制。首先,基于随机过程理论,将旋翼无人机的着陆控制问题转化为马尔可夫决策过程。其次,设计分别考虑无人机横向和纵向控制过程的奖励函数,将着陆控制问题转入强化学习框架。然后,采用深度Q网络(deep Q network,DQN)算法求解该强化学习问题,通过大量训练得到着陆控制智能体。最后,通过多种工况下的着陆平台进行大量的数值模拟和仿真分析,验证了算法的有效性。 展开更多
关键词 深度强化学习 马尔可夫决策过程 深度Q网络算法 旋翼无人机 着陆控制
下载PDF
基于改进DQN算法的机器人路径规划 被引量:4
18
作者 李奇儒 耿霞 《计算机工程》 CAS CSCD 北大核心 2023年第12期111-120,共10页
传统深度Q网络(DQN)算法通过融合深度神经网络和强化学习方法,解决了Q-learning算法在应对复杂环境时出现的维数灾难问题,被广泛应用于移动机器人的路径规划,但传统DQN算法的网络收敛速度较慢,路径规划效果较差,难以在较少的训练回合内... 传统深度Q网络(DQN)算法通过融合深度神经网络和强化学习方法,解决了Q-learning算法在应对复杂环境时出现的维数灾难问题,被广泛应用于移动机器人的路径规划,但传统DQN算法的网络收敛速度较慢,路径规划效果较差,难以在较少的训练回合内获取最优路径。为了解决上述问题,提出一种改进的ERDQN算法。通过记录重复状态出现的频率,利用该频率重新计算Q值,使得在网络训练的过程中一种状态重复出现的次数越多,下一次出现该状态的概率越低,从而提高机器人对环境的探索能力,在一定程度上降低了网络收敛于局部最优的风险,减少了网络收敛的训练回合。根据机器人移动方向和机器人与目标点的距离,重新设计奖励函数。机器人在靠近目标点时能够获得正奖励,远离目标点时能够获得负奖励,并通过当前机器人的移动方向和机器人与目标点的距离调整奖励的绝对值,从而使机器人能够在避开障碍物的前提下规划出更优路径。实验结果表明,与DQN算法相比,ERDQN算法的平均得分提高了18.9%,规划出的路径长度和回合数减少了约20.1%和500。上述结果证明了ERDQN算法能够有效提高网络收敛速度及路径规划性能。 展开更多
关键词 深度Q网络算法 路径规划 深度强化学习 状态探索 奖励函数 避障
下载PDF
基于深度强化学习的暂态稳定紧急控制决策方法 被引量:5
19
作者 李宏浩 张沛 刘曌 《电力系统自动化》 EI CSCD 北大核心 2023年第5期144-152,共9页
随着广域测量系统在暂态稳定控制中的应用,广域信息的随机性时滞造成了系统受控时状态的不确定性,并且切机和切负荷控制的离散决策变量维度极高,电网在线紧急控制决策面临着挑战。为此,将暂态稳定紧急控制问题建模为马尔可夫决策问题,... 随着广域测量系统在暂态稳定控制中的应用,广域信息的随机性时滞造成了系统受控时状态的不确定性,并且切机和切负荷控制的离散决策变量维度极高,电网在线紧急控制决策面临着挑战。为此,将暂态稳定紧急控制问题建模为马尔可夫决策问题,提出一种深度Q网络(DQN)强化学习与暂态能量函数相结合的紧急控制决策方法,多步序贯决策过程中可应对紧急控制的时滞不确定性影响。奖励函数以考虑控制目标和约束条件的短期奖励函数和考虑稳定性的长期奖励函数构成,并在奖励函数中引入暂态能量函数的势能指数来提高学习效率。以最大化累计奖励为目标,通过DQN算法在离散化动作空间中学习得到最优紧急控制策略,解决暂态稳定紧急控制问题。所提方法通过IEEE 39节点系统验证了模型在紧急控制决策中的有效性。 展开更多
关键词 深度强化学习 暂态稳定 紧急控制决策 暂态能量函数 深度Q网络(DQN)算法 时滞
下载PDF
基于深度强化学习的多阶段信息物理协同拓扑攻击方法 被引量:1
20
作者 伊娜 徐建军 +1 位作者 陈月 孙迪康 《电力工程技术》 北大核心 2023年第4期149-158,共10页
随着智能电网的发展及通信设备不断引入到信息物理系统(cyber physical system,CPS)中,CPS正面临一种破坏性更强的新型攻击方式——信息物理协同攻击(coordinated cyber physical attack,CCPA),其隐蔽性与威胁性易导致系统出现级联故障... 随着智能电网的发展及通信设备不断引入到信息物理系统(cyber physical system,CPS)中,CPS正面临一种破坏性更强的新型攻击方式——信息物理协同攻击(coordinated cyber physical attack,CCPA),其隐蔽性与威胁性易导致系统出现级联故障。首先,基于攻击者的视角,提出一种多阶段信息物理协同拓扑攻击模型,单阶段的物理攻击使线路中断,双阶段的网络攻击分别用来掩盖物理攻击的断开线路和制造一条新的虚假断开线路。其次,结合深度强化学习(deep reinforcement learning,DRL)理论,提出一种基于深度Q网络(deep Q-network,DQN)的最小攻击资源确定方法。然后,给出攻击者考虑上层最大化物理攻击效果和下层最小化攻击代价的具体模型及求解方法。最后,以IEEE 30节点系统为例,验证了所提多阶段攻击模型的有效性。仿真结果表明,多阶段信息物理协同拓扑攻击较单一攻击更加隐蔽且有效,对电网的破坏程度更大,为防御此类攻击提供了参考。 展开更多
关键词 信息物理系统(CPS) 信息物理协同攻击(CCPA) 拓扑攻击 负荷重分配攻击 深度强化学习(DRL) 深度Q网络(DQN)算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部