期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于双延迟深度确定性策略梯度的综合能源微网运行优化
1
作者 谢启跃 应雨龙 《济南大学学报(自然科学版)》 CAS 北大核心 2022年第3期301-307,共7页
为了满足综合能源微网运行优化及能量管理的需求,提出基于双延迟深度确定性策略梯度算法的综合能源微网运行优化方法;基于标准化矩阵建模理论,构建一个含冷、热、电供应的综合能源微网数学模型;考虑到综合能源微网中天然气、主电网供电... 为了满足综合能源微网运行优化及能量管理的需求,提出基于双延迟深度确定性策略梯度算法的综合能源微网运行优化方法;基于标准化矩阵建模理论,构建一个含冷、热、电供应的综合能源微网数学模型;考虑到综合能源微网中天然气、主电网供电等相关约束和电力价格的变化,提出以运行成本最小化为目标的双延迟深度确定性策略梯度算法,对各种能源设备的出力情况作出决策,形成合理的能源分配管理方案。仿真结果表明,所提出方法的性能优于非线性算法、深度Q网络算法和深度确定性策略梯度算法,在确保运行成本最小化的同时计算耗时较短。 展开更多
关键词 综合能源微网 运行优化 延迟深度确定性策略梯度 强化学习
下载PDF
基于双字符搜索的GRASP-CSP算法改进
2
作者 李珊珊 郑晨 朱平 《计算机应用与软件》 CSCD 2016年第2期203-207,258,共6页
距离最近字符串问题CSP(The Closest String Problem)是一个组合优化问题,在生物信息学和编码理论中有着很重要的应用。关于CSP问题采用一种基于概率启发式的算法,即GRASP-CSP算法。针对GRASP-CSP算法存在的每次迭代过程相对独立、搜索... 距离最近字符串问题CSP(The Closest String Problem)是一个组合优化问题,在生物信息学和编码理论中有着很重要的应用。关于CSP问题采用一种基于概率启发式的算法,即GRASP-CSP算法。针对GRASP-CSP算法存在的每次迭代过程相对独立、搜索范围狭窄、判断指标过于单一这三大问题,提出通过强化策略,引入强Pareto优化的概念,特别是扩展局部搜索范围,对GRASPCSP进行进一步的优化。最后,给出基于GRASP-CSP改进之后的新算法,即IGRASP-CSP。实验结果表明,改进之后的新算法能够进一步缩小字符解与给定字符串集的汉明距离,从而得到关于CSP问题的进一步优化解,获得满意的优化效果,并从一维的应用扩展至多维。 展开更多
关键词 CSP GRASP pareto优化强化策略双字符
下载PDF
面向多目标柔性作业车间调度的强化学习NSGA-II算法 被引量:23
3
作者 尹爱军 闫文涛 张厚望 《重庆大学学报》 CAS CSCD 北大核心 2022年第10期113-123,共11页
针对非支配排序遗传算法(NSGA-II,non-dominated sorting genetic algorithm II)在求解柔性作业车间多目标优化调度问题中多样性不足、易于早熟与局部收敛的缺点,提出一种基于强化学习的改进NSGA-II算法(RLNSGA-II,reinforcement learni... 针对非支配排序遗传算法(NSGA-II,non-dominated sorting genetic algorithm II)在求解柔性作业车间多目标优化调度问题中多样性不足、易于早熟与局部收敛的缺点,提出一种基于强化学习的改进NSGA-II算法(RLNSGA-II,reinforcement learning non-dominated sorting genetic algorithm II)。为避免NSGA-II陷入局部收敛问题引入双种群进化策略,利用性别判定法将种群拆分为两个种群,并在进化过程中采用不同的交叉变异算子,增加算法的局部和全局搜索能力;为解决NSGA-II精英策略造成多样性不足的问题,融合多个多样性度量指标,利用强化学习动态优化种群迭代过程中的拆分比例参数以保持多样性,改善算法收敛性能。最后通过Kacem标准算例进行了仿真实验与性能分析,验证了RLNSGA-II的有效性与优越性。 展开更多
关键词 多目标优化 柔性作业车间调度 非支配排序遗传算法 种群进化策略 多样性度量 强化学习
下载PDF
基于近端策略优化和广义状态相关探索算法的双连续搅拌反应釜系统跟踪控制
4
作者 史洪岩 付国城 潘多涛 《信息与控制》 CSCD 北大核心 2023年第3期343-351,共9页
连续搅拌反应釜(continuous stirring tank reactor,CSTR)是经典的化工设备,被广泛应用于化工过程。由于其具有较强的非线性和时滞性,传统的控制方法无法满足其跟踪控制的精度要求。针对连续搅拌反应釜提出一种基于广义状态相关探索(gen... 连续搅拌反应釜(continuous stirring tank reactor,CSTR)是经典的化工设备,被广泛应用于化工过程。由于其具有较强的非线性和时滞性,传统的控制方法无法满足其跟踪控制的精度要求。针对连续搅拌反应釜提出一种基于广义状态相关探索(generalized state-dependent exploration,gSDE)的近端策略优化(proximal policy optimization,PPO)算法的跟踪控制方法。首先使用机理模型模拟真实环境与PPO智能体进行交互;其次利用gSDE使每个回合的探索更稳定且方差更小,同时保证了探索的效果;最后通过增加反馈奖励的方式,解决环境稀疏奖励的问题,使得智能体学会如何对CSTR进行跟踪控制。将该算法应用于双CSTR系统进行测试。仿真结果表明,该算法对复杂非线性系统的跟踪控制具有训练过程平稳、控制误差小、对干扰的反应迅速等优势。 展开更多
关键词 连续搅拌反应釜 深度强化学习 非线性系统 近端策略优化算法 广义状态相关探索
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部