期刊文献+
共找到283篇文章
< 1 2 15 >
每页显示 20 50 100
Deep Reinforcement Learning Solves Job-shop Scheduling Problems
1
作者 Anjiang Cai Yangfan Yu Manman Zhao 《Instrumentation》 2024年第1期88-100,共13页
To solve the sparse reward problem of job-shop scheduling by deep reinforcement learning,a deep reinforcement learning framework considering sparse reward problem is proposed.The job shop scheduling problem is transfo... To solve the sparse reward problem of job-shop scheduling by deep reinforcement learning,a deep reinforcement learning framework considering sparse reward problem is proposed.The job shop scheduling problem is transformed into Markov decision process,and six state features are designed to improve the state feature representation by using two-way scheduling method,including four state features that distinguish the optimal action and two state features that are related to the learning goal.An extended variant of graph isomorphic network GIN++is used to encode disjunction graphs to improve the performance and generalization ability of the model.Through iterative greedy algorithm,random strategy is generated as the initial strategy,and the action with the maximum information gain is selected to expand it to optimize the exploration ability of Actor-Critic algorithm.Through validation of the trained policy model on multiple public test data sets and comparison with other advanced DRL methods and scheduling rules,the proposed method reduces the minimum average gap by 3.49%,5.31%and 4.16%,respectively,compared with the priority rule-based method,and 5.34%compared with the learning-based method.11.97%and 5.02%,effectively improving the accuracy of DRL to solve the approximate solution of JSSP minimum completion time. 展开更多
关键词 job shop scheduling problems deep reinforcement learning state characteristics policy network
下载PDF
Wind Turbine Optimal Preventive Maintenance Scheduling Using Fibonacci Search and Genetic Algorithm
2
作者 Ekamdeep Singh Sajad Saraygord Afshari Xihui Liang 《Journal of Dynamics, Monitoring and Diagnostics》 2023年第3期157-169,共13页
Maintenance scheduling is essential and crucial for wind turbines (WTs) to avoid breakdowns andreduce maintenance costs. Many maintenance models have been developed for WTs’ maintenance planning, suchas corrective, p... Maintenance scheduling is essential and crucial for wind turbines (WTs) to avoid breakdowns andreduce maintenance costs. Many maintenance models have been developed for WTs’ maintenance planning, suchas corrective, preventive, and predictive maintenance. Due to communities’ dependence on WTs for electricityneeds, preventive maintenance is the most widely used method for maintenance scheduling. The downside tousing this approach is that preventive maintenance (PM) is often done in fixed intervals, which is inefficient. In thispaper, a more detailed maintenance plan for a 2 MW WT has been developed. The paper’s focus is to minimize aWT’s maintenance cost based on a WT’s reliability model. This study uses a two-layer optimization framework:Fibonacci and genetic algorithm. The first layer in the optimization method (Fibonacci) finds the optimal numberof PM required for the system. In the second layer, the optimal times for preventative maintenance and optimalcomponents to maintain have been determined to minimize maintenance costs. The Monte Carlo simulationestimates WT component failure times using their lifetime distributions from the reliability model. The estimatedfailure times are then used to determine the overall corrective and PM costs during the system’s lifetime. Finally,an optimal PM schedule is proposed for a 2 MW WT using the presented method. The method used in this papercan be expanded to a wind farm or similar engineering systems. 展开更多
关键词 cost-based maintenance scheduling genetic algorithm hierarchical optimization preventive maintenance reliability modeling wind turbine maintenance policy
下载PDF
混合数据的多集群系统中数据价值与信息年龄的联合优化
3
作者 罗佳 陈前斌 唐伦 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第1期308-316,共9页
信息年龄(AoI)是一种业界新兴的时间相关指标,其经常用于评估接收数据的新鲜度。该文考虑了一个视频数据与环境数据混合的多集群视频直播系统,并制定调度策略以联合优化系统数据价值与信息年龄。为克服优化问题中动作空间过大导致难以... 信息年龄(AoI)是一种业界新兴的时间相关指标,其经常用于评估接收数据的新鲜度。该文考虑了一个视频数据与环境数据混合的多集群视频直播系统,并制定调度策略以联合优化系统数据价值与信息年龄。为克服优化问题中动作空间过大导致难以实现有效求解的问题,该文将优化问题的调度策略分解为相互关联的内外两层策略,外层策略利用深度强化学习实现集群间的信道分配,内层策略则基于构造的虚拟队列实现集群内的链路选择。双层调度策略将每个集群的内层策略嵌入到外层策略中进行训练,仿真结果显示,与现有调度策略相比,该文所提的调度策略可以提高时间平均的接收数据价值并降低时间平均的信息年龄。 展开更多
关键词 信息年龄 数据价值 视频直播系统 深度强化学习 调度策略
下载PDF
到达时间服从泊松分布的平行机队列的最优随机排序问题
4
作者 王艳红 雷松泽 +1 位作者 张文娟 李蕊 《计算机与数字工程》 2024年第2期403-405,422,共4页
论文考虑多个分布下,根据每类加工时间函数最小化目标函数的不同类别的随机排序问题。这个问题常出现在分布式系统、网络和应用程序方面。模型中,最优排序策略在每台机器上是一个简单的静态优先策略。在这种排序策略下,排序问题可以寻... 论文考虑多个分布下,根据每类加工时间函数最小化目标函数的不同类别的随机排序问题。这个问题常出现在分布式系统、网络和应用程序方面。模型中,最优排序策略在每台机器上是一个简单的静态优先策略。在这种排序策略下,排序问题可以寻找到最佳路径矩阵。考虑一个非线性规划问题,证明了任何局部最优即为全局最优,大大简化了,优化问题的解决方案。在到达时间为泊松分布的情形下,论文提供了一个最佳的排序策略,能够最小化每类时间函数。对一般各种静态实例应用此方法,可得到简单的近似算法。 展开更多
关键词 泊松分布 随机排序 静态优先策略 非线性规划
下载PDF
计及灵活性资源的综合能源系统源荷协调优化调度
5
作者 胡福年 张彭成 +1 位作者 周小博 陈军 《中国电力》 CSCD 北大核心 2024年第5期2-13,共12页
可再生能源和负荷的波动性、不确定性等给综合能源系统(integrated energy system,IES)的安全灵活运行带来了极大挑战。为提高IES灵活调节能力与可再生能源消纳水平,提出一种计及灵活性资源的IES源荷协调优化调度方法。针对系统内运行... 可再生能源和负荷的波动性、不确定性等给综合能源系统(integrated energy system,IES)的安全灵活运行带来了极大挑战。为提高IES灵活调节能力与可再生能源消纳水平,提出一种计及灵活性资源的IES源荷协调优化调度方法。针对系统内运行灵活性需求,精细刻画各类资源灵活性能力,源侧根据电氢耦合单元运行特性构建热电联产机组(combined heating and power,CHP)和氢燃料电池(hydrogen fuel cell,HFC)联合运行模型,荷侧考虑综合需求响应的灵活性供给能力,建立系统综合灵活性供给模型。根据不同时刻运行灵活性不足问题分成2种调度模式,构建基于IES灵活性约束的优化调度模型,并进行仿真分析。仿真结果表明,所提出的优化调度方法能够有效提高IES灵活调节能力和可再生能源消纳水平。 展开更多
关键词 综合能源系统 需求侧灵活性 灵活性供需平衡 源荷协调 调度策略
下载PDF
基于策略梯度的WRSN公平能量补充方案
6
作者 叶健锋 《现代电子技术》 北大核心 2024年第1期30-35,共6页
无线可充电传感网络(WRSN)中节点能耗是动态变化的,在调度移动充电器(MC)为传感器充电时,估算节点的实时能耗来计算节点的剩余生存时间十分重要。针对WRSN的问题,提出一种基于策略梯度的公平能量补充策略(PFSS),利用过往的节点能量记录... 无线可充电传感网络(WRSN)中节点能耗是动态变化的,在调度移动充电器(MC)为传感器充电时,估算节点的实时能耗来计算节点的剩余生存时间十分重要。针对WRSN的问题,提出一种基于策略梯度的公平能量补充策略(PFSS),利用过往的节点能量记录对节点实时能耗进行估算,采用seq2seq结合Attention的网络结构求解待充电序列,为节点充电获得一个充电权重来评估该次充电的质量,其由MC到节点间的距离、节点等待时间和节点剩余生存时间组成,利用策略梯度对网络进行训练,从而求得具有最优充电质量的充电序列近似解,仿真结果表明,与现有的算法相比,PFSS能够有效降低网络中传感器节点失效数量、MC的移动成本和充电延迟。 展开更多
关键词 无线可充电传感网络 充电调度 响应公平 注意力机制 seq2seq 强化学习 策略梯度 失效率
下载PDF
基于DDPG算法的离网型可再生能源大规模制氢系统优化调度
7
作者 郑庆明 井延伟 +2 位作者 梁涛 柴露露 吕梁年 《综合智慧能源》 CAS 2024年第6期35-43,共9页
为提高可再生能源消纳能力,减少整流和并网等设备的投资成本,降低电解水制氢系统成本,实现可再生能源大规模制氢,构建了一个孤岛型可再生能源大规模制氢系统。该系统通过智慧能量管理,实现了提高系统经济性与安全性的目标。首先建立可... 为提高可再生能源消纳能力,减少整流和并网等设备的投资成本,降低电解水制氢系统成本,实现可再生能源大规模制氢,构建了一个孤岛型可再生能源大规模制氢系统。该系统通过智慧能量管理,实现了提高系统经济性与安全性的目标。首先建立可再生能源大规模制氢系统的仿真模型,制定控制策略;其次,提出一种基于深度确定性策略梯度(DDPG)的能量优化调度策略。通过大量长期的训练,使用DDPG算法得到的智能体能够实现智能化的动态能量优化调度。将该策略与深度Q网络、粒子群优化和传统控制方法在经济性和安全性方面进行比较,结果表明DDPG算法在能量优化管理中可实现更高的经济收益,更好地利用可再生资源,并确保系统的安全运行。 展开更多
关键词 可再生能源 大规模制氢 离网型 深度确定性策略梯度 优化调度
下载PDF
Study on scheduling algorithm for multiple handling requests of single automated guided vehicles 被引量:4
8
作者 陆远 Feng Kuikui Hu Ying 《High Technology Letters》 EI CAS 2019年第3期334-339,共6页
To solve the problem of small amount of machining centers in small and medium flexible manufacture systems(FMS), a scheduling mode of single automated guided vehicle(AGV) is adopted to deal with multiple transport req... To solve the problem of small amount of machining centers in small and medium flexible manufacture systems(FMS), a scheduling mode of single automated guided vehicle(AGV) is adopted to deal with multiple transport requests in this paper. Firstly, a workshop scheduling mechanism of AGV is analyzed and a mathematical model is established using Genetic Algorithm. According to several sets of transport priority of AGV, processes of FMS are encoded, and fitness function, selection, crossover, and variation methods are designed. The transport priority which has the least impact on scheduling results is determined based on the simulation analysis of Genetic Algorithm, and the makespan, the longest waiting time, and optimal route of the car are calculated. According to the actual processing situation of the workshop, feasibility of this method is verified successfully to provide an effective solution to the scheduling problem of single AGV. 展开更多
关键词 automated GUIDED vehicle(AGV) flexible manufacturing scheduling policy MAKESPAN genetic algorithm PRIORITY
下载PDF
Edge-Cloud Collaborative Optimization Scheduling with Micro-Service Architecture
9
作者 Qiuyan Liu Jiajun Li +3 位作者 Huazhang Lv Zhonghao Zhang Mingxuan Li Yi Feng 《Journal of Computer and Communications》 2019年第10期94-104,共11页
The architecture of edge-cloud cooperation is proposed as a compromising solution that combines the advantage of MEC and central cloud. In this paper we investigated the problem of how to reduce the average delay of M... The architecture of edge-cloud cooperation is proposed as a compromising solution that combines the advantage of MEC and central cloud. In this paper we investigated the problem of how to reduce the average delay of MEC application by collaborative task scheduling. The collaborative task scheduling is modeled as a constrained shortest path problem over an acyclic graph. By characterizing the optimal solution, the constrained optimization problem is simplified according to one-climb theory and enumeration algorithm. Generally, the edge-cloud collaborative task scheduling scheme performance better than independent scheme in reducing average delay. In heavy workload scenario, high blocking probability and retransmission delay at MEC is the key factor for average delay. Hence, more task executed on central cloud with abundant resource is the optimal scheme. Otherwise, transmission delay is inevitable compared with execution delay. MEC configured with higher priority and deployed close to terminals obtain more performance gain. 展开更多
关键词 Edge-Cloud COLLABORATION Micro-Service schedulING policy MARKOV Process
下载PDF
2021年黄河秋汛洪水处理策略与实践 被引量:2
10
作者 苏茂林 魏向阳 李保国 《人民黄河》 CAS 北大核心 2023年第1期56-60,共5页
受罕见华西秋雨影响,2021年黄河中下游发生了严重的秋汛洪水。面对汛情,黄河水利委员会按照“系统、统筹、科学、安全”的原则,以全面均衡洪水蓄泄空间、合理共担洪水风险为调度理念,通过精细化调度水工程,将花园口站2次流量在10 000 m^... 受罕见华西秋雨影响,2021年黄河中下游发生了严重的秋汛洪水。面对汛情,黄河水利委员会按照“系统、统筹、科学、安全”的原则,以全面均衡洪水蓄泄空间、合理共担洪水风险为调度理念,通过精细化调度水工程,将花园口站2次流量在10 000 m^(3)/s以上的洪水削减至4 800 m^(3)/s左右,成功抗御了此次秋汛洪水。秋汛期间没有发生重大险情、重大灾情、人员伤亡,保证了洪水安澜入海,避免了下游滩区140万人转移和26.6万hm^(2)耕地受淹,保障了下游滩区人民群众生命财产安全。通过简述2021年黄河秋汛洪水调度情况,总结了此次洪水处理策略,提出了对于做好秋汛洪水调度防御的认识。 展开更多
关键词 秋汛洪水 洪水处理 调度策略 调度理念 黄河
下载PDF
基于深度强化学习的无人机辅助移动边缘计算系统能耗优化 被引量:3
11
作者 张广驰 何梓楠 崔苗 《电子与信息学报》 EI CSCD 北大核心 2023年第5期1635-1643,共9页
近年来,部署搭载有移动边缘计算(MEC)服务器的无人机(UAVs)为地面用户提供计算资源已成为一种新兴的技术。针对无人机辅助多用户移动边缘计算系统,该文构建了以最小化用户平均能耗为目标的模型,联合优化无人机的飞行轨迹和用户计算策略... 近年来,部署搭载有移动边缘计算(MEC)服务器的无人机(UAVs)为地面用户提供计算资源已成为一种新兴的技术。针对无人机辅助多用户移动边缘计算系统,该文构建了以最小化用户平均能耗为目标的模型,联合优化无人机的飞行轨迹和用户计算策略的调度。通过深度强化学习(DRL)求解能耗优化问题,提出基于柔性参与者-评论者(SAC)的优化算法。该算法应用最大熵的思想来探索最优策略并使用高效迭代更新获得最优策略,通过保留所有高回报值的策略,增强算法的探索能力,提高训练过程的收敛速度。仿真结果表明与已有算法相比,所提算法能有效降低用户的平均能耗,并具有很好的稳定性和收敛性。 展开更多
关键词 无人机通信 深度强化学习 移动边缘计算 轨迹规划 调度策略
下载PDF
需求不确定下低碳多式联运路径鲁棒优化 被引量:1
12
作者 邓明君 代玉珍 李响 《工业工程》 北大核心 2023年第4期104-113,共10页
基于需求不确定和碳交易政策,为使多式联运经营人能制定低碳高效的运输方案,综合考虑铁路、水路班期和收货时间窗的约束,采用鲁棒优化描述需求不确定,构建以经济成本最小为目标的多式联运路径鲁棒优化模型,使用遗传算法检验模型的合理... 基于需求不确定和碳交易政策,为使多式联运经营人能制定低碳高效的运输方案,综合考虑铁路、水路班期和收货时间窗的约束,采用鲁棒优化描述需求不确定,构建以经济成本最小为目标的多式联运路径鲁棒优化模型,使用遗传算法检验模型的合理性和有效性.结果表明,铁路、水路的班期约束会产生等待时间进而产生等待成本;需求不确定的鲁棒优化不仅会增加19%的经济成本,而且在运输方式的选取上更偏向于低碳运输;多式联运经营人通过权衡最大遗憾值和经济成本之间的关系,使得其既能轻松处理货运市场的需求波动,又能响应低碳要求. 展开更多
关键词 多式联运 碳交易政策 需求不确定 班期 鲁棒优化
下载PDF
基于多任务强化学习的堆垛机调度与库位推荐
13
作者 饶东宁 罗南岳 《计算机工程》 CAS CSCD 北大核心 2023年第2期279-287,295,共10页
堆垛机调度是物流仓储自动化中的重要任务,任务中的出入库效率、货物存放等情况影响仓储系统的整体效益。传统调度方法在面对较大规模调度问题时,因处理大状态空间从而导致性能受限和收益降低。与此同时,库位优化与调度运行联系密切,但... 堆垛机调度是物流仓储自动化中的重要任务,任务中的出入库效率、货物存放等情况影响仓储系统的整体效益。传统调度方法在面对较大规模调度问题时,因处理大状态空间从而导致性能受限和收益降低。与此同时,库位优化与调度运行联系密切,但现有多数工作在处理调度问题时未能考虑到库位优化问题。为解决仓储中堆垛机调度问题,提出一种基于深度强化学习算法的近端策略优化调度方法。将调度问题视为序列决策问题,通过智能体与环境的持续交互进行自我学习,以在不断变化的环境中优化调度。针对调度中伴生的库位优化问题,提出一种基于多任务学习的调度、库位推荐联合算法,并基于调度网络构建适用于库位推荐的Actor网络,通过与Critic网络进行交互反馈,促进整体的联动和训练,从而提升整体效益。实验结果表明,与原算法模型相比,该调度方法的累计回报值指标平均提升了33.6%,所提的多任务学习的联合算法能有效地应对堆垛机调度和库位优化的应用场景,可为该类多任务问题提供可行的解决方案。 展开更多
关键词 堆垛机调度 库位优化 多任务学习 深度强化学习 近端策略优化
下载PDF
基于深度确定性策略梯度算法的风光储系统联合调度策略 被引量:6
14
作者 张淑兴 马驰 +3 位作者 杨志学 王尧 吴昊 任洲洋 《中国电力》 CSCD 北大核心 2023年第2期68-76,共9页
针对风光储联合系统的调度问题,提出了一种基于深度强化学习的风光储系统联合调度模型。首先,以计划跟踪、弃风弃光以及储能运行成本最小为目标,建立了充分考虑风光储各个场站约束下的联合调度模型。然后,定义该调度模型在强化学习框架... 针对风光储联合系统的调度问题,提出了一种基于深度强化学习的风光储系统联合调度模型。首先,以计划跟踪、弃风弃光以及储能运行成本最小为目标,建立了充分考虑风光储各个场站约束下的联合调度模型。然后,定义该调度模型在强化学习框架下的系统状态变量、动作变量以及奖励函数等,引入了深度确定性策略梯度算法,利用其环境交互、策略探索的机制,学习风光储系统的联合调度策略,以实现对联合系统功率跟踪,减少弃风弃光以及储能充放电。最后,借用西北某地区风电、光伏、跟踪计划的历史数据对模型进行了训练和算例分析,结果表明所提方法可以较好地适应不同时期的风光变化,得到在给定风光下联合系统的调度策略。 展开更多
关键词 风光储联合系统 联合调度策略 不确定性 深度强化学习 深度确定性策略梯度算法
下载PDF
基于改进深度确定性策略梯度算法的微电网能量优化调度 被引量:2
15
作者 李瑜 张占强 +1 位作者 孟克其劳 魏皓天 《电子测量技术》 北大核心 2023年第2期73-80,共8页
针对微电网中分布式发电设备存在输出不确定性和间歇性问题,以及传统的深度确定性策略梯度算法存在收敛速度慢、鲁棒性差、容易陷入局部最优的缺点。本文提出了一种基于优先经验回放的深度确定性策略梯度算法,以微电网系统运行成本最低... 针对微电网中分布式发电设备存在输出不确定性和间歇性问题,以及传统的深度确定性策略梯度算法存在收敛速度慢、鲁棒性差、容易陷入局部最优的缺点。本文提出了一种基于优先经验回放的深度确定性策略梯度算法,以微电网系统运行成本最低为目标,实现微电网的能量优化调度。首先,采用马尔可夫决策过程对微电网优化问题进行建模;其次,采用Sumtree结构的优先经验回放池提升样本利用效率,并且应用重要性采样来改善状态分布对收敛结果的影响。最后,本文利用真实的电力数据进行仿真验证,结果表明,提出的优化调度算法可以有效地学习到使微电网系统经济成本最低的运行策略,所提出的算法总运行时间比传统算法缩短了7.25%,运行成本降低了31.5%。 展开更多
关键词 优先经验回放 微电网能量优化调度 深度确定性策略梯度算法
下载PDF
基于大数据环境下计算机应用技术的探究 被引量:2
16
作者 乔玉平 《软件》 2023年第7期128-130,共3页
本文对计算机技术的主要形式进行介绍,然后阐述大数据环境下计算机技术的应用策略,包括LRFU调度策略、LIRS调度策略、RDF数据索引与存储策略等,最后结合实际案例,重点研究计算机挖掘与处理技术的应用措施。主要体现在数据采集、分类、... 本文对计算机技术的主要形式进行介绍,然后阐述大数据环境下计算机技术的应用策略,包括LRFU调度策略、LIRS调度策略、RDF数据索引与存储策略等,最后结合实际案例,重点研究计算机挖掘与处理技术的应用措施。主要体现在数据采集、分类、传输等方面。力求通过本文研究,使计算机应用技术优势得以充分发挥,实现信息安全高效管理目标。 展开更多
关键词 大数据 计算机技术 信息安全 调度策略
下载PDF
基于内点策略优化的受约束电动汽车充放电策略
17
作者 臧汉洲 叶宇剑 汤奕 《电网技术》 EI CSCD 北大核心 2023年第10期4170-4179,共10页
电动汽车(electric vehicle,EV)作为传统化石燃料动力汽车的环保替代品,其接入电网时可以作为柔性负载或分布式储能单元参与电网调控。当EV参与具有时变电价信号的需求响应时,可以通过优化其充放电时间来降低充电成本。考虑到EV的出行... 电动汽车(electric vehicle,EV)作为传统化石燃料动力汽车的环保替代品,其接入电网时可以作为柔性负载或分布式储能单元参与电网调控。当EV参与具有时变电价信号的需求响应时,可以通过优化其充放电时间来降低充电成本。考虑到EV的出行与充电模式存在随机性,亟待解决如何在满足充电需求的前提下确定最优充放电方案。为此,该文将EV充放电决策问题描述为一个约束马尔可夫决策过程,提出一种基于内点策略优化的无模型方法来确定EV充放电最优策略,无需随机性建模的先验知识,直接通过神经网络生成充放电状态时间表。神经网络结构包括一个提取时序电价特征的循环神经网络和一个生成受约束充放电行为的深度神经网络。最后通过算例分析验证了该方法的有效性。 展开更多
关键词 电动汽车 充放电策略 无模型 约束马尔可夫决策 内点策略优化
下载PDF
基于人工辅助深度强化学习的交直流混合微电网实时优化调度
18
作者 郦芳菲 王海龙 +1 位作者 陆子雄 王忠 《现代电力》 北大核心 2023年第4期577-586,共10页
针对交直流混合微电网优化调度中的不确定性建模难和复杂系统难以高效求解等问题,提出了一种通过人工策略引导提高智能体学习效率的人工辅助深度强化学习算法。首先,结合并网状态下混合微电网的需求侧响应特征,构建了最小化成本的优化... 针对交直流混合微电网优化调度中的不确定性建模难和复杂系统难以高效求解等问题,提出了一种通过人工策略引导提高智能体学习效率的人工辅助深度强化学习算法。首先,结合并网状态下混合微电网的需求侧响应特征,构建了最小化成本的优化调度模型。基于马尔科夫决策流程对优化调度过程进行建模,并根据优化调度模型设计奖励函数。然后,采用人工辅助的深度确定性策略梯度算法求解模型,通过智能体和环境的持续交互,不断更新神经网络参数进而得到最优决策。最后通过算例仿真验证了所提算法能有效提高智能体的学习效率,在减少模型训练时间的同时,有效降子系统的运行成本。 展开更多
关键词 交直流混合微电网 分布式电源 深度确定性策略梯度法 优化调度 人工辅助训练
下载PDF
基于多动作深度强化学习的纺机制造车间调度方法
19
作者 纪志勇 袁逸萍 +2 位作者 巴智勇 樊盼盼 田芳 《计算机应用研究》 CSCD 北大核心 2023年第11期3247-3253,共7页
纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模... 纺机制造车间调度问题是一种具有复杂工艺约束和序列相关设置时间的柔性作业车间调度问题,为了保证调度方案的质量,提升企业的订单准时交付能力,提出了一种以最小化最大完工期为优化目标的多动作深度强化学习算法。首先,将调度问题建模为多马尔可夫决策过程。然后,针对纺机制造车间调度的工件选择和机器选择两个子问题,分别设计了用于定义工序选择策略和机器选择策略的两个编码器,以预测选择不同工序和机器的概率分布。其中,在工序选择编码器中,采用图神经网络对析取图进行编码,以降低问题规模对解的质量的影响。其次,提出了一种具有多动作空间的强化学习训练算法,用于学习两个子策略。最后,经某纺机制造企业的实际生产案例验证,该方法的性能受问题规模影响较小,与其他对比算法相比,能够获得较高质量的调度方案,训练的模型具有较好的泛化能力和稳定性。 展开更多
关键词 纺机制造车间调度 序列相关设置时间 深度强化学习 图神经网络 多近端策略优化算法 最大完工期
下载PDF
Efficient and fair PPO-based integrated scheduling method for multiple tasks of SATech-01 satellite
20
作者 Qi SHI Lu LI +5 位作者 Ziruo FANG Xingzi BI Huaqiu LIU Xiaofeng ZHANG Wen CHEN Jinpei YU 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 2024年第2期417-430,共14页
SATech-01 is an experimental satellite for space science exploration and on-orbit demonstration of advanced technologies.The satellite is equipped with 16 experimental payloads and supports multiple working modes to m... SATech-01 is an experimental satellite for space science exploration and on-orbit demonstration of advanced technologies.The satellite is equipped with 16 experimental payloads and supports multiple working modes to meet the observation requirements of various payloads.Due to the limitation of platform power supply and data storage systems,proposing reasonable mission planning schemes to improve scientific revenue of the payloads becomes a critical issue.In this article,we formulate the integrated task scheduling of SATech-01 as a multi-objective optimization problem and propose a novel Fair Integrated Scheduling with Proximal Policy Optimization(FIS-PPO)algorithm to solve it.We use multiple decision heads to generate decisions for each task and design the action mask to ensure the schedule meeting the platform constraints.Experimental results show that FIS-PPO could push the capability of the platform to the limit and improve the overall observation efficiency by 31.5%compared to rule-based plans currently used.Moreover,fairness is considered in the reward design and our method achieves much better performance in terms of equal task opportunities.Because of its low computational complexity,our task scheduling algorithm has the potential to be directly deployed on board for real-time task scheduling in future space projects. 展开更多
关键词 Satellite observatories SATech-01 Multi-modes platform scheduling algorithms Reinforcement learning Proximal policy Optimization(PPO)
原文传递
上一页 1 2 15 下一页 到第
使用帮助 返回顶部