深度强化学习算法以数据为驱动,且不依赖具体模型,能有效应对虚拟电厂运营中的复杂性问题。然而,现有算法难以严格执行操作约束,在实际系统中的应用受到限制。为了克服这一问题,提出了一种基于深度强化学习的改进深度Q网络(improved dee...深度强化学习算法以数据为驱动,且不依赖具体模型,能有效应对虚拟电厂运营中的复杂性问题。然而,现有算法难以严格执行操作约束,在实际系统中的应用受到限制。为了克服这一问题,提出了一种基于深度强化学习的改进深度Q网络(improved deep Q-network,MDQN)算法。该算法将深度神经网络表达为混合整数规划公式,以确保在动作空间内严格执行所有操作约束,从而保证了所制定的调度在实际运行中的可行性。此外,还进行了敏感性分析,以灵活地调整超参数,为算法的优化提供了更大的灵活性。最后,通过对比实验验证了MDQN算法的优越性能。该算法为应对虚拟电厂运营中的复杂性问题提供了一种有效的解决方案。展开更多
针对可重入制造系统多具有多品种、大规模、混流生产等特点,构建带批处理机的可重入混合流水车间调度问题(reentrant hybrid flow shop scheduling problem with batch processors,BPRHFSP)模型,提出一种改进的多目标蜉蝣算法(multi-obj...针对可重入制造系统多具有多品种、大规模、混流生产等特点,构建带批处理机的可重入混合流水车间调度问题(reentrant hybrid flow shop scheduling problem with batch processors,BPRHFSP)模型,提出一种改进的多目标蜉蝣算法(multi-objective mayfly algorithm,MOMA)进行求解。提出了单件加工阶段和批处理阶段的解码规则;设计了基于Logistic混沌映射的反向学习初始化策略、改进的蜉蝣交配和变异策略,提高了算法初始解的质量和局部搜索能力;根据编码规则设计了基于变邻域下降搜索的蜉蝣运动策略,优化了种群方向。通过对不同规模大量测试算例的仿真实验,验证了MOMA相比传统算法求解BP-RHFSP更具有效性和优越性。所提出的模型能够反映生产的基础特征,达到减少最大完工时间、机器负载和碳排放的目的。展开更多
文摘深度强化学习算法以数据为驱动,且不依赖具体模型,能有效应对虚拟电厂运营中的复杂性问题。然而,现有算法难以严格执行操作约束,在实际系统中的应用受到限制。为了克服这一问题,提出了一种基于深度强化学习的改进深度Q网络(improved deep Q-network,MDQN)算法。该算法将深度神经网络表达为混合整数规划公式,以确保在动作空间内严格执行所有操作约束,从而保证了所制定的调度在实际运行中的可行性。此外,还进行了敏感性分析,以灵活地调整超参数,为算法的优化提供了更大的灵活性。最后,通过对比实验验证了MDQN算法的优越性能。该算法为应对虚拟电厂运营中的复杂性问题提供了一种有效的解决方案。