期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
不完全信息下基于多代理深度确定策略梯度算法的发电商竞价策略 被引量:4
1
作者 员江洋 杨明 +3 位作者 刘宁宁 张长行 黄诗颖 朱青 《电网技术》 EI CSCD 北大核心 2022年第12期4832-4842,共11页
在电力现货市场中,发电商竞价行为受多种因素综合影响,且由于信息受限无法做出最优决策,难以实现自身收益最大化。将发电商竞价决策行为建模为马尔科夫博弈过程,提出了基于多代理模型的发电商日前市场竞价模型,应用多代理深度确定性策... 在电力现货市场中,发电商竞价行为受多种因素综合影响,且由于信息受限无法做出最优决策,难以实现自身收益最大化。将发电商竞价决策行为建模为马尔科夫博弈过程,提出了基于多代理模型的发电商日前市场竞价模型,应用多代理深度确定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法,分别在IEEE-3节点算例和IEEE-30节点算例模拟发电侧竞价行为。算例分析表明,所提模型通信开销低、训练结果良好,可以在不完全信息条件下提高发电商收益,并实现发电侧报价的激励相容。 展开更多
关键词 电力现货市场 代理模型 不完全信息 代理深度确定性策略梯度 最优报价策略 激励相容
下载PDF
基于脉冲卷积神经网络的带钢表面缺陷识别
2
作者 吴昊 周洪成 +2 位作者 韦静 牛犇 姜陈雨 《建模与仿真》 2023年第6期5207-5217,共11页
针对目前热轧带钢表面缺陷识别存在训练样本量小、识别效率低等问题,提出了一种基于脉冲卷积神经网络的带钢表面缺陷识别分类方法。为提高模型泛化性,首先利用扩散模型(Diffusion Model)对不平衡小样本数据集进行数据增强扩充,然后搭建... 针对目前热轧带钢表面缺陷识别存在训练样本量小、识别效率低等问题,提出了一种基于脉冲卷积神经网络的带钢表面缺陷识别分类方法。为提高模型泛化性,首先利用扩散模型(Diffusion Model)对不平衡小样本数据集进行数据增强扩充,然后搭建脉冲卷积神经网络,并通过引入代理梯度方法进行网络监督训练,同时加入注意力模块来提高特征提取效率。实验结果表明:本文提出的脉冲卷积神经网络模型在保证识别率的基础上具有较强的生物合理性,为深度脉冲卷积神经网络在实际工程的应用提供借鉴。 展开更多
关键词 热轧带钢表面缺陷 脉冲卷积神经网络 代理梯度 数据增强
下载PDF
基于拉格朗日松弛算法的分布式供应链优化 被引量:4
3
作者 周威 金以慧 《控制工程》 CSCD 2006年第2期130-134,共5页
为解决分布环境下的无协调中心的供应链生产计划的协调问题,提出了一种基于拉格朗日松弛算法的折扣价格协调优化策略。针对企业计划只能基于本地信息的特点,利用拉格朗日松弛算法将企业之间的物料耦合约束松弛掉,从而把整个供应链计划... 为解决分布环境下的无协调中心的供应链生产计划的协调问题,提出了一种基于拉格朗日松弛算法的折扣价格协调优化策略。针对企业计划只能基于本地信息的特点,利用拉格朗日松弛算法将企业之间的物料耦合约束松弛掉,从而把整个供应链计划问题分解为多个可利用本地信息求解的企业生产计划子问题。通过上下游企业之间对折扣价格(拉格朗日算子)的异步更新,可以逐步获取整个供应链生产计划的优化解,从而实现分布环境下的供应链生产计划的异步协调。仿真实验证明了该方案的可行性。 展开更多
关键词 供应链 协调 生产计划 拉格朗日松弛 代理梯度
下载PDF
基于广义三维分配的数据互联算法研究 被引量:2
4
作者 王以标 徐毓 张云龙 《现代防御技术》 北大核心 2009年第3期122-126,共5页
针对多维分配问题中基于次梯度算法的拉格朗日松弛算法每次迭代都要对每个子问题进行最小化运算以更新乘子的缺陷,引入了优化数学里的代理次梯度算法,修改次梯度表达式和乘子更新公式,提出了基于代理次梯度的拉格朗日松弛数据关联算法... 针对多维分配问题中基于次梯度算法的拉格朗日松弛算法每次迭代都要对每个子问题进行最小化运算以更新乘子的缺陷,引入了优化数学里的代理次梯度算法,修改次梯度表达式和乘子更新公式,提出了基于代理次梯度的拉格朗日松弛数据关联算法。在问题规模较大的情况下,节约了计算时间,降低了跟踪丢失率。仿真结果证明了算法的有效性。 展开更多
关键词 S—D分配 对偶子问题 拉格朗日乘子 代理梯度
下载PDF
基于强化学习的非正交多址接入和移动边缘计算联合系统信息年龄更新 被引量:3
5
作者 李保罡 石泰 +3 位作者 陈静 李诗璐 王宇 张天魁 《电子与信息学报》 EI CSCD 北大核心 2022年第12期4238-4245,共8页
物联网发展对信息时效性的需求越来越高,信息新鲜度变得至关重要。为了维持信息新鲜度,在非正交多址接入(NOMA)和移动边缘计算(MEC)的联合系统中,对多设备单边缘计算服务器的传输场景进行了研究。在该场景中,如何分配卸载任务量和卸载... 物联网发展对信息时效性的需求越来越高,信息新鲜度变得至关重要。为了维持信息新鲜度,在非正交多址接入(NOMA)和移动边缘计算(MEC)的联合系统中,对多设备单边缘计算服务器的传输场景进行了研究。在该场景中,如何分配卸载任务量和卸载功率以最小化平均更新代价是一个具有挑战性的问题。该文考虑到现实中的信道状态变化情况,基于多代理深度确定性策略梯度(MADDPG)算法,考虑信息新鲜度影响,建立了最小化平均更新代价的优化问题,提出一种寻找最优的卸载因子和卸载功率决策。仿真结果表明,采用部分卸载的方式可以有效地降低平均更新代价,利用MADDPG算法可以进一步优化卸载功率,经比较,MADDPG算法在降低平均更新代价方面优于其他方案,并且适当地减少设备数量在降低平均更新代价方面效果更好。 展开更多
关键词 非正交多址接入 移动边缘计算 信息年龄 代理深度确定性策略梯度
下载PDF
HFS多处理器任务调度的改进拉格朗日松弛
6
作者 轩华 冯颖 +1 位作者 李冰 王薛苑 《控制工程》 CSCD 北大核心 2017年第10期1971-1974,共4页
针对带多处理器任务的混合流水车间调度问题,以总加权完成时间为目标函数,考虑加工阶段间运输时间和工件动态到达的生产特征,提出了一种基于代理次梯度法的改进拉格朗日松弛算法。算法采用每次迭代只最优求解几个拉格朗日子问题的异步... 针对带多处理器任务的混合流水车间调度问题,以总加权完成时间为目标函数,考虑加工阶段间运输时间和工件动态到达的生产特征,提出了一种基于代理次梯度法的改进拉格朗日松弛算法。算法采用每次迭代只最优求解几个拉格朗日子问题的异步迭代策略,利用代理次梯度获得合适的乘子更新方向。分别应用所提出的改进算法和常规的基于次梯度法的拉格朗日松弛算法对多达150个工件的问题进行仿真测试,结果表明,所提出的改进算法比常规拉格朗日松弛算法表现出更好的求解能力,尤其是求解大规模问题。 展开更多
关键词 多处理器任务调度 混合流水车间 代理梯度 拉格朗日松弛 总加权完成时间
下载PDF
改进的拉格朗日松弛数据关联算法 被引量:3
7
作者 童长宁 林岳松 +1 位作者 郭云飞 左燕 《火力与指挥控制》 CSCD 北大核心 2011年第10期20-23,27,共5页
在多传感器多目标跟踪领域中,当传感器为被动式的,传统的多维分配算法利用拉格朗日松弛算法求解。拉格朗日乘子更新一般用次梯度方法,但每次迭代都要进行多次极小化运算来求对偶解,导致实时性差。针对这个问题,提出了一种改进的基于拉... 在多传感器多目标跟踪领域中,当传感器为被动式的,传统的多维分配算法利用拉格朗日松弛算法求解。拉格朗日乘子更新一般用次梯度方法,但每次迭代都要进行多次极小化运算来求对偶解,导致实时性差。针对这个问题,提出了一种改进的基于拉格朗日松弛的数据关联算法,通过代理修正次梯度方法更新拉格朗日乘子,并在允许时间内获得近似解。仿真实验表明,与现有的次梯度算法相比,此算法具有更少的运算时间和更高的关联正确率。 展开更多
关键词 拉格朗日松弛 3-D分配 数据关联 代理修正次梯度
下载PDF
基于FRTLBO-梯度增强算法的运载火箭总体优化设计
8
作者 李飞 闵昌万 +2 位作者 赤丰华 王颖 武猛 《飞行力学》 CSCD 北大核心 2020年第3期63-69,94,共8页
针对运载火箭设计过程中存在质量常值约束、尺寸不等式约束的问题,提出了一种基于FRTLBO-梯度增强算法的运载火箭总体优化设计方法。采用敏感度分析提取包含发动机、气动、质量、尺寸4个学科的运载火箭主要设计参数,建立基于CFD方法的... 针对运载火箭设计过程中存在质量常值约束、尺寸不等式约束的问题,提出了一种基于FRTLBO-梯度增强算法的运载火箭总体优化设计方法。采用敏感度分析提取包含发动机、气动、质量、尺寸4个学科的运载火箭主要设计参数,建立基于CFD方法的气动优化设计平台,优化出低阻运载火箭外形。仿真结果表明,FRTLBO-梯度增强算法优化算法较目前主流算法求解速度快、求解精度更高,运载器最优外形趋于Ⅰ子级直径与Ⅱ子级直径相等、Ⅲ子级直径略小且总长度为约束上界的气动布局形式。 展开更多
关键词 一体化设计 适应度排名教与学优化算法 梯度增强气动代理模型
原文传递
零等待混合流水车间问题优化研究 被引量:11
9
作者 轩华 孙振轩 李冰 《工业工程与管理》 CSSCI 北大核心 2014年第5期13-17,30,共6页
研究了带零等待的混合流水车间调度问题,考虑工件动态到达的实际生产特征,以最小化总加权完成时间为目标,建立整数规划模型,然后设计一种基于代理次梯度法的改进拉格朗日松弛算法。基于工件分解策略将拉格朗日松弛问题分解为多个工件级... 研究了带零等待的混合流水车间调度问题,考虑工件动态到达的实际生产特征,以最小化总加权完成时间为目标,建立整数规划模型,然后设计一种基于代理次梯度法的改进拉格朗日松弛算法。基于工件分解策略将拉格朗日松弛问题分解为多个工件级子问题,不同于每次迭代要求最优求解所有子问题的次梯度法,所设计的代理次梯度法通过每次迭代最优求解几个子问题得到松弛问题的近似解,进而获得搜索拉格朗日乘子的代理次梯度方向,最后设计启发式构造可行时间表。通过仿真实验,证明了所设计的算法在解的质量和收敛性方面均优于传统的使用次梯度法的拉格朗日松弛算法。 展开更多
关键词 零等待混合流水车间 工件动态到达 代理梯度 拉格朗日松弛
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部