基于强化学习的算力资源度量方法被引量：1

Computational power resource measurement method based on reinforcement learning

下载PDF

导出

摘要工业边缘计算中,节点具有分布零散、异构以及算力受限的特点,为保障算力供给通常采用任务与平台紧耦合的模式,然而该模式易使生产系统刚性化,资源复用效率低,冗余资源成本高昂。针对这一问题本文提出了多维度任务分析与强化学习相结合的算力度量方法,首先对工业场景中计算任务的时、空复杂度,计算类型等特征进行细粒度分析,通过构建任务模型与计算模型分析各计算任务特征与资源需求比例之间的关系;随后,基于上述分析构建马尔科夫决策过程并把状态、动作、奖励建立为三元组,将奖励值定义为对任务执行时间的预测优化问题;最后,设计基于深度Q网络的计算任务算力度量方法,对不同形式的计算任务进行算力需求量化,并通过与设备实际算力消耗进行分析对比,验证所提方法可有效降低不必要的资源损耗。实验结果显示,所提出的模型和方法预测任务执行时间成功率可达99.37%,相较于Q-Learning等算法提升了约5.84%、7.54%和34.23%,可有效实现边缘侧的算力度量。 In industrial edge computing,nodes have the characteristics of scattered distribution,heterogeneity and limited computational power resource.In order to guarantee the supply of computational power resource,the mode of tight coupling between task and platform is ually adopted,bowever,this mode easily leads to the rigidity of production system,low resource reuse rate and high cost of redundant resources.In order to solve this problem,a computational power measurement method that combines multi-dimensional tack analysis and reinforcement leaning is proposed.Firstly,fine-grained analysis was carried out on the characteristics of computing tasks in industrial scenarios,such as time complexity,space complexity and computing type,and the relationship between the characteristics of each computing task and the proportion of resource requirements was analyzed h constructing taak model and computing moodel.Then Markov decision process was constructed based on the abowe analysis,and the state,action and reward were established as triples,and the reward value was defined as the prediction optimizaion problem of task execution time.Finally,a conmputational power measurement methbod based on DQN(Deep Q Netwok)is designed to quantify the computational power requirements of diferent forms of computing tasks.By analyzing and comparing with the actual computational power consumption of equipment,the proposed method can effectively reduce unnecessary resource consumption.Experimental results show that the success rate of the proposed model and method in predicting task execution time can reach 99.37%,which is about5.84%,7.54%,and 34.23%higher than algorithms such a Q-Leamning,and can efectively realie edge side computational power measurement.

作者夏天豪夏长清潘昊许驰金曦 XIA Tianhao;XIA Changqing;PAN Hao;XU Chi;JIN Xi(School of Information Engineering,Shenyang University of Chemical Technology,Shenyang,Liaoning 110142,China;Key Laboratory of Networked Control Systems,Chinese Academy of Sciences,Shenyang,Liaoning 110016,China;Shenyang Instiute of Automation,Chinese Academy of Sciences,Shenyang,Liaoning 110016,China;Institutes for Robotics&Inelligent Manufacturing,Chinese Academy of Sciences,Shenyang,Laoning 110169,China)

机构地区沈阳化工大学信息工程学院中国科学院网络化控制系统重点实验室中国科学院沈阳自动化研究所中国科学院机器人与智能制造创新研究院

出处《燕山大学学报》 CAS 北大核心 2023年第3期246-254,共9页 Journal of Yanshan University

基金国家重点研发计划资助项目(2018YFB1700200) 国家自然科学基金资助项目(61903356,61972389,62022088,62133014,62173322,U1908212) 辽宁省自然科学基金资助项目(2020-MS-034,2019-YQ-09) 中国博士后科学基金资助项目(2019M661156) 中央引导地方科技发展资金(自由探索类基础研究)资助项目(2022JH6/100100013) 中国科学院青年创新促进会资助项目(2020207)。

关键词边缘计算资源量化算力度量工业互联网深度Q网络 edge computing resource quantify computational power measurement industrial intenet Deep Q Network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王颖,李伟,陈梦盼,陈利,金顺福.融合虚拟机分簇与休眠机制的MEC任务卸载策略[J].燕山大学学报,2021,45(4):343-351. 被引量：2
2谢晓兰,张征征,王建伟,程晓春.基于三次指数平滑法和时间卷积网络的云资源预测模型[J].通信学报,2019,40(8):143-150. 被引量：23
3王其朝,金光淑,李庆,王锴,杨祖业,王宏.工业边缘计算研究现状与展望[J].信息与控制,2021,50(3):257-274. 被引量：35
4李小良,李伟,金顺福.基于单用户和分类任务的MEC任务卸载策略及性能优化[J].燕山大学学报,2022,46(3):273-282. 被引量：2
5李燕君,蒋华同,高美惠.基于强化学习的边缘计算网络资源在线分配方法[J].控制与决策,2022,37(11):2880-2886. 被引量：9
6问泽藤,温淑慧,张迪.未知环境下移动机器人自主避障算法的研究[J].燕山大学学报,2021,45(3):274-282. 被引量：6

二级参考文献36

1金顺福,郄修尘,武海星,霍占强.基于新型休眠模式的云虚拟机分簇调度策略及性能优化[J].吉林大学学报（工学版）,2020,50(1):237-246. 被引量：5
2王玉,陈利,马占友,张雷.多服务台同步工作休假的Geom/Geom/c排队[J].燕山大学学报,2012,36(3):259-264. 被引量：1
3Da-yu XU,Shan-lin YANG,Ren-ping LIU.A mixture of HMM,GA,and Elman network for load prediction in cloud-oriented data centers[J].Journal of Zhejiang University-Science C(Computers and Electronics),2013,14(11):845-858. 被引量：7
4金顺福,王宝帅,郝闪闪,贾晓光,霍占强.基于备用虚拟机同步休眠的云数据中心节能策略及性能[J].吉林大学学报（工学版）,2018,48(6):1859-1866. 被引量：5
5周济.智能制造——“中国制造2025”的主攻方向[J].中国机械工程,2015,26(17):2273-2284. 被引量：1228
6段海滨,叶飞.鸽群优化算法研究进展[J].北京工业大学学报,2017,43(1):1-7. 被引量：29
7王红君,徐军,赵辉,岳有军.基于平滑蚁群算法的机器人路径规划[J].燕山大学学报,2017,41(3):278-282. 被引量：22
8Qiliang Zhu,Baojiang Si,Feifan Yang,You Ma.Task Offloading Decision in Fog Computing System[J].China Communications,2017,14(11):59-68. 被引量：6
9陶飞,刘蔚然,刘检华,刘晓军,刘强,屈挺,胡天亮,张执南,向峰,徐文君,王军强,张映锋,刘振宇,李浩,程江峰,戚庆林,张萌,张贺,隋芳媛,何立荣,易旺民,程辉.数字孪生及其应用探索[J].计算机集成制造系统,2018,24(1):1-18. 被引量：830
10田鹤,赵海,王进法,林川.互联网传播行为的时序演化与预测[J].通信学报,2018,39(6):116-126. 被引量：4

共引文献71

1刘耿旗,张旭秀,马洪源,闫涵.多边缘节点场景下的计算任务卸载算法[J].信息与控制,2023,52(5):679-688. 被引量：1
2孙昕.云计算与虚拟化的互联网应用分析[J].中国宽带,2023,19(8):106-108.
3刘爱萍.基于数据挖掘技术的高校学生成绩预测模型构建[J].长春工程学院学报（自然科学版）,2020,21(2):98-101. 被引量：5
4苟辉,冯波,吴恒.Mtalab GUI在PCB生产中的应用[J].电脑编程技巧与维护,2020,0(4):135-136. 被引量：1
5杨云,闫振国.基于卷积网络与支持向量机的云资源预测模型[J].陕西科技大学学报,2020,38(5):165-172. 被引量：4
6朱磊,钟建栩,余少锋.电网跨数据中心云资源容灾模型可靠性研究[J].环境技术,2020,38(5):87-92. 被引量：1
7王翠萍,李迪,徐家川.融合深度感知特征的车辆跟踪态势显示仿真[J].计算机仿真,2020,37(11):142-145. 被引量：1
8唐昊.一种基于时域卷积网络的风机齿轮箱油温预测模型[J].现代制造技术与装备,2021,57(1):44-46. 被引量：1
9张鼎新,徐秉良,陈臻,曾翠云,姜仲辉.近20年甘肃省苹果4种主要病害发生分析及趋势预测[J].土壤与作物,2021,10(2):237-244. 被引量：2
10张建军,高志刚.5G边缘计算网关在车载物联网中的应用[J].自动化与信息工程,2021,42(4):42-45. 被引量：2

同被引文献11

1李建飞,曹畅,李奥,庞博文.算力网络中面向业务体验的算力建模[J].中兴通讯技术,2020,26(5):34-38. 被引量：18
2郭亮,吴美希,王峰,龚敏.数据中心算力评估:现状与机遇[J].信息通信技术与政策,2021(2):79-86. 被引量：30
3姚惠娟,陆璐,段晓东.算力感知网络架构与关键技术[J].中兴通讯技术,2021,27(3):7-11. 被引量：28
4何涛,杨振东,曹畅,张岩,唐雄燕.算力网络发展中的若干关键技术问题分析[J].电信科学,2022,38(6):62-70. 被引量：14
5乔楚.算力度量与算网资源调度思路分析[J].通信技术,2022,55(9):1165-1170. 被引量：5
6周舸帆,雷波.算力网络中基于算力标识的算力服务需求匹配[J].数据与计算发展前沿,2022,4(6):20-28. 被引量：5
7杨光,王玉申,姚洁,杨凯.算力时代下的算力服务需求研究[J].中国新通信,2023,25(1):39-41. 被引量：2
8柴若楠,郜帅,兰江雨,刘宁春.算力网络中高效算力资源度量方法[J].计算机研究与发展,2023,60(4):763-771. 被引量：4
9姜海洋,李勇.端边云场景下的算力度量方法[J].电信工程技术与标准化,2023,36(7):79-83. 被引量：2
10庞冉,易昕昕,辛亮,曹畅,唐雄燕.算力网络路由调度技术研究[J].电信科学,2023,39(8):149-156. 被引量：5

引证文献1

1祝淑琼,徐青青,李小涛,陈维.算力度量与任务调度:物联网端侧设备策略研究[J].电信科学,2024,40(4):122-138.

1单文盛,彭丽娜.县级融媒体中心舆论引导力提升的行动框架[J].中国传媒科技,2023(2):123-128. 被引量：3
2王梓鉴,罗敏,朱钦权,胡校颖,杨菲.基于多源数据融合的空气质量二次预报模型与计算方法[J].江西科学,2023,41(2):405-411.
3王教庆,任艳博.基于青年女性消费群体的纺织类文创产品设计[J].染整技术,2023,45(2):48-56. 被引量：2
4戴轶琼.农药制造企业财务预算管理问题及对策[J].中国市场,2023(12):103-106. 被引量：2
5袁晓芳,浦欣荷.面向儿童教育机器人的行为引导设计研究[J].艺术与设计（理论版）,2023(4):106-108. 被引量：1
6高彦钊,陶常勇.信号处理与深度学习硬件加速的一致性计算结构[J].国防科技大学学报,2023,45(2):112-120. 被引量：2
7韩照洋,赵倩宇,王守相,董逸超,钱广超.基于DQN和DDPG算法的交直流配电网多设备协同电压控制方法[J].供用电,2023,40(6):18-25. 被引量：6
8聂志萍,陈秋宇.冗余资源对环保投资的影响——基于高水敏感性行业A股上市公司的实证研究[J].水利经济,2023,41(3):58-68.
9杨洋,王俊峰.基于GCN的复杂网络关键节点识别研究[J].四川大学学报（自然科学版）,2023,60(3):49-58.
10郑博文,霍晓彤,冯海燕.数字化转型与全要素生产率——基于A股上市公司的经验证据[J].技术经济,2023,42(5):29-44. 被引量：6

燕山大学学报

2023年第3期

浏览历史

内容加载中请稍等...

基于强化学习的算力资源度量方法被引量：1

参考文献6

二级参考文献36

共引文献71

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的算力资源度量方法 被引量：1

参考文献6

二级参考文献36

共引文献71

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的算力资源度量方法被引量：1