基于DRL的联邦学习节点选择方法被引量：7

Node selection method in federated learning based on deep reinforcement learning

下载PDF

导出

摘要为了应对设备差异化计算能力及非独立同分布数据对联邦学习性能的影响,高效地调度终端设备完成模型聚合,提出了一种基于深度强化学习的设备节点选择方法。该方法考虑异构节点的训练质量和效率,筛选恶意节点,在提升联邦学习模型准确率的同时,优化训练时延。首先,根据联邦学习中模型分布式训练的特点,构建基于深度强化学习的节点选择系统模型。其次,考虑设备训练时延、模型传输时延和准确率等因素,提出面向节点选择的准确率最优化问题模型。然后,将问题模型构建为马尔可夫决策过程,并设计基于分布式近端策略优化的节点选择算法,在每次训练迭代前选择合理的设备集合完成模型聚合。仿真实验表明,所提方法显著提高了联邦学习的准确率和训练速度,且具有良好的收敛性和稳健性。 To cope with the impact of different device computing capabilities and non-independent uniformly distributed data on federated learning performance,and to efficiently schedule terminal devices to complete model aggregation,a method of node selection based on deep reinforcement learning was proposed.It considered training quality and efficiency of heterogeneous terminal devices,and filtrate malicious nodes to guarantee higher model accuracy and shorter training delay of federated learning.Firstly,according to characteristics of model distributed training in federated learning,a node selection system model based on deep reinforcement learning was constructed.Secondly,considering such factors as device training delay,model transmission delay and accuracy,an optimization model of accuracy for node selection was proposed.Finally,the problem model was constructed as a Markov decision process and a node selection algorithm based on distributed proximal strategy optimization was designed to obtain a reasonable set of devices before each training iteration to complete model aggregation.Simulation results demonstrate that the proposed method significantly improves the accuracy and training speed of federated learning,and its convergence and robustness are also well.

作者贺文晨郭少勇邱雪松陈连栋张素香 HE Wenchen;GUO Shaoyong;QIU Xuesong;CHEN Liandong;ZHANG Suxiang(State Key Laboratory of Networking and Switching Technology,Beijing University of Posts and Telecommunications,Beijing 100876,China;Hebei State Grid Information&Telecommunication Branch,Shijiazhuang 050011,China;State Grid Information&Telecommunication Branch,Beijing 100761,China)

机构地区北京邮电大学网络与交换技术国家重点实验室国网河北信息通信分公司国家电网有限公司信息通信分公司

出处《通信学报》 EI CSCD 北大核心 2021年第6期62-71,共10页 Journal on Communications

基金国家自然科学基金资助项目(No.62071070) 教育部区块链核心计划基金资助项目(No.2020KJ010802) 河北省重点研发计划基金资助项目(No.20310103D)。

关键词联邦学习模型聚合节点选择深度强化学习准确率 federated learning model aggregation node selection deep reinforcement learning accuracy

分类号 TP911.1 [自动化与计算机技术]

引文网络
相关文献

参考文献5

1陈兵,成翔,张佳乐,谢袁源.联邦学习安全与隐私保护综述[J].南京航空航天大学学报,2020,52(5):675-684. 被引量：21
2孟洛明,孙康,韦磊,郭少勇,徐思雅.一种面向电力无线专网的虚拟资源优化分配机制[J].电子与信息学报,2017,39(7):1711-1718. 被引量：15
3李枝灵,刘柱,郭少勇,邵苏杰,亓峰.基于免疫算法的电力线通信网接入点规划方法[J].北京邮电大学学报,2016,39(B06):104-108. 被引量：2
4赵海涛,张唐伟,陈跃,赵厚麟,朱洪波.基于DQN的车载边缘网络任务分发卸载算法[J].通信学报,2020,41(10):172-178. 被引量：16
5喻鹏,张俊也,李文璟,周凡钦,丰雷,付澍,邱雪松.移动边缘网络中基于双深度Q学习的高能效资源分配方法[J].通信学报,2020,41(12):148-161. 被引量：8

二级参考文献13

1吴小辰.南方电网“十二五”电力通信发展规划综述[J].电力系统通信,2011,32(5):7-9. 被引量：8
2郑涛,潘玉美,郭昆亚,王增平,孙洁.基于免疫算法的配电网故障定位方法研究[J].电力系统保护与控制,2014,42(1):77-83. 被引量：101
3田辉,范绍帅,吕昕晨,赵鹏涛,贺硕.面向5G需求的移动边缘计算[J].北京邮电大学学报,2017,40(2):1-10. 被引量：81
4刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：431
5陈山枝,胡金玲,时岩,赵丽.LTE-V2X车联网技术、标准与应用[J].电信科学,2018,34(4):1-11. 被引量：89
6谢人超,廉晓飞,贾庆民,黄韬,刘韵洁.移动边缘计算卸载技术综述[J].通信学报,2018,39(11):138-155. 被引量：117
7陈亮,余少华.6G移动通信发展趋势初探(特邀)[J].光通信研究,2019,0(4):1-8. 被引量：35
8Jindou Xie,Yunjian Jia,Zhengchuan Chen,Zhaojun Nan,Liang Liang.Efficient Task Completion for Parallel Offloading in Vehicular Fog Computing[J].China Communications,2019,16(11):42-55. 被引量：5
9郭辉,芮兰兰,高志鹏.车辆边缘网络中基于多参数MDP模型的动态服务迁移策略[J].通信学报,2020,41(1):1-14. 被引量：5
10梁应敞,谭俊杰,Dusit Niyato.智能无线通信技术研究概况[J].通信学报,2020,41(7):1-17. 被引量：23

共引文献57

1石进,钱诗君,沈驰,潘阳,韦涛.面向分布式云环境的数据安全共享架构设计[J].信息化研究,2023,49(4):55-59.
2姚继明,郭经红,韦磊.一种电力无线频谱监测系统设计方案[J].电力信息与通信技术,2018,16(11):29-34. 被引量：4
3谢小军,潘子春,吴非.基于Q-learning的电力通信网效用最大化资源分配策略生成算法[J].自动化技术与应用,2018,37(4):44-48. 被引量：3
4李敏,许振飞,许崇志,年安君.QoS驱动的电力通信网效用最大化资源分配机制[J].计算机系统应用,2018,27(7):265-271. 被引量：3
5谢小军,卓文合.基于QoS约束的电力通信网服务故障恢复算法[J].自动化仪表,2018,39(9):40-44. 被引量：4
6朱辉青,柏东辉.配用电网通信服务告警相关性模型分割与故障诊断算法[J].电气应用,2018,37(17):38-42. 被引量：1
7吴柳,张思拓,谢尧,辜晓波.一种基于云计算的电力通信安全防御系统研究与设计[J].信息技术,2018,42(10):58-61. 被引量：12
8陈文伟,于卓智,张叶峰.基于Linux系统的智慧安全型专网无线通信模块设计[J].电子设计工程,2019,27(5):121-126. 被引量：8
9胡致远,宋晓凤,黄天聪,李晓娣,周瑞芳,徐鑫,蒙占宇,彭强.四表集抄通信网络虚拟化方案及组网算法研究[J].电子与信息学报,2019,41(3):588-593. 被引量：6
10詹捷.无线局发射台虚拟化平台的设计与实现[J].信息通信,2019,32(3):266-267.

同被引文献44

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2郑楷洪,肖勇,王鑫,陈为.一个面向电力计量系统的联邦学习框架[J].中国电机工程学报,2020,40(S01):122-133. 被引量：16
3王婷,隋江华.改进粒子群算法的传感器网络覆盖分布优化[J].辽宁工程技术大学学报（自然科学版）,2020,39(3):280-286. 被引量：12
4陈振宇,刘金波,李晨,季晓慧,李大鹏,黄运豪,狄方春,高兴宇,徐立中.基于LSTM与XGBoost组合模型的超短期电力负荷预测[J].电网技术,2020,44(2):614-620. 被引量：201
5邓带雨,李坚,张真源,滕予非,黄琦.基于EEMD-GRU-MLR的短期电力负荷预测[J].电网技术,2020,44(2):593-602. 被引量：116
6薛宁,霍如,曾诗钦,汪硕,黄韬.基于DRL的MEC任务卸载与资源调度算法[J].北京邮电大学学报,2019,42(6):64-69. 被引量：3
7陈宏义,李存斌,施立刚.基于聚类分析的短期负荷智能预测方法研究[J].湖南大学学报（自然科学版）,2014,41(5):94-98. 被引量：15
8陈俊杰,周晖,张小美.多媒体系统多资源分配中效率与公平性的权衡[J].计算机应用研究,2016,33(6):1713-1716. 被引量：1
9彭显刚,郑伟钦,林利祥,刘艺.考虑负荷自适应检测和修复的鲁棒极限学习机短期负荷预测方法[J].中国电机工程学报,2016,36(23):6409-6417. 被引量：24
10苏学能,刘天琪,曹鸿谦,焦慧明,于亚光,何川,沈骥.基于Hadoop架构的多重分布式BP神经网络的短期负荷预测方法[J].中国电机工程学报,2017,37(17):4966-4973. 被引量：93

引证文献7

1叶小华.基于随机时空联合维度校准机制的WSN恶意节点定位算法[J].伊犁师范大学学报（自然科学版）,2022,16(2):35-40.
2王志勤,江甲沫,刘沛西,曹晓雯,李阳,韩凯峰,杜滢,朱光旭.6G联邦边缘学习新范式:基于任务导向的资源管理策略[J].通信学报,2022,43(6):16-27. 被引量：2
3陈飞扬,周晖,张一迪.FCAT⁃FL:基于Non⁃IID数据的高效联邦学习算法[J].南京邮电大学学报（自然科学版）,2022,42(3):90-99.
4车亮,徐茂盛,崔秋实.基于联邦学习的短期负荷预测模型协同训练方法[J].湖南大学学报（自然科学版）,2022,49(8):117-127. 被引量：1
5赵素萍,杜永文.基于粒子群算法的无线传感网络中继节点选择策略[J].传感技术学报,2022,35(12):1712-1716. 被引量：1
6金彪,李逸康,姚志强,陈瑜霖,熊金波.GenFedRL:面向深度强化学习智能体的通用联邦强化学习框架[J].通信学报,2023,44(6):183-197. 被引量：2
7高阳.面向医学检验数据分析的增强深度学习预测模型[J].电子设计工程,2024,32(4):176-180.

二级引证文献6

1金彪,李逸康,姚志强,陈瑜霖,熊金波.GenFedRL:面向深度强化学习智能体的通用联邦强化学习框架[J].通信学报,2023,44(6):183-197. 被引量：2
2黄祎,王金珠,孙梦琪,包蕾.基于改进PSO-SVM的智能化医疗数据处理技术研究[J].电子设计工程,2024,32(3):83-87.
3吴维农,王定国,刘钰然,邓雅文,祖雪莹,唐伦.5G电力虚拟专网中基于联邦对抗学习的分布式异常检测算法[J].半导体光电,2023,44(6):955-964.
4李阳,王新宁,韩凯峰,蔡智捷,朱光旭,徐明枫.面向空中联邦学习的边缘智能感知模型优化方法研究[J].移动通信,2024,48(3):75-82.
5陈少权,杜翠凤,张振,黄星辉.面向星地融合网络的星上管控节点动态部署方法[J].移动通信,2024,48(4):105-111.
6孔粼,刘永芳.智能决策模型在儿科临床营养教学中的运用[J].中国继续医学教育,2024,16(10):190-194.

1高巍,陈泽颖,李大舟.基于校车数量的无混载校车路线问题模型优化实现[J].沈阳化工大学学报,2021,35(1):82-89. 被引量：2
2刘云玲,张品戈,王千航,周睿琪,赵佳,肖永贵,马韫韬.基于多列空洞卷积神经网络的麦穗计数方法研究[J].吉林农业大学学报,2021,43(2):171-180. 被引量：3
3杨继松,岑健,伍银波,吴金城,吴健旋.基于边缘计算的污泥烘干协同控制方法[J].电子元器件与信息技术,2021,5(3):139-141.
4骆方舟.基于无线传感网络的化学实验室远程安防监测方法[J].新乡学院学报,2021,38(6):63-67. 被引量：3
5董骏,冯锋.具有隐私保护的边缘计算高效数据卸载方法[J].计算机应用研究,2021,38(7):2072-2076. 被引量：4
6陈海彪,黄声勇,蔡洁锐.一个基于智能电网的跨层路由的信任评估协议[J].计算机科学,2021,48(S01):491-497. 被引量：1

通信学报

2021年第6期

浏览历史

内容加载中请稍等...

基于DRL的联邦学习节点选择方法被引量：7

参考文献5

二级参考文献13

共引文献57

同被引文献44

引证文献7

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于DRL的联邦学习节点选择方法 被引量：7

参考文献5

二级参考文献13

共引文献57

同被引文献44

引证文献7

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于DRL的联邦学习节点选择方法被引量：7