非独立同分布数据下的自正则化联邦学习优化方法被引量：1

Self-regularization optimization methods for Non-IID data in federated learning

下载PDF

导出

摘要联邦学习(FL)是一种新的分布式机器学习范式,它在保护设备数据隐私的同时打破数据壁垒,从而使各方能在不共享本地数据的前提下协作训练机器学习模型。然而,如何处理不同客户端的非独立同分布(Non-IID)数据仍是FL面临的一个巨大挑战,目前提出的一些解决方案没有利用好本地模型和全局模型的隐含关系,无法简单而高效地解决问题。针对FL中不同客户端数据的Non-IID问题,提出新的FL优化算法——联邦自正则(FedSR)和动态联邦自正则(Dyn-FedSR)。FedSR在每一轮训练过程中引入自正则化惩罚项动态修改本地损失函数,并通过构建本地模型和全局模型的关系来让本地模型靠近聚合丰富知识的全局模型,从而缓解Non-IID数据带来的客户端偏移问题;Dyn-FedSR则在FedSR基础上通过计算本地模型和全局模型的相似度来动态确定自正则项系数。对不同任务进行的大量实验分析表明,FedSR和Dyn-FedSR这两个算法在各种场景下的表现都明显优于联邦平均(FedAvg)算法、联邦近端(FedProx)优化算法和随机控制平均算法(SCAFFOLD)等FL算法,能够实现高效通信,正确率较高,且对不平衡数据和不确定的本地更新具有鲁棒性。 Federated Learning(FL)is a new distributed machine learning paradigm that breaks down data barriers and protects data privacy at the same time,thereby enabling clients to collaboratively train a machine learning model without sharing local data.However,how to deal with Non-Independent Identical Distribution(Non-IID)data from different clients remains a huge challenge faced by FL.Some existing proposed solutions to this problem do not utilize the implicit relationship between local and global models to solve the problem simply and efficiently.To address the Non-IID issue of different clients in FL,novel FL optimization algorithms including Federated Self-Regularization(FedSR)and Dynamic Federated Self-Regularization(Dyn-FedSR)were proposed.In FedSR,self-regularization penalty terms were introduced in each training round to modify the local loss function dynamically,and by building a relationship between the local and the global models,the local model was closer to the global model that aggregates rich knowledge,thereby alleviating the client drift problem caused by Non-IID data.In Dyn-FedSR,the self-regularization term coefficient was determined dynamically by calculating the similarity between the local and global models.Extensive experimental analyses on different tasks demonstrate that the two algorithms,FedSR and Dyn-FedSR,significantly outperform the state-of-the-art FL algorithms such as Federated Averaging(FedAvg)algorithm,Federated Proximal(FedProx)optimization algorithm and Stochastic Controlled Averaging algorithm(SCAFFOLD)in various scenarios,and can achieve efficient communication and high accuracy,as well as the robustness to imbalanced data and uncertain local updates.

作者蓝梦婕蔡剑平孙岚 LAN Mengjie;CAI Jianping;SUN Lan(College of Computer and Data Science,Fuzhou University,Fuzhou Fujian 350108,China)

机构地区福州大学计算机与大数据学院

出处《计算机应用》 CSCD 北大核心 2023年第7期2073-2081,共9页 journal of Computer Applications

关键词联邦学习非独立同分布客户端偏移正则化分布式机器学习隐私保护 Federated Learning(FL) Non-Independent Identical Distribution(Non-IID) client drift regularization distributed machine learning privacy-preserving

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献5

1鲁晨阳,邓苏,马武彬,吴亚辉,周浩浩.基于DBSCAN聚类的集群联邦学习方法[J].计算机科学,2022,49(S01):232-237. 被引量：6
2肖雄,唐卓,肖斌,李肯立.联邦学习的隐私保护与安全防御研究综述[J].计算机学报,2023,46(5):1019-1044. 被引量：18
3常黎明,刘颜红,徐恕贞.基于数据分布的聚类联邦学习[J].计算机应用研究,2023,40(6):1697-1701. 被引量：8
4张婷,吴宇.面向Non⁃IID场景的联邦学习客户端选择算法研究[J].东莞理工学院学报,2023,30(3):24-31. 被引量：2
5郭桂娟,田晖,皮慧娟,贾维嘉,彭绍亮,王田.面向非独立同分布数据的联邦学习研究进展[J].小型微型计算机系统,2023,44(11):2442-2449. 被引量：3

引证文献1

1施玉倩,巫朝霞.基于Logistic最优化鲁棒性的聚类联邦学习[J].软件工程,2024,27(6):15-20.

1张艳艳.提升小学语文阅读教学有效性的路径探索[J].小小说月刊（下半月）,2022(8):239-241.
2刘晶,朱家豪,袁闰萌,季海鹏.非独立同分布工业大数据下联邦动态加权学习方法[J].计算机集成制造系统,2023,29(5):1602-1614. 被引量：1
3洪永淼,孙佳婧,McCabe Brendan,汪寿阳.基于调整样本值域的自正则结构性变化的检验[J].复印报刊资料（统计与精算）,2022(5):3-13.
4石雅琳,陈占寿.自正则检验关于方差变点的稳健性分析[J].青海师范大学学报（自然科学版）,2023,39(1):37-47.
5何常乐,袁培燕.边缘联邦学习的客户端选择机制[J].计算机应用,2023,43(S01):147-153.
6毛磊,郑婷一.基于数据挖掘算法的大学生体测数据分析及体育教学改革研究[J].体育视野,2023(6):100-102.
7巫文佳,任凌飞,黄少武,杨文元.网球影像智能化协助训练与竞赛分析[J].闽南师范大学学报（自然科学版）,2023,36(2):120-125.
8彭新雅,梁乐,金石.基于深度强化学习的联邦学习客户选择[J].移动通信,2023,47(6):63-68.
9彭振华.《特别文摘》在我心中[J].特别文摘,2019(3).
10郑梓煜,程新皓(图).莾人[J].新周刊,2019(21):94-101.

计算机应用

2023年第7期

浏览历史

内容加载中请稍等...

非独立同分布数据下的自正则化联邦学习优化方法被引量：1

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

非独立同分布数据下的自正则化联邦学习优化方法 被引量：1

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

非独立同分布数据下的自正则化联邦学习优化方法被引量：1