联邦学习在高度数据异构场景下的泛化鲁棒性增强被引量：1

Enhancing generalization robustness of federated learning inhighly heterogeneous environments

导出

摘要联邦学习(federated learning,FL)是一种以保护客户隐私数据为中心的分布式处理网络,为解决隐私泄露问题提供了前景良好的解决方案.然而,FL的一个主要困境是高度非独立同分布(non-independent and identically distributed,non-IID)的数据会导致全局模型性能很差.尽管相关研究已经探讨了这个问题,但本文发现当面对non-IID数据、不稳定的客户端参与以及深度模型时,现有方案和标准基线FedAvg相比,只有微弱的优势或甚至更差,因此严重阻碍了FL的隐私保护应用价值.为解决这个问题,本文提出了一种对non-IID数据鲁棒的优化方案:FedUp.该方案在保留FL隐私保护特点的前提下,进一步提升了全局模型的泛化鲁棒性.FedUp的核心思路是最小化全局经验损失函数的上限来保证模型具有低的泛化误差.大量仿真实验表明,FedUp显著优于现有方案,并对高度non-IID数据以及不稳定和大规模客户端的参与具有鲁棒性. Federated learning(FL)is a distributed processing network that focuses on protecting client privacy data,providing a promising solution for addressing privacy leakage issues.However,a major quagmire in FL is to train clients'models over signi cantly non-independent and identically distributed(non-IID)data,which would lead to a low-performance global model.Although this issue has been investigated by many previous works,this paper nds that they have little or no performance improvement over the standard baseline FedAvg when facing highly non-IID data,unstable client participation,and deep models,seriously hindering the privacy protection application value of FL.To address this issue,a new solution called FedUp has been proposed.FedUp is a robust optimization solution for non-IID FL that improves the generalization robustness of the global model while retaining the privacy protection characteristics of FL.FedUp minimizes the upper bound of the global empirical loss function to ensure that the models exhibit smaller generalization errors.Simulation experiments show that FedUp achieves signi cant advantages over state-of-the-art methods,and is robust to highly non-IID data as well as unstable and large-cohort client participation.This solution has the potential to improve the performance of FL and make it more practical for privacy protection applications.

作者万伟胡胜山陆建荣李明慧周子淇金海 Wei WAN;Shengshan HU;Jianrong LU;Minghui LI;Ziqi ZHOU;Hai JIN(School of Cyber Science and Engineering,Huazhong University of Science and Technology,Wuhan 430074,China;School of Software Engineering,Huazhong University of Science and Technology,Wuhan 430074,China;School of Computer Science and Technology,Huazhong University of Science and Technology,Wuhan 430074,China;National Engineering Research Center for Big Data Technology and System,Wuhan 430074,China;Services Computing Technology and System Lab,Wuhan 430074,China;Hubei Key Laboratory of Distributed System Security,Wuhan 430074,China;Hubei Engineering Research Center on Big Data Security,Wuhan 430074,China;Cluster and Grid Computing Lab,Wuhan 430074,China)

机构地区华中科技大学网络空间安全学院华中科技大学软件学院华中科技大学计算机科学与技术学院大数据技术与系统国家地方联合工程研究中心服务计算技术与系统教育部重点实验室分布式系统安全湖北省重点实验室湖北省大数据安全工程技术研究中心集群与网格计算湖北省重点实验室

出处《中国科学：信息科学》 CSCD 北大核心 2024年第3期566-581,共16页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:U20A20177) 湖北省技术创新计划重点研发专项(批准号:2021BAA032)资助项目。

关键词分布式网络联邦学习异构优化泛化性鲁棒性隐私保护 distributed network federated learning heterogeneous optimization generalization robustness privacy protection

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1冯霁,蔡其志,姜远.联邦学习下对抗训练样本表示的研究[J].中国科学：信息科学,2021,51(6):900-911. 被引量：8
2高胜,袁丽萍,朱建明,马鑫迪,章睿,马建峰.一种基于区块链的隐私保护异步联邦学习[J].中国科学：信息科学,2021,51(10):1755-1774. 被引量：16
3梁锋,羊恩跃,潘微科,杨强,明仲.基于联邦学习的推荐系统综述[J].中国科学：信息科学,2022,52(5):713-741. 被引量：11
4倪宣明,沈鑫圆,张海.面向异构数据的自适应个性化联邦学习——一种基于参数分解和持续学习的方法[J].中国科学：信息科学,2022,52(12):2306-2320. 被引量：4

二级参考文献10

1LI Ming, WANG Wei & ZHOU ZhiHua National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210093, China.Exploiting remote learners in Internet environment with agents[J].Science China(Information Sciences),2010,53(1):64-76. 被引量：1
2Zhi-Hua ZHOU.Learnware： on the future of machine learning[J].Frontiers of Computer Science,2016,10(4):589-590. 被引量：20
3Jian CHENG,Pei-song WANG,Gang LI,Qing-hao HU,Han-qing LU.Recent advances in efficient computation of deep convolutional neural networks[J].Frontiers of Information Technology & Electronic Engineering,2018,19(1):64-77. 被引量：37
4李效光,李晖,李凤华,朱辉.差分隐私综述[J].信息安全学报,2018,3(5):92-104. 被引量：22
5黄立威,江碧涛,吕守业,刘艳博,李德毅.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647. 被引量：430
6Chao LIN,Debiao HE,Sherali ZEADALLY,Neeraj KUMAR,Kim-Kwang Raymond CHOO.SecBCS: a secure and privacy-preserving blockchain-based crowdsourcing system[J].Science China(Information Sciences),2020,63(3):16-29. 被引量：6
7吴俊杰,刘冠男,王静远,左源,部慧,林浩.数据智能:趋势与挑战[J].系统工程理论与实践,2020,40(8):2116-2149. 被引量：69
8冯霁,蔡其志,姜远.联邦学习下对抗训练样本表示的研究[J].中国科学：信息科学,2021,51(6):900-911. 被引量：8
9中华人民共和国数据安全法[J].中华人民共和国全国人民代表大会常务委员会公报,2021(5):951-956. 被引量：24
10高胜,袁丽萍,朱建明,马鑫迪,章睿,马建峰.一种基于区块链的隐私保护异步联邦学习[J].中国科学：信息科学,2021,51(10):1755-1774. 被引量：16

共引文献31

1张沁楠,朱建明,高胜,熊泽辉,丁庆洋,朴桂荣.基于区块链和贝叶斯博弈的联邦学习激励机制[J].中国科学：信息科学,2022,52(6):971-991. 被引量：9
2李济伟,商晴庆,孙建刚,董耀众,李伟良.基于区块链的联邦学习应用研究[J].电子测试,2022,36(12):138-140. 被引量：2
3倪宣明,沈鑫圆,张海.面向异构数据的自适应个性化联邦学习——一种基于参数分解和持续学习的方法[J].中国科学：信息科学,2022,52(12):2306-2320. 被引量：4
4朱志文,齐国强,杨恺熠,赵永根,余卓,俞刚.以咳嗽为第一主诉的儿童疾病医疗数据共享模型构建[J].医学信息学杂志,2023,44(3):64-68.
5王波,代晓蕊,王伟,于菲,魏飞,赵梦楠.面向联邦学习的对抗样本投毒攻击[J].中国科学：信息科学,2023,53(3):470-484. 被引量：3
6张潇扬,窦一凡,张成洪,黄丽华.企业数据联邦学习的收益分享机制研究[J].工程管理科技前沿,2023,42(2):8-15. 被引量：1
7秦宝东,杨国栋,马宇涵.一种基于异步联邦学习的安全聚合机制[J].西安邮电大学学报,2023,28(1):50-61. 被引量：1
8郝戌京,李方一.基于联邦学习的光伏电站发电效率对比与低效诊断研究[J].电力大数据,2023,26(3):28-36. 被引量：2
9江荣旺,魏爽,龙草芳,杨明.基于联邦学习的车联网虚假位置攻击检测研究[J].信息安全研究,2023,9(8):754-761. 被引量：1
10高莹,陈晓峰,张一余,王玮,邓煌昊,段培,陈培炫.联邦学习系统攻击与防御技术研究综述[J].计算机学报,2023,46(9):1781-1805. 被引量：9

同被引文献4

1马千飘,贾庆民,刘建春,徐宏力,谢人超,黄韬.异构边缘计算环境下异步联邦学习的节点分组与分时调度策略[J].通信学报,2023,44(11):79-93. 被引量：4
2段昕汝,陈桂茸,姬伟峰,申秀雨.基于联邦学习的多源异构网络无数据融合方法[J].空军工程大学学报,2024,25(1):90-97. 被引量：2
3高迢康,靳晓宁,赖英旭.模型异构的联邦学习入侵检测[J].北京工业大学学报,2024,50(5):543-557. 被引量：2
4傅刚.非独立同分布数据下联邦学习算法中优化器的对比分析[J].计算机系统应用,2024,33(5):228-238. 被引量：1

引证文献1

1胡大强,张志磊,康艳,吴纯璐.联邦学习环境下异构数据集的软件缺陷预测性能提升策略——以通信效率和隐私保护为中心的实证研究[J].无线互联科技,2024,21(15):82-85.

1刘晓春.无线电频谱数据的实时监测与大数据分析[J].通信电源技术,2024,41(2):225-227.
2叶芬.数字技术在环境设计中的创新运用[J].太原城市职业技术学院学报,2024(1):59-61.
3温晓年.数据思政的内涵特征、负面效应与规避路径[J].重庆工商大学学报（社会科学版）,2024,41(2):157-164.
4景丽,李琰,王玲玲.含萘高性能聚酯关键单体专利分析[J].炼油与化工,2024,35(1):5-9.
5刘晓东,缪东晶,姚燕,王长云,王德利,李连福,刘洋,蔡晋辉,李建双.全站仪气象改正公式优化研究[J].计量学报,2024,45(3):386-394.
6Shuang Xu,Xiaojie Liu,Dengao Li,Jumin Zhao.IQABC-Based Hybrid Deployment Algorithm for Mobile Robotic Agents Providing Network Coverage[J].Tsinghua Science and Technology,2024,29(2):589-604.
7Hui Xiao,Ion Grama,Quansheng Liu.Berry-Esseen bounds and moderate deviations for the norm, entries and spectral radius of products of positive random matrices[J].Science China Mathematics,2024,67(3):627-646.
8Cong-hua CHENG.Reliability of a Multicomponent Stress-strength Model Based on a Bivariate Kumaraswamy Distribution with Censored Data[J].Acta Mathematicae Applicatae Sinica,2024,40(2):478-507.

中国科学：信息科学

2024年第3期

浏览历史

内容加载中请稍等...

联邦学习在高度数据异构场景下的泛化鲁棒性增强被引量：1

参考文献4

二级参考文献10

共引文献31

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

联邦学习在高度数据异构场景下的泛化鲁棒性增强 被引量：1

参考文献4

二级参考文献10

共引文献31

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

联邦学习在高度数据异构场景下的泛化鲁棒性增强被引量：1