基于分层聚类的个性化联邦学习隐私保护框架

Hierarchical Clustering Federated Learning Framework for Personalized Privacy-Preserving

下载PDF

导出

摘要联邦学习作为一种新兴的隐私保护分布式机器学习框架,利用密码原语有效地解决了隐私泄露问题,如何在分布式环境中防止投毒攻击已成为联邦学习的研究热点。目前的研究工作大部分依赖于数据独立同分布情况,并使用明文进行恶意梯度识别,无法处理数据异构带来的挑战。为了解决上述问题,文章提出一个基于分层聚类的个性化联邦学习隐私保护框架。该框架基于坐标感知的中位数算法对梯度进行加密,并采用安全余弦相似度方案识别恶意梯度,通过层次聚合方法增强模型在独立同分布和非独立同分布场景下的鲁棒性。在MNIST、CIFAR-10和Fashion-MNIST三个公开数据集上的实验结果表明,该模型具有较强的隐私保护能力。与FedAVG、PPeFL、中位数、裁剪均值和聚类等算法相比,该模型准确率分别提升了14.90%、9.59%、29.50%、26.57%和23.19%。 Federated learning(FL)is an emerging framework of privacy-preserving distributed machine learning that effectively deals with the privacy leakage problem by utilizing cryptographic primitives.However,how to prevent poisoning attacks in distributed situations has recently become a research hotspot FL concern.Currently,most existing works rely on an independently identical distribution situation and identify malicious gradients using plaintext,which cannot handle the data heterogeneity scenario challenges and imposes significant privacy leakage risks due to releasing unencrypted gradients.To address these challenges,this paper proposed a hierarchical clusteri federated learning framework for personalized privacy-preserving.The framework exploited homomorphic encryption by employing the median coordinate as the benchmark.Subsequently,it employed a secure cosine similarity scheme to identify poisonous gradients,and it innovatively utilized clustering as part of the defense mechanism and developed a hierarchical aggregation that enhances the proposed mode’s robustness in IID and non-IID scenarios.Experimental results on the MNIST,CIFAR-10 and Fashion-MNIST datasets indicates that it has powerful privacy-preserving capabilities,and compared to existing defense strategies of FedAVG,PPeFL Media,Trimmed Mean and Clustering,the proposed method achieves an average improvement of 14.90%,9.59%,29.50%,26.57%and 23.19%on accuracy,respectively.

作者郭倩赵津过弋 GUO Qian;ZHAO Jin;GUO Yi(Department of Computer Science and Engineering,East China University of Science and Technology,Shanghai 200237,China;School of Computer Science,Fudan University,Shanghai 200433,China)

机构地区华东理工大学信息科学与工程学院复旦大学计算机科学技术学院

出处《信息网络安全》 CSCD 北大核心 2024年第8期1196-1209,共14页 Netinfo Security

基金上海市科学技术委员会科技计划项目[22DZ1204903,22511104800]。

关键词联邦学习层次聚合同态加密隐私保护 federated learning hierarchical aggregation homomorphic encryption privacy-preserving

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1刘炜,唐琮轲,马杰,田钊,王琦,佘维.基于区块链和动态评估的隐私保护联邦学习模型[J].计算机研究与发展,2023,60(11):2583-2593. 被引量：2

二级参考文献3

1祝烈煌,高峰,沈蒙,李艳东,郑宝昆,毛洪亮,吴震.区块链隐私保护研究综述[J].计算机研究与发展,2017,54(10):2170-2186. 被引量：257
2高胜,袁丽萍,朱建明,马鑫迪,章睿,马建峰.一种基于区块链的隐私保护异步联邦学习[J].中国科学：信息科学,2021,51(10):1755-1774. 被引量：15
3周炜,王超,徐剑,胡克勇,王金龙.基于区块链的隐私保护去中心化联邦学习模型[J].计算机研究与发展,2022,59(11):2423-2436. 被引量：14

共引文献1

1侯泽超,董建刚.去中心化场景下的隐私保护联邦学习优化方法[J].计算机应用研究,2024,41(8):2419-2426.

1梁礼明,金家新,冯耀,卢宝贺.融合坐标感知与混合提取的视网膜病变分级算法[J].光电工程,2024,51(1):43-54. 被引量：1
2刘会强,李殊瑶,张爱军,慕腾,王秀丽,文福拴.四大沙漠风光基地空间布局及时序优化策略[J].内蒙古电力技术,2024,42(4):48-55.
3李可,王晓峰,王虎.面向异构数据的个性化联邦多任务学习优化方法[J].计算机应用研究,2024,41(9):2641-2648.
4张汉成.健康医疗数据共享的现实困境与合规因应[J].医学与哲学,2024,45(17):52-57.
5张点,董云卫.基于掩膜自动编码器的对抗对比蒸馏算法[J].计算机学报,2024,47(10):2274-2288.
6易宗剑.基于邻域特征融合半监督的图像分类方法[J].电子制作,2024,32(16):55-58.
7佟国香,刘洪俊,田飞翔.基于卷积神经网络的图像数据增强优化策略研究[J].计算机与数字工程,2024,52(7):2183-2188.
8孙中原,邵成立,宋娜,王鑫,韩青,赵倩.国土空间基础信息平台集成监控视频数据的方法研究[J].自然资源信息化,2024(4):27-33.
9王梦可,杨朝晖,查晓婧,夏银水.基于分区再训练的RRAM阵列多缺陷容忍算法[J].计算机应用研究,2024,41(10):3068-3072.
10王慧敏,王智强,郭婷,梁吉业.一种基于主动学习的开放集图像识别方法[J].小型微型计算机系统,2024,45(10):2442-2448.

信息网络安全

2024年第8期

浏览历史

内容加载中请稍等...

基于分层聚类的个性化联邦学习隐私保护框架

参考文献1

二级参考文献3

共引文献1

相关作者

相关机构

相关主题

浏览历史