面向异构流式数据的高性能联邦持续学习算法

High-performance federated continual learning algorithm for heterogeneous streaming data

下载PDF

导出

摘要为了缓解提供智能服务的AI模型训练流式数据存在模型性能差、训练效率低等问题,在具有隐私数据的分布式终端系统中,提出了一种面向异构流式数据的高性能联邦持续学习算法(FCL-HSD)。为了缓解当前模型遗忘旧数据问题,在本地训练阶段引入结构可动态扩展模型,并设计扩展审核机制,以较小的存储开销来保障AI模型识别旧数据的能力;考虑到终端的数据异构性,在中央节点侧设计了基于数据分布相似度的全局模型定制化策略,并为模型的不同模块执行分块聚合方式。在不同数据集下多种数据增量场景中验证了所提算法的可行性和有效性。实验结果证明,相较于现有工作,所提算法在保证模型对新数据具有分类能力的前提下,可以有效提升模型对旧数据的分类能力。 Aiming at the problems of poor model performance and low training efficiency in training streaming data of AI models that provide intelligent services,a high-performance federated continual learning algorithm for heterogeneous streaming data(FCL-HSD)was proposed in the distributed terminal system with privacy data.In order to solve the problem of the current model forgetting old data,a model with dynamically extensible structure was introduced in the local training stage,and an extension audit mechanism was designed to ensure the capability of the AI model to recognize old data at the cost of small storage overhead.Considering the heterogeneity of terminal data,a customized global model strategy based on data distribution similarity was designed at the central server side,and an aggregation-by-block manner was implemented for different modules of the model.The feasibility and effectiveness of the proposed algorithm were verified under various data increment scenarios with different data sets.Experimental results show that,compared with existing works,the proposed algorithm can effectively improve the model performance to classify old data on the premise of ensuring the capability to classify new data.

作者姜慧何天流刘敏孙胜王煜炜 JIANG Hui;HE Tianliu;LIU Min;SUN Sheng;WANG Yuwei(Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China;School of Computer Science and Technology,University of Chinese Academy of Sciences,Beijing 100190,China;Zhongguancun Laboratory,Beijing 100084,China)

机构地区中国科学院计算技术研究所中国科学院大学计算机科学与技术学院中关村实验室

出处《通信学报》 EI CSCD 北大核心 2023年第5期123-136,共14页 Journal on Communications

基金国家重点研发计划基金资助项目(No.2021YFB2900102) 国家自然科学基金资助项目(No.62072436)。

关键词异构数据流式数据联邦学习联邦持续学习灾难性遗忘 heterogeneous data streaming data federated learning federated continual learning catastrophic forgetting

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1骆子铭,许书彬,刘晓东.基于机器学习的TLS恶意加密流量检测方案[J].网络与信息安全学报,2020,6(1):77-83. 被引量：16

二级参考文献6

1王可.MD5算法研究[J].中文信息（程序春秋）,2002(2):78-81. 被引量：2
2鲁刚,郭荣华,周颖,王军.恶意流量特征提取综述[J].信息网络安全,2018(9):1-9. 被引量：12
3刘铭,吴朝霞.支持向量机理论与应用[J].科技视界,2018(23):68-69. 被引量：9
4张蕾,崔勇,刘静,江勇,吴建平.机器学习在网络空间安全研究中的应用[J].计算机学报,2018,41(9):1943-1975. 被引量：148
5王琳,封化民,刘飚,崔明辉,赵会,孙曦音.基于混合方法的SSL VPN加密流量识别研究[J].计算机应用与软件,2019,36(2):315-322. 被引量：26
6朴杨鹤然,任俊玲.基于Stacking的恶意网页集成检测方法[J].计算机应用,2019,39(4):1081-1088. 被引量：7

共引文献15

1陈纪龙,张鸿宇,张聪益,宋子康,涂然.基于在线学习的分布式流量实时分析系统设计[J].技术与市场,2022,29(3):100-101.
2陆勰,徐雷,张曼君,张超.攻防对抗中的加密恶意流量分析技术[J].信息安全与通信保密,2022(3):71-79.
3张荣华,刘智,罗琴.一种基于QBC不一致性的恶意加密流量识别方法[J].电子测量技术,2022,45(1):28-34. 被引量：1
4杨学超.基于Text-GAN分析加密流量识别关键技术[J].信息系统工程,2022,35(4):93-96. 被引量：1
5康鹏,杨文忠,马红桥.TLS协议恶意加密流量识别研究综述[J].计算机工程与应用,2022,58(12):1-11. 被引量：7
6霍跃华,赵法起,吴文昊.多特征融合的煤矿网络加密恶意流量检测方法[J].工矿自动化,2022,48(7):142-148. 被引量：4
7杨娜.基于分组密码算法的网络传输数据信息加密方法研究[J].信息与电脑,2022,34(17):210-212. 被引量：6
8谢绒娜,马铸鸿,李宗俞,田野.基于卷积神经网络的加密流量分类方法[J].网络与信息安全学报,2022,8(6):84-91. 被引量：3
9史国振,李昆阳,刘瑶,杨永健.基于深度残差胶囊网络与注意力机制的加密流量识别方法[J].网络与信息安全学报,2023,9(1):32-41. 被引量：3
10梁翔宇,张恒汝,周瑶,余一帆,闵帆.加密流量分类的特征回放集成学习方法[J].山西大学学报（自然科学版）,2023,46(1):1-9. 被引量：1

1陈博戬,沈长青,石娟娟,朱忠奎,冯毅雄.故障类型增量场景下基于终身学习的轴承故障诊断方法[J].轴承,2022(9):62-69. 被引量：1
2黄健豪,郑波,陈国庆.基于无监督迁移学习的核范数最大化轴承故障诊断方法[J].科学技术与工程,2023,23(11):4638-4646. 被引量：3

通信学报

2023年第5期

浏览历史

内容加载中请稍等...

面向异构流式数据的高性能联邦持续学习算法

参考文献1

二级参考文献6

共引文献15

相关作者

相关机构

相关主题

浏览历史