基于自监督与蒸馏约束的正则化类增量学习方法

A Regularized Class Incremental Learning Method Based on Self-Supervision with Distillation Constraints

下载PDF

导出

摘要针对神经网络模型在增量学习中存在灾难性遗忘问题,提出一种基于自监督与隐层蒸馏约束的正则化类增量学习方法,包括自监督伪标签预测、隐层蒸馏约束和参数正则化.首先基于贝叶斯和信息论提出一种对模型参数重要性评价的正则化策略;然后利用自监督伪标签预测增强模型的表征能力,并保留隐层特征,通过加入高斯噪声提高隐层特征的泛化能力;最后使用蒸馏约束方法与交叉熵分类损失对历史任务的隐层特征与输出层特征进行训练.在CIFAR-10和CIFAR-100数据集上的实验结果表明,所提方法取得较好的效果,其中,在CIFAR-100数据集上的平均准确率和遗忘率分别达到64.16%和15.95%;该方法能够有效地减少灾难性遗忘的影响. Aiming at the problem of catastrophic forgetting in incremental learning of neural network mod-els,a regularized class of incremental learning method based on self-supervision with hidden layer distilla-tion constraints is proposed,including pseudo label prediction,knowledge distillation and parameter regu-larization.First,a regularization constraint method based on Bayesian and information theory is proposed for the importance evaluation of model parameters,and then the characterization ability of the model is en-hanced by using self-supervised pseudo label prediction,and the hidden layer features are preserved by adding Gaussian noise to improve the generalization ability of the features.The hidden layer features and output layer features of the historical task are trained using a distillation constraint method with cross-entropy classification loss.The experimental results show that better results are achieved on the CIFAR-10 and CIFAR-100 datasets,where the average accuracy and forgetting rates reach 64.16%and 15.95%,respectively,on the CIFAR-100 dataset.The proposed method is effective in reducing the effects of catastrophic forgetting.

作者徐岸吴永明郑洋 Xu An;Wu Yongming;Zheng Yang(State Key Laboratory of Public Big Data,Guizhou University,Guiyang 550025;Key Laboratory of Advanced Manufacturing Technology of Ministry of Education,Guizhou University,Guiyang 550025)

机构地区贵州大学公共大数据国家重点实验室贵州大学现代制造教育部重点实验室

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第5期775-785,共11页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(51505094) 贵州省科学技术基金计划(zk[2023]一般079) 贵州财经大学引进人才科研启动项目(2023YJ17).

关键词增量学习正则化知识蒸馏自监督伪标签预测 incremental learning regularization knowledge distillation self-supervision pseudo label prediction

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1刘耿欣,胡瑞珍.基于全局与局部特征对比的点云自监督学习[J].计算机辅助设计与图形学学报,2022,34(9):1323-1333. 被引量：1
2孙蕴瀚,史金龙,孙正兴.利用自监督卷积网络估计单图像深度信息[J].计算机辅助设计与图形学学报,2020,32(4):643-651. 被引量：5
3韩亚楠,刘建伟,罗雄麟.连续学习研究进展[J].计算机研究与发展,2022,59(6):1213-1239. 被引量：11
4陈加,陈亚松,李伟浩,田元,刘智,何英.深度学习在视频对象分割中的应用与展望[J].计算机学报,2021,44(3):609-631. 被引量：13
5刘玉杰,周彩云,李宗民,李华.基于增强特征融合网络的行人重识别方法[J].计算机辅助设计与图形学学报,2021,33(2):232-240. 被引量：7
6朱向雷,王海弛,尤翰墨,张蔚珩,张颖异,刘爽,陈俊洁,王赞,李克秋.自动驾驶智能系统测试研究综述[J].软件学报,2021,32(7):2056-2077. 被引量：29

二级参考文献10

1田元,王乘,管涛.基于FCM和图割的交互式图像分割方法[J].工程图学学报,2010,31(2):123-127. 被引量：3
2李宗民,公绪超,刘玉杰.多特征联合建模的视频对象分割技术研究[J].计算机学报,2013,36(11):2356-2363. 被引量：7
3黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
4李志杰,李元香,王峰,何国良,匡立.面向大数据分析的在线学习算法综述[J].计算机研究与发展,2015,52(8):1707-1721. 被引量：39
5孙焘,陈康睿.基于超像素联接权模型的视频分割算法[J].计算机科学,2016,43(2):302-306. 被引量：1
6陈华榕,钱康来,王斌.结合支持向量机和图割的视频分割[J].计算机辅助设计与图形学学报,2017,29(8):1389-1395. 被引量：9
7田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：236
8关柏良,周凡,林淑金,罗笑南.面向三维模型分割的边界感知点云神经网络[J].计算机辅助设计与图形学学报,2020,32(1):147-155. 被引量：3
9王赞,闫明,刘爽,陈俊洁,张栋迪,吴卓,陈翔.深度神经网络测试研究综述[J].软件学报,2020,31(5):1255-1275. 被引量：38
10朱威,绳荣金,汤如,何德峰.基于动态图卷积和空间金字塔池化的点云深度学习网络[J].计算机科学,2020,47(7):192-198. 被引量：9

共引文献60

1赵敬伟,林珊玲,梅婷,林志贤,郭太良.基于YOLACT与Transformer相结合的实例分割算法研究[J].半导体光电,2023,44(1):134-140. 被引量：2
2王嘉凯,刘艾杉,李思民,刘祥龙,吴文峻.智能系统全生命周期安全测试理论与方法[J].智能安全,2023,2(1):27-36. 被引量：1
3辛菁,杜柯楠,王媛媛,刘丁.基于迁移学习的移动机器人单帧图像坡度检测算法[J].智能系统学报,2021,16(1):81-91. 被引量：1
4高毅.基于步态识别的跨场景多目标跟踪算法[J].控制工程,2021,28(7):1375-1381. 被引量：5
5王奕涵,陈方圆.一种基于ONEPOINT的自动驾驶解决方案[J].长江信息通信,2021,34(10):31-34. 被引量：3
6何佳颖,田言康,刘飞虎.自动驾驶试验场及虚拟测试场景研究[J].汽车实用技术,2022,47(5):21-25. 被引量：2
7陈红初,王安霞.视差估计下VR图像几何特征数字化提取[J].计算机仿真,2021,38(12):150-154. 被引量：4
8罗会兰,周逸风.深度学习单目深度估计研究进展[J].中国图象图形学报,2022,27(2):390-403. 被引量：5
9李耀仟,李才子,刘瑞强,司伟鑫,金玥明,王平安.面向手术器械语义分割的半监督时空Transformer网络[J].软件学报,2022,33(4):1501-1515. 被引量：5
10吴昊,王浩,苏醒,李明昊,许封元,仲盛.自动驾驶系统中视觉感知模块的安全测试[J].计算机研究与发展,2022,59(5):1133-1147. 被引量：3

1秘蓉新,姚文文,吴兵灏.基于多任务学习的行人重识别算法研究[J].电信科学,2024,40(6):127-136.
2童同,肖阳,马田瑶,卢菁.基于Stable Diffusion的图像生成与多模态编辑智能体[J].通信世界,2024(13):46-48.
3张聚文,李永鑫.基于收敛-约束法的岩溶隧道支护时机研究[J].合肥工业大学学报（自然科学版）,2024,47(7):986-994.
4李伯恺.基于优化蜂群算法的隐蔽性网络攻击行为自适应辨识模型[J].电子设计工程,2024,32(16):97-101.

计算机辅助设计与图形学学报

2024年第5期

浏览历史

内容加载中请稍等...

基于自监督与蒸馏约束的正则化类增量学习方法

参考文献6

二级参考文献10

共引文献60

相关作者

相关机构

相关主题

浏览历史