一种有效的困难样本学习策略

Effective learning strategy for hard samples

下载PDF

导出

摘要针对困难样本在深度哈希算法中难以收敛以及过多的困难样本产生的噪声干扰问题,提出一种通过损失决定梯度的困难样本学习策略。首先,提出一种非均匀梯度归一化方法,通过计算困难与整体样本损失的比例,对整体样本反向传播梯度进行加权,提高模型对困难样本的学习能力;其次,针对存在过量困难样本的情况,设计了一种加权随机采样方法,根据损失大小对样本进行加权欠采样,滤除噪声并保留少量的困难样本避免过拟合。基于公开数据集,哈希特征检索平均精度值分别约提高了4.7%与3.4%。实验结果表明,该策略改进的哈希算法准确率优于对标哈希算法,能更好地学习到数据集中困难样本的特征信息。 To improve the learning efficiency for hard samples and reduce noise interference caused by superfluous hard samples in deep hash algorithm,a generic strategy called Loss to Gradient for hard sample learning is proposed.First,a non-uniform gradient normalization method is proposed to improve the learning ability of models for hard samples.Back propagation gradients are weighted by calculating the loss ratio between hard samples and all samples.Furthermore,a weighted random sampling method is designed for accuracy improvement with superfluous hard samples.According to the loss,training samples are weighted and under-sampled for noise filtering and a small number of hard samples are retained to avoid over-fitting.Based on open datasets,the average accuracy of hash feature retrieval is increased by 4.7%and 3.4%,respectively.Experimental results show that the improved method outperforms other benchmarking methods in accuracy,proving that the feature representation of hard samples in the dataset can be effectively learned.

作者曹艺蔡晓东 CAO Yi;CAI Xiaodong(School of Information and Communication Engineering,Guilin University of Electronic Technology,Guilin 541004,China)

机构地区桂林电子科技大学信息与通信学院

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2021年第3期99-105,共7页 Journal of Xidian University

基金 2018年新疆维吾尔自治区重点研发计划(2018B03022-1,2018B03022-2) 桂林市科技计划项目(20190412)。

关键词采样分析梯度算法哈希函数深度神经网络 sample analysis gradient method hash functions deep neural networks

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1曾燕,陈岳林,蔡晓东.结合全局与局部池化的深度哈希人脸识别算法[J].西安电子科技大学学报,2018,45(5):163-169. 被引量：12

共引文献11

1沈悦.铁路异物入侵深度识别网络快速训练算法[J].电子设计工程,2019,27(22):48-54. 被引量：1
2程实,沐燕舟,赵赟.一种基于改进JDA算法的人脸检测方法[J].计算机与数字工程,2019,47(11):2871-2875. 被引量：4
3潘铭津,何家峰,骆德汉.一种基于仿生嗅觉的室内有害气体成分识别方法[J].信息技术与网络安全,2019,38(12):48-51. 被引量：2
4张剑飞,崔文升,王真,杜晓昕.基于增强LetNet-5的非霍奇金淋巴瘤辅助诊断[J].科学技术与工程,2020,20(16):6527-6531. 被引量：6
5曹晓杰,么娆,严雨灵.应用迁移学习的卷积神经网络花卉图像识别[J].计算机应用与软件,2020,37(8):142-148. 被引量：22
6李启南,孙海鑫,孙可佳.基于改进B-CNN的轨枕挡肩裂纹图像细粒度分类[J].激光与光电子学进展,2020,57(14):122-130. 被引量：5
7薛珊,李广青,吕琼莹,毛逸维.基于卷积神经网络的反无人机系统声音识别方法[J].工程科学学报,2020,42(11):1516-1524. 被引量：11
8张壮领,陈彩娜,毕明利.基于ARM+FPGA方案的便携式智能勘灾设备的设计[J].工业仪表与自动化装置,2021(3):55-60. 被引量：1
9杨乐,甘忠,李义龙,薛超,凌子昊,石望兴.基于改进卷积神经网络的零件识别[J].仪表技术与传感器,2022(5):82-87. 被引量：2
10葛先雷,杨帅斌.基于CNN的手写中文数字识别研究[J].太原师范学院学报（自然科学版）,2022,21(4):53-57. 被引量：1

1刘娅汐,皇甫伟.面向物联网业务绿色接入的异构蜂窝网络优化[J].工程科学学报,2020,42(4):483-489. 被引量：6
2王磊,刘雨,刘志中,齐俊艳.处理不平衡数据的聚类欠采样加权随机森林算法[J].计算机应用研究,2021,38(5):1398-1402. 被引量：12
3刘伟,赵亚男,韩翠仙,王奥霖,袁军海,杨旭光,范洁茹,周益林.小麦白粉病菌分生孢子田间传播的初步研究[J].植物保护,2020,46(3):47-51. 被引量：4
4孙锐,方林凤,梁启丽,张旭东.孪生网络框架下融合显著性和干扰在线学习的航拍目标跟踪算法[J].电子与信息学报,2021,43(5):1414-1423. 被引量：7
5桂钦昌,杜德斌,刘承良,徐伟,侯纯光,焦美琪,翟晨阳,卢函.全球城市知识流动网络的结构特征与影响因素[J].地理研究,2021,40(5):1320-1337. 被引量：49
6许建梅,杨芳,林卿,王佳慧,艾竹君.基于低场核磁共振横向弛豫谱的注水肉检测模型建立[J].食品工业科技,2021,42(11):226-232.

西安电子科技大学学报

2021年第3期

浏览历史

内容加载中请稍等...

一种有效的困难样本学习策略

参考文献1

共引文献11

相关作者

相关机构

相关主题

浏览历史