-
题名基于自引导进化策略的高效自动化数据增强算法
被引量:1
- 1
-
-
作者
朱光辉
陈文忠
朱振南
袁春风
黄宜华
-
机构
计算机软件新技术国家重点实验室(南京大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第6期3013-3035,共23页
-
基金
国家自然科学基金(62102177,U1811461)
江苏省自然科学基金(BK20210181)
江苏省重点研发计划(BE2021729)。
-
文摘
深度学习在图像、文本、语音等媒体数据的分析任务上取得了优异的性能.数据增强可以非常有效地提升训练数据的规模以及多样性,从而提高模型的泛化性.但是,对于给定数据集,设计优异的数据增强策略大量依赖专家经验和领域知识,而且需要反复尝试,费时费力.近年来,自动化数据增强通过机器自动设计数据增强策略,已引起了学界和业界的广泛关注.为了解决现有自动化数据增强算法尚无法在预测准确率和搜索效率之间取得良好平衡的问题,提出一种基于自引导进化策略的自动化数据增强算法SGES AA.首先,设计一种有效的数据增强策略连续化向量表示方法,并将自动化数据增强问题转换为连续化策略向量的搜索问题.其次,提出一种基于自引导进化策略的策略向量搜索方法,通过引入历史估计梯度信息指导探索点的采样与更新,在能够有效避免陷入局部最优解的同时,可提升搜索过程的收敛速度.在图像、文本以及语音数据集上的大量实验结果表明,所提算法在不显著增加搜索耗时的情况下,预测准确率优于或者匹配目前最优的自动化数据增强方法.
-
关键词
深度学习
数据增强
自动化机器学习
自引导进化策略
-
Keywords
deep learning
data augmentation
automated machine learning
self-guided evolution strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-