基于有偏采样的连续进化神经架构搜索

Continuous Evolutionary Neural Architecture Search Based on Biased Sampling

下载PDF

导出

摘要由于需要对每一个搜索到的架构进行独立的性能评估,神经架构搜索(NAS)往往需要耗费大量的时间和计算资源。提出一种基于有偏采样的连续进化NAS方法(OEvNAS)。OEvNAS在架构搜索过程中维护一个超网络,搜索空间中所有的神经网络架构都是该超网络的子网络。在演化计算的每一代对超网络进行少量的训练,子网络直接继承超网络的权重进行性能评估而无需重新训练。为提高超网络的预测性能,提出一种基于有偏采样的超网络训练策略,以更大的概率训练表现优异的网络,在减少权重耦合的同时提高训练效率。此外,设计一种新颖的交叉变异策略来提高算法的全局探索能力。在NATS-Bench和可微分架构搜索(DARTS)两个搜索空间上验证OEvNAS的性能。实验结果表明,OEvNAS的性能超越了对比的主流算法。在NATS-Bench搜索空间上,提出的超网络训练策略在CIFAR-10、CIFAR-100和ImageNet16-200上均取得了优异的预测性能;在DARTS搜索空间上,搜索到的最优神经网络架构在CIFAR-10和CIFAR-100上分别取得了97.67%和83.79%的分类精度。 Neural Architecture Search(NAS)typically requires a considerable amount of time and computing resources due to the independent performance evaluation of each architecture it searches.To address this challenge,the continuous evolutionary NAS method based on biased sampling(OEvNAS)is proposed.This method involves the maintenance of a supernet during the architecture search,where all neural network architectures within the search space are subsets of this supernet.Throughout each evolutionary computation generation,the supernet is trained for a few epochs.Subsequently,the subnets inherit the supernet's weights for performance evaluation,eliminating the need for retraining.To enhance the supernet's prediction performance,a training strategy based on biased sampling is introduced.This strategy prioritizes training superior networks,thereby augmenting training efficiency and diminishing weight coupling.Additionally,an innovative crossover and mutation strategy is implemented to enhance global exploration capabilities.The effectiveness of OEvNAS is tested on two search spaces,NATS-Bench and Differentaible Architecture Search(DARTS).Results indicate that OEvNAS outperforms comparative leading algorithms.In the NATS-Bench search space,the new supernet training strategy demonstrates remarkable prediction accuracy on CIFAR-10,CIFAR-100 and ImageNet16-200.In the DARTS search space,the optimally searched neural network architecture exhibits classification accuracies of 97.67%and 83.79%on CIFAR-10 and CIFAR-100,respectively.

作者薛羽卢畅畅 XUE YU;LU Changchang(School of Software,Nanjing University of Information Science and Technology,Nanjing 210044,Jiangsu,China)

机构地区南京信息工程大学软件学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第2期91-97,共7页 Computer Engineering

基金国家自然科学基金面上项目(61876089)。

关键词神经架构搜索网络性能评估超网络有偏采样权重耦合 Neural Architecture Search(NAS) network performance evaluation supernet biased sampling weight coupling

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1曹行健,张志涛,孙彦赞,王平,徐树公,刘富强,王超,彭飞,穆世义,刘文予,杨铀.面向智慧交通的图像处理与边缘计算[J].中国图象图形学报,2022,27(6):1743-1767. 被引量：20
2宋菲菲,隋栋,周湘贞.基于深度学习的智能学习资源推荐算法[J].南京理工大学学报,2022,46(2):185-191. 被引量：14
3缪斯,祝永新.针对图像盲去模糊的可微分神经网络架构搜索方法[J].计算机工程,2021,47(9):313-320. 被引量：8

二级参考文献13

1吴忠泽.迎接中国智能交通的新时代[J].科学,2010(1):3-6. 被引量：6
2王俊芝,玉振明.基于LMS自适应算法的图像去模糊研究[J].计算机工程,2012,38(17):226-231. 被引量：4
3顾明,郑林涛,尤政.基于颜色空间转换的交通图像增强算法[J].仪器仪表学报,2015,36(8):1901-1907. 被引量：32
4张砚,肯特.蓝森.CityScope—可触交互界面、增强现实以及人工智能于城市决策平台之运用[J].时代建筑,2018,61(1):44-49. 被引量：18
5冯兴杰,贺阳.改进的Hadoop作业调度算法[J].计算机工程与应用,2017,53(12):85-91. 被引量：5
6温占考,易秀双,刘勇,李婕,王兴伟.基于属性向量协同过滤推荐算法并行化[J].计算机工程与设计,2018,39(2):425-429. 被引量：1
7崔建双,车梦然.基于多分类支持向量机的优化算法智能推荐系统与实证分析[J].计算机工程与科学,2019,41(1):153-160. 被引量：26
8莫恭钿,陈正振.基于协同过滤算法的课程资源平台的设计与实现[J].信息通信,2019,0(7):78-79. 被引量：5
9Jin-wen HU,Boyin ZHENG,Ce WANG,Chun-hui ZHAO,Xiao-lei HOU,Quan PAN,Zhao XU.A survey on multi-sensor fusion based obstacle detection for intelligent ground vehicles in off-road environments[J].Frontiers of Information Technology & Electronic Engineering,2020,21(5):675-692. 被引量：11
10樊海玮,史双,张博敏,张艳萍,蔺琪,孙欢.基于MLP改进型深度神经网络学习资源推荐算法[J].计算机应用研究,2020,37(9):2629-2633. 被引量：18

共引文献39

1高海韬,李丹宁,王彬,唐鑫鑫.运动模糊图像PSF参数估计方法改进及图像复原[J].计算机工程,2022,48(9):197-203. 被引量：6
2朱文武,王鑫,田永鸿,高文.多媒体智能:当多媒体遇到人工智能[J].中国图象图形学报,2022,27(9):2551-2573. 被引量：4
3李阳阳.基于大数据技术与网络爬虫的创新创业竞赛服务[J].自动化与仪器仪表,2022(10):150-154. 被引量：1
4孙前进.基于机器视觉的电子信息智能搜索方法[J].山东工业技术,2022(5):87-91.
5让斌斌,施卫.无人驾驶车自主导航与障碍规避系统设计实现[J].电脑知识与技术,2022,18(32):88-90.
6赵倩,周冬明,杨浩,王长城.残差注意力与多特征融合的图像去模糊[J].计算机科学,2023,50(1):147-155. 被引量：1
7段洪英.智慧人防系统的搭建与设计[J].电脑编程技巧与维护,2023(1):120-122. 被引量：1
8桂进,徐彪,初光勇.基于LabVIEW Vision的车牌识别系统设计[J].移动信息,2023,45(2):94-97. 被引量：1
9钱乾,程美英.基于学习者画像和聚类技术的个性化教学模式推荐研究[J].电脑知识与技术,2023,19(8):9-12. 被引量：2
10李会芬,焦小刚,黄丽霞.基于双注意力深度学习的在线资源推荐[J].南京理工大学学报,2023,47(2):221-227. 被引量：2

1温胜华.有线通信网络中拓扑优化技术的研究与实现[J].通信电源技术,2023,40(21):182-184.
2贾雯,彭颖.体内连续进化——从噬菌体到真核基因组的进化故事[J].生物化学与生物物理进展,2023,50(5):1223-1234.
3苏洪全,谭蕾,姜浩,郑亚强,马庆,董强,王新星.基于视频的施工作业监护人离岗识别模型[J].化工管理,2024(3):81-86.
4郑会吉,余思聪,邱鑫源,崔翛龙.基于元强化学习的自适应卸载方法[J].电讯技术,2024,64(2):177-183.
5梁轶群,李辉,欧阳智辉,王文华.基于多源数据的铁路5G-R运用质量评估系统设计[J].铁道标准设计,2024,68(2):185-191. 被引量：3
6胡智勇,于千城,王之赐,张丽丝.基于多目标优化的联邦学习进化算法[J].计算机应用研究,2024,41(2):415-420. 被引量：2
7VU Van Toi,高洪元,孙溶辰,陈暄.一种冲击噪声下的多目标跟踪算法[J].应用科技,2024,51(1):130-135. 被引量：1
8兰宇田,姚伟,张文栋,刘世超,仇玉强.基于CatBoost的新型电力系统两阶段轻量化暂稳智能评估方法[J].山东电力技术,2024,51(2):1-10.
9王乐遥,顾磊.多策略融合改进的蜣螂优化算法[J].计算机系统应用,2024,33(2):224-231. 被引量：6
10曾嘉忻,张卫明,张荣.基于后门的鲁棒后向模型水印方法[J].计算机工程,2024,50(2):132-139.

计算机工程

2024年第2期

浏览历史

内容加载中请稍等...

基于有偏采样的连续进化神经架构搜索

参考文献3

二级参考文献13

共引文献39

相关作者

相关机构

相关主题

浏览历史