基于实验方案设计的卷积神经网络超参数优化方法

Hyperparameter Optimization Method for Convolutional Neural Network Based on Experimental Design

下载PDF

导出

摘要卷积神经网络是人工智能的重要组成部分,在自然语言处理、图像识别等领域表现优异。卷积神经网络模型超参数配置涉及训练策略,在卷积神经网络大模型优化方面起着至关重要的作用。现有超参数优化方法耗时耗力,遍历整个超参数空间,容易陷入局部最优解。首先,构建3个不同深度的自建卷积神经网络作为优化对象,以提高模型在验证集上的准确率为优化目标找到最佳的超参数配置。其次,考虑优化神经网络大模型的训练过程并提高模型性能的需求,提出一种基于实验方案设计的卷积神经网络超参数优化方法。最后,为了验证方法的有效性,依据均匀设计理念构建训练方案,生成超参数优化组合,进行主观经验生成训练方案的对比实验。结果表明:所提出的优化方法在收敛速度、准确率和计算效率上更具优势。该方法为实现卷积神经网络大模型的高效训练提供支持,具有良好的通用性,可以应用于不同规模的卷积神经网络训练任务。 Convolutional neural networks,a crucial component of artificial intelligence,demonstrate outstanding performance in fields such as natural language processing and image recognition.Optimizing hyperparameters in convolutional neural network models is essential for training and optimizing large models.Existing hyperparameter optimization methods are time-consuming and may lead to local optima.In order to optimize the training process of large neural network models,a novel hyperparameter optimization method based on experimental design was proposed.Firstly,three self-built convolutional neural networks with different depths were constructed as optimization objects,aiming to find the best hyperparameter configuration to improve the model's accuracy on the validation set.Finally,in order to verify the effectiveness of the method,a training scheme was constructed based on the optimization methods,generating combinations for hyperparameter optimization and comparative experiments of subjective experience-generated training schemes were conducted.The results show that the proposed optimization method demonstrates advantages in convergence rate,accuracy,and efficiency.It is concluded that the method supports efficient training of large convolutional neural network and exhibits good generality across tasks of different scales.

作者徐慧智吕佳明 XU Hui-zhi;LU Jia-ming(School of Civil Engineering and Transportation,Northeast Forestry University,Harbin 150040,China)

机构地区东北林业大学土木与交通学院

出处《科学技术与工程》北大核心 2024年第28期12227-12238,共12页 Science Technology and Engineering

基金国家自然科学基金(62371170)。

关键词均匀设计超参数优化卷积神经网络(CNN) 正交设计机器学习 uniform design hyper-parameters optimization convolutional neural networks(CNN) orthogonal design machine learning

分类号 TP389.1 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1徐慧智,宋爱秋,武笑宇.基于均匀设计的船舶目标检测深度学习模型训练方法[J].科学技术与工程,2022,22(25):11241-11249. 被引量：3
2方开泰.均匀试验设计的理论、方法和应用——历史回顾[J].数理统计与管理,2004,23(3):69-80. 被引量：163
3吴佳,陈森朋,陈修云,周瑞.基于强化学习的模型选择和超参数优化[J].电子科技大学学报,2020,49(2):255-261. 被引量：12
4金洪杨,董晓淦,魏青彪,刘景达,岳龙旺.面向胃息肉检测的深度学习神经网络优化[J].科学技术与工程,2023,23(15):6506-6512. 被引量：3
5李帅,杨柳,赵欣卉.基于深度学习的城市区域短时交通拥堵预测算法[J].科学技术与工程,2023,23(25):10866-10878. 被引量：7
6成浪,敬超,陈文鹏.基于神经网络架构搜索的X射线图像违禁品检测算法[J].科学技术与工程,2024,24(2):665-675. 被引量：4

二级参考文献42

1姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：16
2南晓虎,丁雷.深度学习的典型目标检测算法综述[J].计算机应用研究,2020,37(S02):15-21. 被引量：57
3周林宏,杨戈,李娜,杨秀璋,胡广清.基于自适应图像增强和图像去噪的水面航行船舶识别方法[J].船舶工程,2021,43(S02):101-105. 被引量：10
4蒲悦逸,王文涵,朱强,陈朋朋.基于CNN-ResNet-LSTM模型的城市短时交通流量预测算法[J].北京邮电大学学报,2020,43(5):9-14. 被引量：25
5蒲斌,李浩,卢晨阳,王治辉,刘华.基于神经网络的海量GPS数据交通流量预测[J].云南大学学报（自然科学版）,2019,41(1):53-60. 被引量：6
6赵亚伟,陈艳晶,管伟.基于多维时间序列的ETC短时交通流量预测模型[J].交通运输系统工程与信息,2016,16(4):191-198. 被引量：17
7赵宏,翟冬梅,石朝辉.短时交通流预测模型综述[J].都市快轨交通,2019,32(4):50-54. 被引量：31
8王晓全,邵春福,尹超英,计寻,管岭.基于ARIMA-GARCH-M模型的短时交通流预测方法[J].北京交通大学学报,2018,42(4):79-84. 被引量：30
9武凯利,仝宗和,张鹏升,刘亚男,刘钊.基于深度学习的复杂气象条件下海上船舶识别[J].科学技术与工程,2019,19(3):130-135. 被引量：6
10刘晓悦,王云明.基于HOG-SVM的改进跟踪-学习-检测算法的目标跟踪方法[J].科学技术与工程,2019,19(27):266-271. 被引量：10

共引文献186

1王子甲,马林建,蒋治丞,李森.基于拉丁方理论的地质力学模型试验设计[J].工业建筑,2011,41(S1):508-513.
2王钰,毛治博,张华森,雒廷亮,刘国际.均匀设计研究溶剂法腰果酚催化加氢工艺[J].现代化工,2009,29(S1):318-319.
3彭云,陈涛,段利斌,成艾国.基于隐式参数化技术的车门内饰板安全性设计[J].机械科学与技术,2015,34(6):934-939. 被引量：2
4孟工戈,逯允龙,赵密,谷丰.基于均匀设计方法研究不锈钢焊条的药皮温升[J].焊接学报,2005,26(8):19-22. 被引量：2
5游海龙,贾新章,张小波,董萍.试验设计与仿真相结合构造集成电路元模型的方法研究[J].电子学报,2006,34(6):1159-1162. 被引量：4
6黄靓,易伟建,汪优.基于RBF神经网络的结构可靠度分析方法[J].湘潭大学自然科学学报,2006,28(4):109-114. 被引量：7
7李章刚,李冰,张士宏,张光亮,张金利.基于有限元的三辊行星轧制力预测及分析[J].材料科学与工艺,2006,14(6):561-564. 被引量：2
8张成成,姚卫星.基于响应面的结构抗疲劳优化设计方法[J].南京航空航天大学学报,2007,39(1):37-40. 被引量：11
9孙光永,李光耀,张勇,钟志华.基于鲁棒性的概率优化设计在薄壁构件耐撞性中的应用[J].中国机械工程,2007,18(4):479-483. 被引量：12
10邓苗毅,崔聚印,任伟新.桥梁结构静力模型修正响应面方法试验设计研究[J].河南科学,2007,25(4):604-608. 被引量：1

1周慧芳,范超,任森.新时代基于“五育”融合理念的高职大学生综合素质评价体系构建路径研究[J].教师,2024(27):12-14.
2史翠峰.业财融合提升高校预算绩效精细化管理水平实例探究——以X高校为例[J].市场周刊,2024,37(28):107-110.
3樊建文.现代科技在部队军事射击训练中的应用现状与展望[J].中国军转民,2024(20):22-23.
4卢嘉敏,林芹锋,胡候林,赵建东,刘莉.基于均匀设计的流量计多孔板结构快速优化[J].中国测试,2024,50(S01):260-265.
5顾华兰.学习任务群背景下的初中语文阅读教学研究[J].中学语文,2024(30):32-34.
6张飞,李钰景,彭春秀,龚加顺.玫瑰花红茶发酵工艺以及水提物的非靶向代谢组学分析及体外抗氧化活性评价[J].食品与发酵工业,2024,50(20):216-225. 被引量：2
7史成坤,孙英蛟,赵雷,齐海涛,朱德明.高校劳动教育课程与工程训练中的沉浸式项目化教学融合探索[J].高教学刊,2024,10(32):126-129.
8鲍玲玲,郭晓凯,李建伟,牛国庆,高易达,杨立嘉.基于均匀设计的中深层U型地埋管取热潜力估算[J].河北工程大学学报（自然科学版）,2024,41(5):78-84.
9杨翠辉,梁冰柳,蔡莲,梁月兰,方业荣.基于大数据环境下“五育并举”的乡镇中学生综合素质评价体系构建[J].科幻画报,2023(10):0188-0190.
10罗引.小学音乐教学融合情境教学理念构建高效课堂的策略研究[J].中文科技期刊数据库（引文版）教育科学,2024(11):0161-0164.

科学技术与工程

2024年第28期

浏览历史

内容加载中请稍等...

基于实验方案设计的卷积神经网络超参数优化方法

参考文献6

二级参考文献42

共引文献186

相关作者

相关机构

相关主题

浏览历史