基于微调优化的深度学习在语音识别中的应用被引量：8

Application of Deep Learning Model in Speech Recognition Based on Fine-tuning Optimization Method

下载PDF

导出

摘要针对深度学习模型在对小样本进行训练时会出现过拟合现象,提出随机退出优化方法和随机下降连接优化方法.这两种方法针对深度学习模型的微调阶段进行改进,最大限度减少由于训练数据量较少使得深层网络模型训练出现过拟合现象,并且使权值的更新过程更具有独立性,而不是依赖于有固定关系的隐层节点间的作用,同时可以降低识别错误率.对自建孤立语音词汇库进行了训练和识别,结果表明,在深度信念网络的基础上引入随机退出优化方法和随机下降连接优化方法可以提升识别率,缓解过拟合现象. Deep learning models in the training with small samples appeared over-fitting phenomenon. Two optimization methods called dropout and dropconnect based on deep learning were proposed. The two methods intended to improve the fine-tune stage of deep learning models, which could reduce the amount of training data, and made the update process more independent, rather than depended on the hidden layer nodes. Moreover,the error rate could be reduced. Then the experimental methods and the models were used to train and identify the MNIST handwritten digit data set and the isolated speech vocabulary database. The results showed that the two methods could improve the recognition rates, and ease the phe-nomenon of over-fitting.

作者彭玉青刘帆高晴晴张媛媛闫倩 PENG Yuqing LIU Fan GAO Qingqing ZHANG Yuanyuan YAN Qian(School of Computer Science and Software, Hebei University of Technology, Tianjin 300401, China)

机构地区河北工业大学计算机科学与软件学院

出处《郑州大学学报（理学版）》 CAS 北大核心 2016年第4期30-35,共6页 Journal of Zhengzhou University:Natural Science Edition

基金国家自然科学基金资助项目(51175145) 河北省高等学校科学技术研究重点项目(ZD2014030)

关键词深度学习语音识别神经网络深度信念网络 deep learning speech recognition neural network deep belief network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1蒋文,齐林.一种基于深度玻尔兹曼机的半监督典型相关分析算法[J].河南科技大学学报（自然科学版）,2016,37(2):47-51. 被引量：4
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：610
3孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：619
4尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：381
5李海峰,李纯果.深度学习结构和算法比较分析[J].河北大学学报（自然科学版）,2012,32(5):538-544. 被引量：33
6王洪,刘伟铭.深度信任支持向量回归的耕地面积预测方法[J].郑州大学学报（理学版）,2016,48(1):121-126. 被引量：4
7胡侯立,魏维,胡蒙娜.深度学习算法的原理及应用[J].信息技术,2015,39(2):175-177. 被引量：22

二级参考文献162

1孙权森,曾生根,王平安,夏德深.典型相关分析的理论及其在特征融合中的应用[J].计算机学报,2005,28(9):1524-1533. 被引量：89
2BENGIO Y, DELALLEAU O. On the expressive power of deep archi- tectures[ C ]//Proc of the 14th International Conference on Discovery Science. Berlin : Springer-Verlag, 2011 : 18 - 36.
3BENGIO Y. Leaming deep architectures for AI[ J]. Foundations and Trends in Machine Learning ,2009,2 ( 1 ) : 1-127.
4HINTON G,OSINDERO S,TEH Y. A fast learning algorithm for deep belief nets [ J ]. Neural Computation ,2006,18 (7) : 1527-1554.
5BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layer-wise training of deep networks [ C ]//Proc of the 12th Annual Conference on Neural Information Processing System. 2006:153-160.
6LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning ap- plied to document recognition[ J]. Proceedings of the iEEE, 1998, 86( 11 ) :2278-2324.
7VINCENT P, LAROCHELLE H, BENGIO Y, et al. Extracting and composing robust features with denoising autoencoders[ C ]//Proc of the 25th International Conference on Machine Learning. New York: ACM Press ,2008 : 1096-1103.
8VINCENT P, LAROCHELLE H, LAJOIE I, et aL Stacked denoising autoencoders:learning useftd representations in a deep network with a local denoising criterion [ J ]. Journal of Machine Learning Re- search ,2010,11 ( 12 ) :3371-3408.
9YU Dong, DENG Li. Deep convex net: a scalable architecture for speech pattern classification [ C]//Proc of the 12th Annual Confe-rence of International Speech Comunication Association. 2011 : 2285- 2288.
10POON H, DOMINGOS P. Sum-product networks:a new deep architec- ture[ C ]//Proc of IEEE Intemational Conference on Computer Vi- sion. 2011:689-690.

共引文献1543

1吴秀平,赵咏梅,凌静思.幼儿游戏深度学习行为的支持体系建构[J].教育科学论坛,2024(2):63-66.
2贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
3李本岳,李伟荣,潘华峰,王宏,王奇.人工智能对中医诊断的影响[J].世界科学技术-中医药现代化,2020,22(5):1624-1628. 被引量：23
4张格,林岚,吴水才.脑群体图中图卷积神经网络应用研究综述[J].生命科学仪器,2021,19(4):23-30. 被引量：2
5毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
6赵蓉英,陈文欣.深度学习视角下的评价科学方法创新[J].情报科学,2022,40(11):3-11. 被引量：2
7高嵩.深度学习在机场能见度预测中的应用[J].计算机产品与流通,2020,0(4):260-260. 被引量：2
8张永玲.以深度学习为核心的小学数学有效教学策略研究[J].理科爱好者（教育教学版）,2019,0(5):248-249. 被引量：2
9范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
10孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1

同被引文献55

1张良.人工智能下深度学习的语音识别方法分析[J].计算机产品与流通,2020,9(6):121-121. 被引量：5
2刘智勇,张鑫,方睿红.基于DEM的榆林市降水空间插值方法分析[J].西北农林科技大学学报（自然科学版）,2010,38(7):227-234. 被引量：22
3游松财,李军.海拔误差影响气温空间插值误差的研究[J].自然资源学报,2005,20(1):140-144. 被引量：61
4岳文泽,徐建华,徐丽华.基于地统计方法的气候要素空间插值研究[J].高原气象,2005,24(6):974-980. 被引量：107
5赵声蓉.多模式温度集成预报[J].应用气象学报,2006,17(1):52-58. 被引量：85
6杨海荣.基于RBF人工神经网络的空间插值[J].长沙交通学院学报,2006,22(1):68-71. 被引量：5
7黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：249
8张启宇,朱玲,张雅萍.中文分词算法研究综述[J].情报探索,2008(11):53-56. 被引量：35
9褚颖娜,廖敏,宋继华.一种基于统计的分词标注一体化方法[J].计算机系统应用,2009,18(12):55-58. 被引量：3
10姜尚仆,陈群秀.基于规则和统计的日语分词和词性标注的研究[J].中文信息学报,2010,24(1):117-122. 被引量：4

引证文献8

1刘丹枫,刘建霞.面向深度学习过拟合问题的神经网络模型[J].湘潭大学自然科学学报,2018,40(2):96-99. 被引量：16
2郭正斌,张仰森.基于定长序列的双向LSTM分词优化方法[J].郑州大学学报（理学版）,2018,50(2):97-101. 被引量：4
3杨鹏,蔡青青,孙昊,孙丽红.基于卷积神经网络的室内场景识别[J].郑州大学学报（理学版）,2018,50(3):73-77. 被引量：7
4马鹏翀.基于深度学习的语音识别研究[J].信息与电脑,2021,33(18):178-180. 被引量：3
5彭涛,郑传锟,张自力,刘军平,胡新荣,何儒汉.基于时空特征融合的语音情感识别[J].郑州大学学报（理学版）,2022,54(4):42-48.
6孙行,黄泽纯.面向复杂地形区气温场拟合的回归学习方法精度比较[J].测绘与空间地理信息,2022,45(5):18-23. 被引量：1
7顾亚文.人工智能深度学习背景下语音识别方法研究[J].软件,2022,43(5):122-124. 被引量：5
8傅建明,黎琳,王应军.基于CNN的Webshell文件检测[J].郑州大学学报（理学版）,2019,51(2):1-8. 被引量：13

二级引证文献49

1何树果,张福,朱震,程度.Webshell检测方案探索与实践[J].信息网络安全,2020(S01):141-144. 被引量：3
2黄达,吴斌,杨格,孙国良.基于代理模型的通信机柜群振动台实时混合试验方法[J].武汉理工大学学报,2023,45(12):45-51.
3卜云芸,卢树强,庞浩,罗昶,钱林学.自动识别技术在乳腺结节超声图像良恶性分类中的可行性研究[J].中华医学超声杂志（电子版）,2018,15(10):779-782. 被引量：1
4刘云,黄荣乘.最大判别特征选择算法在文本分类的优化研究[J].四川大学学报（自然科学版）,2019,56(1):65-70. 被引量：7
5罗新宇,陈洋卓,段斌,张佐,章兢.智能车竞赛学习成果认知诊断模型[J].湘潭大学学报（自然科学版）,2018,40(6):42-53. 被引量：1
6卞山峰,张庆辉.车辆实时检测研究综述[J].电子质量,2019(2):4-8.
7马泽辉.基于逻辑回归算法的Webshell检测方法研究[J].信息安全研究,2019,5(4):298-302. 被引量：4
8姜天.基于卷积神经网络的Webshell检测方法研究[J].信息技术与网络安全,2019,38(7):27-31. 被引量：5
9张建明,刘煊赫,吴宏林,黄曼婷.面向小目标检测结合特征金字塔网络的SSD改进模型[J].郑州大学学报（理学版）,2019,51(3):61-66. 被引量：13
10程博,李卫红,童昊昕.基于BiLSTM-CRF的中文层级地址分词[J].地球信息科学学报,2019,21(8):1143-1151. 被引量：16

1陈香华,叶吉祥,谭冠政.利用小波和RBF神经网络进行手写数字识别[J].云南民族大学学报（自然科学版）,2005,14(4):353-355. 被引量：1
2吴亚雄,陈海燕,李宗伯.基于链码的快速圆形识别方法[J].微计算机应用,2009,30(10):49-52. 被引量：2
3王建芬,曹元大.支持向量机在大类别数分类中的应用[J].北京理工大学学报,2001,21(2):225-228. 被引量：35
4段生全.分频匹配在语音识别与控制中的应用[J].声学与电子工程,2005(3):24-27.
5吕刚,郝平,盛建荣.一种改进的深度神经网络在小图像分类中的应用研究[J].计算机应用与软件,2014,31(4):182-184. 被引量：23
6童剑军,邹明福.车牌字符的一种精判别识别方法[J].计算机工程与应用,2005,41(2):223-226. 被引量：8
7石晶,戴国忠.基于PLSA模型的文本分割[J].计算机研究与发展,2007,44(2):242-248. 被引量：25
8生物识别技术何时不再需要密码[J].新电脑,2004(4):44-45.
9陈才扣,黄璞.基于分块独立分量分析的人脸识别[J].中国图象图形学报,2009,14(9):1837-1842. 被引量：8
10高学,王有旺.基于CNN和随机弹性形变的相似手写汉字识别[J].华南理工大学学报（自然科学版）,2014,42(1):72-76. 被引量：28

郑州大学学报（理学版）

2016年第4期

浏览历史

内容加载中请稍等...

基于微调优化的深度学习在语音识别中的应用被引量：8

参考文献7

二级参考文献162

共引文献1543

同被引文献55

引证文献8

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于微调优化的深度学习在语音识别中的应用 被引量：8

参考文献7

二级参考文献162

共引文献1543

同被引文献55

引证文献8

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于微调优化的深度学习在语音识别中的应用被引量：8