卷积神经网络算法在语音识别中的应用被引量：15

Application of convolutional neural network algorithm in speech recognition

下载PDF

导出

摘要随着互联网信息指数性增加,海量语音数据的特征具有很大的非特定人差异性和噪声干扰性,常用的特征提取以及特征变换方法已经很难满足当前模型训练识别的需求。近些年来立足于语音识别和深度学习理论的紧密结合,通过研究发现卷积神经网络的结构十分适合语音信号的特征提取过程,文中提出一种基于卷积神经网络的特征提取方法,并且结合相对复杂的GMM-HMM模型组成新的语音识别系统。实验表明,卷积神经网络结构可以很好的克服语音信号的非特定人差异性以及噪声的影响,GMM-HMM模型相比softmax分类器更为切合语音复杂信号的建模,最终识别率有了很大的提升。 With the increase of Internet information grows exponentially, huge amounts of voice and data features has a great deal of speaker-independent, difference and noise interference methods of feature extraction and feature transformation is hard to meet the needs of the current training model identification. In recent years based on speech recognition and deep learning theory together, through the study it found that the convolutional neural network structure is very suitable for speech signal feature extraction process, this paper proposes a feature extraction method based on convolution neural network, and the combination of relatively complex GMM-HMM model of the new voice recognition system. The experiments show that the convolution neural network structure can be very good to overcome the differences between speaker-independent speech signals and the influence of noise, GMM-HMM model is more relevant than soflmax classifier in speech complex signal model area, the final recognition rate had the very big improvement.

作者张文宇刘畅 ZHANG Wen-yu;LIU Chang(School of Economics and Management of Xi＇an University of Posts ＆ Telecommunications,Xi＇an 710061,China)

机构地区西安邮电大学经济管理学院

出处《信息技术》 2018年第10期147-152,共6页 Information Technology

关键词特征提取卷积神经网络语音识别 feature extraction convolution neural network speech recognition

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1柯登峰,徐波.互联网时代语音识别基本问题[J].中国科学：信息科学,2013,43(12):1578-1597. 被引量：14
2侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81
3周子扬.机器学习与深度学习的发展及应用[J].电子世界,2017,0(23):72-73. 被引量：7
4田莎莎,唐菀,佘纬.改进MFCC参数在非特定人语音识别中的研究[J].科技通报,2013,29(3):139-142. 被引量：15
5潘丽杰,徐本亮,朱琪,王利峰,缪惠根.基于双麦克风降噪技术的语音识别系统[J].现代电子技术,2016,39(2):137-139. 被引量：11
6李轩,李春升.一种交替变换更新层数的DBN-DNN快速训练方法[J].计算机应用研究,2016,33(3):843-847. 被引量：2
7李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：556
8李钊,卢苇,邢薇薇,孙占全,王伟东,魏云超.CNN视觉特征的图像检索[J].北京邮电大学学报,2015,38(B06):103-106. 被引量：21

二级参考文献206

1张晨燕,孙成立.非特定人孤立词语音识别系统的片上实现[J].计算机工程与应用,2007,43(13):194-196. 被引量：10
2关胜平,何培宇,刘珂含,李锦,田芳芳,王三山.基于TMS320VC5509A的语音识别与控制系统[J].电子技术应用,2007,33(7):36-39. 被引量：6
3刘幺和,宋庭新.语音识别与控制应用技术[M].北京:科学出版社,2008.
4Fenn J, Clark W, Natis Y V, et al. Hype cycle for emerging technologies, 2009. Stamford: Gartner, 2009.
5Fenn J, LeHong H. Hype cycle for emerging technologies, 2011. Stamford: Gartner, 2011.
6Uebel L F, Woodland P C. An investigation into vocal tract length normalization. In: Proceedings of European Conference on Speech Communication and Technology, Budapest, 1999. 2527-2530.
7Povey D, Kingsbury B, Mangu L, et al. fMPE: discriminatively trained features for speech recognition. In: Proceedings of ICASSP 2005, Philadelphia, 2005. 961-964.
8Povey D, Kanevsky D, Kingsbury B, et al. Boosted MMI for model and feature-space discriminative training. In: Proceedings of ICASSP 2008, Las Vegas, 2008. 4057-4060.
9Mermelstein P. Distance measures for speech recognition, psychological and instrumental. Pattern Recogn Artif Intell, 1976, 116: 374-388.
10Bridle J S, Brown M D. An experimental automatic word recognition system. JSRU Report 1003: 5, 1974.

共引文献696

1师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：11
2朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：3
3侯帅鹏,石英,华逸伦,苏涛.基于改进SSD的行人检测模型[J].武汉理工大学学报,2019,41(7):95-102. 被引量：1
4苟玉晓,江永全,杨燕,周冠禄,林凯.基于全卷积神经网络的公交专用道识别[J].计算机应用研究,2020,37(S01):406-407.
5杨秀芳,陈卓,王驰.基于隐Markov模型的齿轮箱故障识别方法研究[J].电子测量与仪器学报,2020,32(11):115-123. 被引量：6
6李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：78
7杨颖.基于MobileNet-SSD的蝶类昆虫识别算法[J].智能计算机与应用,2021,11(4):156-158. 被引量：2
8雷慧静.卷积神经网络综述[J].中国科技纵横,2018,0(16):44-47. 被引量：1
9董小栋,郭培源,徐盼,许晶晶.融合高光谱和图像深度特征的腊肉分类与检索算法研究[J].食品工业科技,2018,39(23):255-260. 被引量：2
10易雪蓉,黄巍,胡迪,蒋怡.基于HMM的声调语音模型研究[J].武汉工程大学学报,2018,40(6):691-695. 被引量：2

同被引文献145

1詹重万,肖开琪,陈年芳.正常人头发的扫描电镜观察[J].解剖学报,1983(3):334-336. 被引量：13
2周用武,王泽威.利用偏光显微镜检验鉴定兽类毛发的初步报告[J].四川动物,2006,25(3). 被引量：4
3赵鹏大.成矿定量预测与深部找矿[J].地学前缘,2007,14(5):1-10. 被引量：142
4陈建平,吕鹏,吴文,赵洁,胡青.基于三维可视化技术的隐伏矿体预测[J].地学前缘,2007,14(5):54-62. 被引量：134
5贺英,万立华.毛发检验在法医学中的应用和新进展[J].重庆医科大学学报,2006,31(z1):58-60. 被引量：4
6王蕾.英语口试质量评价研究[J].教育学术月刊,2007(9):54-56. 被引量：1
7孙伟豹,孙虎,王军.判决法对数字和模拟信号的自动识别及验证[J].计算机科学,2012,39(S3):88-89. 被引量：3
8张伟,徐艳春.毛发微观结构研究的回顾与展望[J].兽类学报,2003,23(4):339-345. 被引量：55
9甘雅玲,郭中伟,刘明辉,陈占河.刑事案件中动物毛发的扫描电镜研究[J].电子显微学报,2003,22(6):489-489. 被引量：10
10闫玉梅,李永军.西秦岭礼县长安一带西汉水群牙形刺特征及时代讨论[J].甘肃地质学报,1994,3(2):18-26. 被引量：1

引证文献15

1鲍瀛,何明远,李瑞瑶,何国平,王旭英,李显红,张耀.基于深度学习的宫颈癌智能辅助检测系统构建[J].中国数字医学,2021,16(7):44-49. 被引量：2
2郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术,2019,43(6):115-120. 被引量：3
3唐铠,陆鹏.SOM-LSTM递归神经网络语音端点检测系统[J].信息通信,2019,0(5):50-53. 被引量：1
4侯涛,郑郁正.基于深度学习的通信信号调制方式识别[J].无线电工程,2019,49(9):796-800. 被引量：10
5高树辉,姜晓佳.卷积神经网络在物证检验中的应用与毛发自动识别的展望[J].科学技术与工程,2019,19(23):1-9. 被引量：4
6陈昌美,李艳斌.基于卷积神经网络的调制样式识别研究[J].信息技术,2020,44(1):101-106. 被引量：6
7蔡惠慧,徐永洋,李孜轩,曹豪豪,冯雅兴,陈思琼,李永胜.基于卷积神经网络模型划分成矿远景区——以甘肃大桥地区金多金属矿田为例[J].地质通报,2019,38(12):1999-2009. 被引量：15
8茹仙古丽·艾尔西丁,艾尔潘江·库德来提,严传波,姚娟.卷积神经网络在肝癌病理切片图像分类中的应用[J].北京生物医学工程,2020,39(1):29-33. 被引量：5
9茹仙古丽·艾尔西丁,裴世宇,严传波,姚娟.基于深度学习的肝包虫疾病图像分类[J].中国数字医学,2020,15(4):2-4. 被引量：3
10王欣欣,马发民.一种基于DNN的少儿英语口语评分系统的改进[J].信息技术,2020,44(9):46-50. 被引量：5

二级引证文献69

1杨昆,王尉丞,秦赓,原嘉成,刘爽,薛林雁.肾透明细胞癌数字病理图像细胞核ISUP分级预测[J].电子测量技术,2023,46(4):121-128.
2胡希颖,王大东,陈佳欣.基于NAO机器人的BLSTM-CTC的声学模型研究[J].智能计算机与应用,2021,11(3):76-79. 被引量：1
3陈昌美,李艳斌.基于卷积神经网络的调制样式识别研究[J].信息技术,2020,44(1):101-106. 被引量：6
4张文煜.甘肃永靖小岭乡矿床地质特征及找矿标志[J].世界有色金属,2020,45(3):86-87.
5彭岑昕,程伟,李晓柏,张永利.一种基于STFT-BiLSTM的通信信号调制方式识别方法[J].空军预警学院学报,2020,34(1):39-45. 被引量：2
6高占斌.山丹盆地矿产资源的沉积规律与地质构造分析[J].中国金属通报,2020(7):171-172. 被引量：2
7史斌,王建立.人工神经网络在肝癌诊疗与预后预测中的应用进展[J].癌症进展,2020,18(12):1198-1201.
8岳有军,田博凯,王红君,赵辉.改进VGG模型在苹果外观分类中的应用[J].科学技术与工程,2020,20(19):7787-7792. 被引量：13
9赵康.改进SVM结合决策树的情感语音识别[J].信息技术,2020,44(8):17-22. 被引量：2
10马原东,倪照风,徐斌,崔潇,杨秀璋,罗子江.基于卷积神经网络的布料疵点检测方法[J].科学技术与工程,2020,20(25):10327-10333. 被引量：2

1谢燕.基于深度学习理论的“大气环流”教学策略探讨[J].地理教育,2018(10):51-52. 被引量：2
2孟月.落地有声中国联通持续发力5G[J].通信世界,2018,0(26):32-32.
3王德莉.浅谈基于深度学习下的初中语文教学实践探索[J].新课程,2018,0(23):62-62. 被引量：2
4叶硕,彭春堂,杜珍珍,贺娟.基于DTW的孤立词语音识别系统设计[J].长江大学学报（自然科学版）,2018,15(17):33-37. 被引量：5
5曾润华,张树群.改进卷积神经网络的语音情感识别方法[J].应用科学学报,2018,36(5):837-844. 被引量：12
6张爱英.基于多语言语音数据选择的资源稀缺蒙语语音识别研究[J].计算机科学,2018,45(9):308-313. 被引量：1
7夏润龙.融合动态特征和IV-SVM的火焰识别算法研究[J].企业技术开发,2017,36(11):18-22. 被引量：1
8顾晓东.基于经验的深度学习:内涵与导引[J].江西教育（教学版）（B）,2018,0(7):28-31. 被引量：1
9王秀兵,朱志选.粮食不完善粒自动识别研究进展[J].食品安全导刊,2018(24):145-146. 被引量：3
10我国科学家开发新型蛋白质相互作用标记技术[J].中国食品学报,2018,18(8):153-153.

信息技术

2018年第10期

浏览历史

内容加载中请稍等...

卷积神经网络算法在语音识别中的应用被引量：15

参考文献8

二级参考文献206

共引文献696

同被引文献145

引证文献15

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

卷积神经网络算法在语音识别中的应用 被引量：15

参考文献8

二级参考文献206

共引文献696

同被引文献145

引证文献15

二级引证文献69

相关作者

相关机构

相关主题

浏览历史

卷积神经网络算法在语音识别中的应用被引量：15