基于神经网络的语音识别研究被引量：10

Research on Speech Recognition Based on Neural Networks

下载PDF

导出

摘要由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具。为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较。介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构。其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别。实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%。 Because of good characteristics of the abstract classification, neural networks have become an effective tool for resolving issues related to recognition, and have been applied to the research and development of speech recognition systems. A speech recognizer system comprises of two blocks, Feature Extractor and Recognizer. For increasing the recognition accuracy, this paper proposes two types of speech recognition system whose recognition block uses the recurrent neural network（RNN） and multi layer pereeptron（MLP） respectively. Furthermore, the main work steps of Feature Extractor（FE） block is introduced and the structure of two types of neural networks mentioned above is discussed. Using a standard LPC Cepstrum, the FE translates the input speech into a trajectory in the LPC Cepstrum feature space. The recognizer block discovers the relationships between the trajectories and recognizes the word. The results show that the MLP＇s recognition accuracies were better than the RNN＇s, while the RNN＇s recognition accuracies achieved 85%.

作者滕云贺春林岳淼

机构地区西华师范大学计算机学院

出处《重庆师范大学学报（自然科学版）》 CAS 2010年第4期73-76,共4页 Journal of Chongqing Normal University:Natural Science

基金四川省教育厅重点科研项目(No.08ZA018) 校级科研项目(No.06A002)

关键词神经网络语音识别循环神经网络多层感知器线性预测矢量量化 neural networks speech recognition recurrent neural network multi layer perceptron linear prediction vector quantization

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1Rabiner L R, Juang B H. Fundamentals of speech recognition [ M ]. Upper Saddle River, NJ : Prentice hall, 1993.
2孟显勇,袁丁.多层BP神经网络用于破译椭圆曲线密码[J].四川师范大学学报（自然科学版）,2005,28(3):371-375. 被引量：3
3张彤,肖南峰.基于BP网络的指纹识别系统[J].重庆理工大学学报（自然科学）,2010,24(1):47-50. 被引量：8
4高富强,邹恒,秦昌硕,须民健,杨勇.BP和RBF神经网络在字母识别中的比较[J].重庆工学院学报（自然科学版）,2009,23(9):77-80. 被引量：5
5宋智,何嘉.面向复杂问题的BP神经网络并行算法[J].西南师范大学学报（自然科学版）,2009,34(3):103-106. 被引量：2
6朱鑫森,刘顺承.基于神经网络与改进D-S证据理论的目标识别[J].四川兵工学报,2009,30(7):67-69. 被引量：3
7Gandhiraj R, Sathidevi P S. Auditory-based wavelet packet filterbank for speech recognition using neural network [ A ]//Proc Int Conf Adv Comput Commun, ADCOM [ C ] Institute of Electrical and Electronics Engineers Inc,2007: 666-671.
8Mohammad I, Shah R S, Saad P D. Improving speaker independent speech recognition process using speech recognition engine[A]//Proc Int Conf Artif Intell,ICAI Proc Int Conf Mach Learn ; Models, Technol Appl , MLMTA [ C ]. Las Vegas ,NV ,United states : CSREA Press ,2008:870-875.
9Lee Chin H, Rabiner, Lawrence R. Directions in automatic speech recognition[ J]. NTT Review, 1995,7(2) : 19-29.
10Lalith Kumar T, Kishore Kumar T, Soundar Rajan K. Speech recognition using neural networks [ A ]// Int Conf Signal Process Syst [ C ]. IEEE Computer Society,2009: 248 -252.

二级参考文献61

1李旗堂,李娜,宋国杰.一个面向大规模BP神经网络并行算法[J].河南广播电视大学学报,2004,17(1):77-80. 被引量：2
2郭现峰,袁丁.基于RSA防欺诈秘密共享体制的安全性分析和改进[J].四川师范大学学报（自然科学版）,2004,27(5):541-543. 被引量：5
3张忠建,陈式刚.圆映象的符号动力学[J].物理学报,1989,38(1):1-8. 被引量：5
4王安娜,刘建英,姜辉,孙海静.多传感器信息融合技术在现代防空中的应用[J].兵工自动化,2005,24(6):9-9. 被引量：2
5林坤辉,息晓静,周昌乐.基于HMM与神经网络的声学模型研究[J].厦门大学学报（自然科学版）,2006,45(1):44-46. 被引量：13
6童勤业,钱鸣奇,李绪,郭宏记,韩晓鹏,李光,沈公羽.嗅觉神经系统脉冲编码的机理研究[J].中国科学（E辑）,2006,36(4):449-466. 被引量：10
7吴迪,赵鹤鸣,陶智.基于改进BP算法的英文字母识别[J].计算机工程与应用,2006,42(23):149-151. 被引量：6
8王国胤,施鸿宝,邓伟.基于NARA模型和筛选方法的并行神经网络体系结构[J].计算机学报,1996,19(9):679-686. 被引量：2
9杨熙,苏娟,赵鹏.MATLAB环境下的语音识别系统[J].电声技术,2007,31(2):51-53. 被引量：4
10李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12

共引文献22

1张彤,卢雯雯,肖南峰.基于BP网络的人脸朝向识别方法[J].重庆理工大学学报（自然科学）,2010,24(6):61-65. 被引量：10
2唐勇.交换机端口环路检测功能的有效性研究[J].重庆工商大学学报（自然科学版）,2010,27(3):267-270. 被引量：6
3冯宏伟,薛蕾.基于HMM和新型前馈型神经网络的语音识别研究[J].计算机工程与设计,2010,31(24):5324-5327. 被引量：6
4马少华,曹三民.粒子群算法优化BP神经网络的指纹识别技术[J].科技广场,2011(7):40-42.
5杨帆,程雯,夏亦冰,杜四平,肖贝.多传感器信息融合测控体系在温室测控中的应用研究[J].武汉理工大学学报,2011,33(9):156-159. 被引量：12
6李勇,王德功,常硕.基于多传感器数据融合的飞机目标自动敌我识别方法[J].四川兵工学报,2012,33(1):33-35. 被引量：4
7彭继慎,程英.优化RBF神经网络在压力传感器中的应用[J].压电与声光,2012,34(3):414-416. 被引量：3
8简晓春,王利伟,闵峰.基于LM算法的BP神经网络对汽车排放污染物的预测[J].重庆理工大学学报（自然科学）,2012,26(7):11-16. 被引量：7
9罗梅,江丽莎,罗涟玲.BP神经网络在汉语数字语音识别中的应用[J].广西物理,2012,33(3):26-28.
10赵明富,夏曦,张政委,冯小平.基于高光谱图像技术的指纹识别研究[J].激光杂志,2013,34(1):45-47. 被引量：14

同被引文献80

1范长青,华宇宁.语音识别中改进viterbi算法的研究实现[J].科技资讯,2007,5(32):212-213. 被引量：1
2杨飚,张曾科.仿人智能控制器的动态特性参数整定方法[J].信息与控制,2004,33(6):670-673. 被引量：24
3彭莉,林鹰,杨奕.复杂系统控制中的相关技术讨论[J].西南师范大学学报（自然科学版）,2004,29(6):1066-1068. 被引量：39
4段建东,张保会,周艺.利用电流行波进行超高压输电线路故障类型识别的研究[J].中国电机工程学报,2005,25(7):58-63. 被引量：34
5刘太杰,崔莉凤,刘载文.污水处理智能控制进展[J].北京工商大学学报（自然科学版）,2005,23(3):9-12. 被引量：17
6胡香玲,冯浩,华亮.基于RBF神经网络的变压器保护[J].电气应用,2005,24(10):59-62. 被引量：12
7刘凤霞,刘前进.基于模糊神经网络的故障类型识别[J].继电器,2006,34(3):12-14. 被引量：10
8段建东,张保会,周艺,罗四倍,任晋峰,杭乃善,刁桂平.基于暂态量的超高压输电线路故障选相[J].中国电机工程学报,2006,26(3):1-6. 被引量：63
9何正友,陈小勤.基于多尺度能量统计和小波能量熵测度的电力暂态信号识别方法[J].中国电机工程学报,2006,26(10):33-39. 被引量：49
10胡婷,游大海,金明亮.一种电流突变量选相元件三相短路判据的探讨[J].电力自动化设备,2006,26(10):107-109. 被引量：16

引证文献10

1邓新莉,周江川,刘珊,张四平.不确定性复杂系统的智能融合控制策略[J].重庆理工大学学报（自然科学）,2011,25(3):83-87. 被引量：3
2张旭东,俞建宁,郭兰平,张建刚,付宏睿.基于小波神经网络的深证300成分指数的预测[J].重庆理工大学学报（自然科学）,2011,25(6):49-52. 被引量：4
3郭洪荣.计算机语音识别技术的应用分析[J].黑龙江科技信息,2012(31):96-96.
4吴浩,罗毅,蔡亮.基于RBF神经网络的输电线路故障类型识别新方法[J].重庆邮电大学学报（自然科学版）,2013,25(3):418-426. 被引量：6
5刘妮.多特征和支持向量机相结合的语音端点检测模型[J].重庆邮电大学学报（自然科学版）,2013,25(5):686-689. 被引量：2
6陈伟,田一明,王喜太,陈晓振.基于PSO-BP神经网络的语音识别研究[J].电脑知识与技术,2018,14(1):187-188. 被引量：2
7方志强,王晓辉,夏通.基于长短期记忆网络的售电量预测模型研究[J].电力工程技术,2018,37(3):78-83. 被引量：11
8张珣,李道磊.基于语音识别技术的智能家居网关系统设计[J].软件导刊,2019,18(5):49-52. 被引量：3
9唐美丽,胡琼,马廷淮.基于循环神经网络的语音识别研究[J].现代电子技术,2019,42(14):152-156. 被引量：19
10吴树才,王新举,纪俊雨,耿广,章志华,侯代伦.基于深度学习卷积神经网络的肺结核CT诊断模型效能初探[J].中华结核和呼吸杂志,2021,44(5):450-455. 被引量：16

二级引证文献66

1李桢.多层螺旋CT对肺结核空洞与肺真菌病空洞的鉴别诊断分析[J].智慧健康,2022,8(23):9-12.
2郑楷洪,肖勇,王鑫,陈为.一个面向电力计量系统的联邦学习框架[J].中国电机工程学报,2020,40(S01):122-133. 被引量：16
3赛军强,潘小磊.64排螺旋CT低剂量扫描结合T-SPOT试验对肺结核的诊断价值[J].社区医学杂志,2022,20(4):202-206. 被引量：4
4何汁艳,姜大军.一类非线性过程的升温优化控制策略[J].沈阳工程学院学报（自然科学版）,2012,8(3):228-231.
5章铁军,宫彬彬,吴晓蕾,高洪波,赵硕.基于MATLAB的温室灌溉系统模糊控制的模型[J].安徽农业科学,2012,40(20):10696-10697. 被引量：3
6赵京晶.三种神经网络对上证指数预测的研究[J].商,2013(17):190-191.
7张军,史明明.改进型电压恢复器拓扑的模型预测控制策略[J].电气应用,2018,37(24):40-44. 被引量：1
8倪元敏.基于HSIC的适应性融合控制策略[J].西南师范大学学报（自然科学版）,2014,39(4):126-131. 被引量：1
9张昴.基于力学矢量加法的二维PAR过程及其实证研究[J].重庆理工大学学报（自然科学）,2015,29(6):144-150. 被引量：1
10于志军,杨善林,王晓佳,彭张林.基于数据变换的GM(1,1)误差校正方法[J].系统工程理论与实践,2015,35(9):2339-2347. 被引量：5

1傅国强.基于关联规则的协同垃圾邮件过滤系统研究[J].深圳职业技术学院学报,2005,4(3):15-18. 被引量：2
2罗迅,王虹,阙大顺,宋晓东.在小波域内应用SOFM网络进行图像压缩的方法研究[J].交通与计算机,2003,21(1):39-42.
3深度.揭密微软语音翻译软件内幕[J].电脑爱好者,2013(3):28-29.
4镜花水月.翻译只需“动动口”[J].电脑爱好者,2015,0(14):60-60.
5朱海涛.基于神经网络的语音识别鲁棒性研究[J].中国科技信息,2008(5):276-277. 被引量：1
6范新伟,申瑞民,杜彦蕊.用LPC及DTW进行语音模式比较的设计与实现[J].计算机工程,2004,30(1):126-128. 被引量：13
7语音360:中文语音助手[J].互联网天地,2012(1):57-57.
8但志平,胡刚,刘勇.基于LPC倒谱参数分析的说话人识别系统[J].三峡大学学报（自然科学版）,2007,29(1):60-62. 被引量：2
9吴青,李曙俏,代琳,安璐.一种车牌识别系统的设计[J].徐州工程学院学报（自然科学版）,2011,26(2):80-84. 被引量：4
10王练术,辛永红,冶建科.基于复杂背景的车牌字符快速识别方法[J].微计算机信息,2009,25(22):184-186. 被引量：1

重庆师范大学学报（自然科学版）

2010年第4期

浏览历史

内容加载中请稍等...

基于神经网络的语音识别研究被引量：10

参考文献15

二级参考文献61

共引文献22

同被引文献80

引证文献10

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

基于神经网络的语音识别研究 被引量：10

参考文献15

二级参考文献61

共引文献22

同被引文献80

引证文献10

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

基于神经网络的语音识别研究被引量：10