期刊文献+

基于卷积神经网络的大容量汉语孤立字语音识别方法 被引量:7

Convolutional neural network for speech recognition
下载PDF
导出
摘要 使用录音设备对1605个常用汉字进行录音,得到920个孤立字发音、3680个非特定人的语音样本库.采用语音语谱图作为汉语单字语音识别的特征,构建了6层卷积神经网络应用于模型库的语音识别.通过深度学习方法对语音样本进行了训练和识别.实验结果表明,所构造的20-40-3500结构的卷积神经网络模型对语音样本库具有最好的识别效果,对测试样本的识别率达到97.87%,对全部样本的识别率达到99.32%. 1605 common Chinese characters were recorded by recording equipment,920 isolated words and 3680 speaker-independent speech sample library were obtained.Using speech spectrogram as the feature of individual Chinese character,a 6-layer convolutional neural network is constructed and applied to the speech recognition of sample library.The deep learning method is used to train network structure and recognize speech samples.The experimental results show that the 20-40-3500 convolutional neural network model has the best performance on the speech sample library,with the recognition rate of test samples reaching 97.87%and the recognition rate of all samples reaching 99.32%.
作者 白璐 王连明 BAI Lu;WANG Lian-ming(Institute of Computational Intelligence,Northeast Normal University,Changchun 130024,China)
出处 《东北师大学报(自然科学版)》 CAS 北大核心 2020年第2期52-57,共6页 Journal of Northeast Normal University(Natural Science Edition)
基金 国家自然科学基金资助项目(21227008).
关键词 卷积神经网络 语音识别 语谱图 深度学习 convolutional neural network speech recognition spectrogram deep learning
  • 相关文献

参考文献7

二级参考文献58

  • 1陈国良,韩文廷.人工神经网络理论研究进展[J].电子学报,1996,24(2):70-75. 被引量:20
  • 2俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量:34
  • 3孙宁,孙劲光,孙宇.基于神经网络的语音识别技术研究[J].计算机与数字工程,2006,34(3):58-61. 被引量:9
  • 4张建平.大词汇量自然连续语音识别中的语言模型和理解算法研究.博士论文[M].北京:清华大学,1999..
  • 5徐波.汉语非特定人听写机系统研究和集成.博士论文[M].北京:中国科学院自动化研究所,1997..
  • 6戴蓓倩,中国科学技术大学学报,1994年,24卷,2期,161页
  • 7Liu C S,J Acoust Soc Am,1995年,97卷,1期,637页
  • 8Chou W,Proc ICASSP,1992年,473页
  • 9张建平,博士学位论文,1999年
  • 10Liu J,Chin J Electron,1998年,7卷,2期,135页

共引文献175

同被引文献75

引证文献7

二级引证文献13

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部