基于卷积神经网络的连续语音识别被引量：70

Continuous speech recognition by convolutional neural networks

导出

摘要在语音识别中,卷积神经网络(convolutional neural networks,CNNs)相比于目前广泛使用的深层神经网络(deep neural network,DNNs),能在保证性能的同时,大大压缩模型的尺寸.本文深入分析了卷积神经网络中卷积层和聚合层的不同结构对识别性能的影响情况,并与目前广泛使用的深层神经网络模型进行了对比.在标准语音识别库TIMIT以及大词表非特定人电话自然口语对话数据库上的实验结果证明,相比传统深层神经网络模型,卷积神经网络明显降低模型规模的同时,识别性能更好,且泛化能力更强. Convolutional neural networks （ CNNs ） , which show success in achieving translation invariance for many image processing tasks, were investigated for continuous speech recognition. Compared to deep neural networks （ DNNs） , which are proven to be successful in many speech recognition tasks nowadays, CNNs can reduce the neural network model sizes significantly, and at the same time achieve even a better recognition accuracy. Experiments on standard speech corpus TIMIT and conversational speech corpus show that CNNs outperform DNNs in terms of the accuracy and the generalization ability.

作者张晴晴刘勇潘接林颜永红

机构地区中国科学院语言声学与内容理解重点实验室

出处《工程科学学报》 EI CAS CSCD 北大核心 2015年第9期1212-1217,共6页 Chinese Journal of Engineering

基金国家自然科学基金资助项目(11161140319 91120001 61271426) 中国科学院战略性先导科技专项(XDA06030100 XDA06030500) 国家高技术研究发展计划资助项目(2012AA012503) 中国科学院重点部署项目(KGZD-EW-103-2)

关键词卷积神经网络连续语音识别权值共享聚合泛化性 convolutional neural networks continuous speech recognition weight sharing pooling generalization

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献495

1孙华东,周孝信,李若梅.感应电动机负荷参数对电力系统暂态电压稳定性的影响[J].电网技术,2005,29(23):1-6. 被引量：95
2赵博,檀晓红.基于语音识别技术的英语口语教学系统[J].计算机应用,2009,29(3):761-763. 被引量：10
3张红涛,毛罕平,邱道尹.储粮害虫图像识别中的特征提取[J].农业工程学报,2009,25(2):126-130. 被引量：61
4蔡继东.一种电能计量装置异常状态监测系统的研究[J].硅谷,2008,1(23):31-31. 被引量：5
5付志超,程伟,李晶,徐成.一种基于神经网络的模态参数识别方法[J].机械强度,2010,32(6):899-904. 被引量：1
6杜志然,周萍,景新幸,李杰.基于谱熵的耳语音增强研究[J].传感器与微系统,2012,31(6):69-72. 被引量：3
7井晓阳,罗飞,王亚棋.汉语语音合成技术综述[J].计算机科学,2012,39(S3):386-390. 被引量：13
8潘家华,刘淑琴,杨忆,刘学清.西太平洋富钴结壳的类型、分布与产状[J].矿床地质,2002,21(S1):44-47. 被引量：4
9闫仕娟,杜德文,宋庆磊,刘永刚.麦哲伦海山富钴结壳及区域要素空间分布的协同克里格估计[J].矿物学报,2013,33(S2):674-675. 被引量：1
10朱新卓,严芮,刘寒月.基于过程的教育质量及其评价[J].高等教育研究,2015,36(5):78-85. 被引量：29

引证文献70

1白雄文,王红艳,孙宇,周炼赤.基于人工智能的自然语言处理技术分析[J].电子技术（上海）,2021(1):176-177. 被引量：4
2景维鹏,张兴革.基于POWER8的动态自适应池化算法[J].计算机工程,2016,42(5):207-212. 被引量：1
3曾雪琼,黎杰.基于卷积神经网络的时频图像识别研究[J].机械与电子,2016,34(5):25-29. 被引量：6
4方宁,周宇,叶庆卫,李玉刚.基于无监督学习卷积神经网络的振动信号模态参数识别[J].计算机应用,2017,37(3):786-790. 被引量：11
5董刚,马宏伟,南源桐,马琨.刮板输送机飘链故障诊断技术研究[J].煤炭科学技术,2017,45(5):41-46. 被引量：8
6贾京龙,余涛,吴子杰,程小华.基于卷积神经网络的变压器故障诊断方法[J].电测与仪表,2017,54(13):62-67. 被引量：84
7侯一民,周慧琼,王政一.深度学习在语音识别中的研究进展综述[J].计算机应用研究,2017,34(8):2241-2246. 被引量：81
8程曦,张友华,陈祎琼,吴云志,乐毅.深度学习在储粮害虫的特征提取与分类上的应用[J].皖西学院学报,2017,33(5):67-72. 被引量：4
9朱锡祥,刘凤山,张超,吕钊,吴小培.基于一维卷积神经网络的车载语音识别研究[J].微电子学与计算机,2017,34(11):21-25. 被引量：16
10王霞,杜桂明,王光艳,张艳.基于卷积神经网络的面罩语音识别[J].传感器与微系统,2017,36(10):31-34. 被引量：6

二级引证文献621

1杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
2何成兵,王润泽,张霄翔.基于改进一维卷积神经网络的汽轮发电机组轴系扭振模态参数辨识[J].中国电机工程学报,2020,40(S01):195-203. 被引量：17
3师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：11
4朱梦帆,汪志成,戴诗柏.基于语谱图与稠密卷积神经网络的性别与年龄识别研究[J].仪表技术,2022(1):66-70. 被引量：3
5孙圣勇.智能化英语教学研究的热点分析[J].现代英语,2020(9):69-71.
6罗文.基于SDP图像处理算法的矿用顶板支护斜盘故障诊断[J].工矿自动化,2024,50(S01):7-10.
7支双双,赵庆会,金大海,唐琎.基于CNN和DLTL的步态虚拟样本生成方法[J].计算机应用研究,2020,37(1):291-295. 被引量：1
8林少娃,陈奕汝,顾洁,伍蓓蓓,雍旭龙.基于隐含狄利克雷分布主题模型和特征级异构数据融合的电力故障主动性预警研究[J].电子器件,2022,45(2):432-438. 被引量：11
9尹继超,陈路标,张仕玉.一种核电高风险人因风险分析系统设计与实现[J].电子技术应用,2021,47(S01):36-43.
10白雄文,王红艳,孙宇,周炼赤.基于人工智能的自然语言处理技术分析[J].电子技术（上海）,2021(1):176-177. 被引量：4

1张蕾.MATLAB在CNNs非线性电路仿真中的应用[J].信息通信,2011,24(3):25-26. 被引量：1
2姜浩,郭斌.基于摄像机运动的图像匹配帧间压缩模型[J].中国传媒大学学报（自然科学版）,1996,7(2):44-48.
3涂俊辉,续晋华.基于HTK的连续语音识别系统及其在TIMIT上的实验[J].现代计算机,2009,15(11):29-33. 被引量：6
4田壮壮,占荣辉,胡杰民,张军.基于卷积神经网络的SAR图像目标识别研究.[J].雷达学报（中英文）,2016,5(3):320-325. 被引量：72
5蒋文建,韦岗.基于掩蔽特性的噪声环境下语音识别新特征[J].声学学报,2001,26(6):516-520. 被引量：10
6谢青松,潘进,史永林,李国朋.基于GMM模型的说话人辨认系统[J].电脑知识与技术,2009,5(3X):2186-2187.
7李雅娟,林闯.随机高级Petri网在异构系统中的应用[J].电子学报,2004,32(11):1839-1843. 被引量：1
8李宝岩.基于长时子带能量变化特征的语音活动检测[J].移动通信,2016,40(14):25-28.
9连帅彬,王鹏,陈新武,张晓丽.基于削峰尾插和几何级数压扩变换的OFDM时域信号压缩算法[J].信阳师范学院学报（自然科学版）,2016,29(1):99-103. 被引量：2
10陈觉之,张贵荣,周宇欢.一种基于贪婪策略的说话人语音特征优选方法[J].计算机与现代化,2013(5):201-205. 被引量：1

工程科学学报

2015年第9期

浏览历史

内容加载中请稍等...

基于卷积神经网络的连续语音识别被引量：70

同被引文献495

引证文献70

二级引证文献621

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的连续语音识别 被引量：70

同被引文献495

引证文献70

二级引证文献621

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的连续语音识别被引量：70