基于深度可分离卷积神经网络的关键词识别系统被引量：4

Keywords spotting system based on deepwise separable convolutional neural network

下载PDF

导出

摘要关键词识别系统是智能语音交互系统的重要组成部分.本文使用Google语音命令数据集,探索使用传统卷积神经网络和深度可分离卷积神经网络在关键词识别任务中的应用,对两种卷积神经网络模型从识别率、计算量、内存消耗进行对比,并提出适用于受限设备的低资源、较高识别率的网络模型.实验结果显示无论传统卷积神经网络还是深度可分离卷积神经网络在关键词识别任务中的表现都优于传统的的隐马尔科夫模型和全连接深度学习模型,而深度可分离卷积神经网络进一步优于传统卷积神经网络. The keyword spotting system is an important part of the intelligent voice interaction system. We explore the application of convolution neural networks and depthwise separable convolution neural networks to the keyword spotting task, using the Google Speech Commands Dataset as our benchmark. We will make comparison of recognition rate, calculation amount, and storage consumption for two convolutional neural network models and propose a network model with low resource and high recognition rate for restricted devices. The experimental results show that both the traditional convolutional neural networks and the deep separable convolutional neural networks perform better than the traditional Hidden Markov model and deep learning model based on fully connected neural networks in the keyword spotting task, while the depthwise separable convolutional neural networks is more superior to the convolutional neural networks.

作者王帅彭意兵何顶新 WANG Shuai;PENG Yi-bing;Newest He(College of Automation, Huazhong University of Science and Technology,Wuhan 430070, China)

机构地区华中科技大学自动化学院

出处《微电子学与计算机》北大核心 2019年第9期103-108,共6页 Microelectronics & Computer

基金国家自然科学基金(616750416)

关键词关键词识别卷积神经网络深度可分离卷积神经网络受限设备 spotting convolution neural network depthwise separable convolution neural network restricted device

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张晴晴,刘勇,潘接林,颜永红.基于卷积神经网络的连续语音识别[J].工程科学学报,2015,37(9):1212-1217. 被引量：70
2刘华平,李昕,郑宇,徐柏龄,姜宁.一种改进的自适应子带谱熵语音端点检测方法[J].系统仿真学报,2008,20(5):1366-1371. 被引量：26

二级参考文献11

1刘晓明,覃胜,刘宗行,江泽佳.语音端点检测的仿真研究[J].系统仿真学报,2005,17(8):1974-1976. 被引量：21
2侯周国,钱盛友,姚畅.短时域语音端点检测中谱熵算法的改进[J].计算机工程与应用,2006,42(21):55-56. 被引量：3
3Bush K, Ganapathiraju A, Komman P. A Comparison of Energy- based Endpoint Detectors for Speech Signal Processing [C]// MS State DSP Conference (S1520-6149). Fall, 1995: 85-98.
4Jia C, Xu B. An Improved Entropy based Endpoint Detection Algorithm [C]// ISCSLP (ISBN: 0-7803-8678-7). Taipei, Taiwan 2002: 96.
5Shen J L, Hung J W, Lee L S. Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments [C]// Processing. Sydney ICSLP (S0160-5840), Sydney, Australia, Nov-Dec 1998, CD2ROM, 1998: 232-235.
6Bing-Fei Wu, Kun-Ching Wang. Robust Endpoint Detection Algorithm Based on the Adaptive Band-Partitioning Spectral Entropy in Adverse Environments [J]. IEEE Transactions on Speech and Audio Processing (S 1063-6676), 2005, 13(5): 762-775.
7Gin-Der Wu, Chin-Teng Lin. Word Boundary Detection with Mel-Scale Frequency Bank in Noisy Environment [J]. Ieee Transactions on Speech and Audio Processing (S1063-6676), 2000,8(5): 541-554.
8S F Boll. Suppression of acoustic noise in speech using spectral subtraction [J]. IEEE Transaction on Acoustics, Speech and Signal Proc (S0096-3518), 1979, 27:113-120.
9Hemant Misra, Shajith Ikbal, Sunil Sivadas, Herve Bourlard. Multi-resolution spectral entropy feature for robust ASR. [C]// ICASSP'05 (S 1053-5888). Philadelphia, PA, 2005, (3): 253-256.
10Liang-sheng Hua, Chung-ho Yang. A Novel Approach To Robust Speech Endpoint Detection In Car Environments [C]//ICASSP 2000 (S1520-6419). Istambul, Turkey, 2000: 1751-1754.

共引文献94

1白雄文,王红艳,孙宇,周炼赤.基于人工智能的自然语言处理技术分析[J].电子技术（上海）,2021(1):176-177. 被引量：4
2李晋,刘甫,王玲,许慧燕.改进的语音端点检测技术[J].计算机工程与应用,2009,45(24):133-135. 被引量：9
3贺怀清,高金枝.两类噪声谱估计方法的对比分析[J].计算机工程与应用,2010,46(23):154-158. 被引量：3
4刘柏森,卢志茂,申丽然,金辉.基于希尔伯特-黄变换的低信噪比语音端点检测[J].吉林大学学报（工学版）,2011,41(3):844-848. 被引量：7
5王景芳.实时语音端点鲁棒检测[J].计算机工程与应用,2011,47(20):147-150. 被引量：4
6李灵光.一种时频结合的抗噪性端点检测算法[J].计算机与现代化,2011(8):29-31. 被引量：5
7卢志茂,金辉,张春祥,任明溪.基于HHT和OSF的复杂环境语音端点检测[J].电子与信息学报,2012,34(1):213-217. 被引量：12
8汪石农,许钢,张爱雪,葛愿.多语音特征参数的端点检测方法研究[J].计算机工程与设计,2012,33(2):684-687. 被引量：2
9刘柏森,卢志茂,金辉,孙美玲.一种HHT谱矩阵的车内噪声语音端点检测[J].计算机工程与应用,2012,48(20):164-167.
10侯丽霞,曾以成,焦蓓.强噪声环境下基于改进HHT的语音端点检测[J].计算机工程与应用,2012,48(28):139-142. 被引量：6

同被引文献45

1李琰,张燕,田水承.基于链式中介效应的工作资源与心理安全行为关系研究[J].西安科技大学学报,2019,0(6):972-978. 被引量：7
2刘伟锋,李树娟,王延江.人脸表情的LBP特征分析[J].计算机工程与应用,2011,47(2):149-152. 被引量：19
3刘帅师,田彦涛,万川.基于Gabor多方向特征融合与分块直方图的人脸表情识别方法[J].自动化学报,2011,37(12):1455-1463. 被引量：76
4蔡则苏,祝丁丁,何健.基于PCA特征提取和距离哈希K近邻分类的人脸表情识别[J].智能计算机与应用,2012,2(1):1-3. 被引量：9
5阴东玲,陈兆波,曾建潮,李亨英.基于带权重定性贝叶斯网络的煤矿事故人因推理[J].武汉理工大学学报（信息与管理工程版）,2017,39(1):10-14. 被引量：5
6齐梅,李艳秋.WGC特征描述的人脸表情识别[J].电子测量与仪器学报,2017,31(4):566-572. 被引量：5
7张慧,王坤峰,王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报,2017,43(8):1289-1305. 被引量：246
8李红霞,杨言言.煤矿安全生产中矿工心理韧性影响因素研究[J].西安科技大学学报,2018,38(4):538-545. 被引量：13
9张巍,林飞飞,梁镇爽,黄振.一种可扩展的深度神经网络机器翻译Service架构[J].厦门大学学报（自然科学版）,2019,58(2):184-188. 被引量：2
10陆雯洁,谭儒昕,刘功申,孙环荣.基于半监督学习的小语种机器翻译算法[J].厦门大学学报（自然科学版）,2019,58(2):200-208. 被引量：8

引证文献4

1郭小华.基于深度神经网络的机器翻译智能重排序系统设计[J].自动化与仪器仪表,2021(7):140-142. 被引量：3
2程帅,倪龙娇,胡莹.基于改进压缩激活神经网络的图像分类[J].保山学院学报,2022,41(2):85-91.
3王征,张科,张赫林,潘红光.深度可分离卷积神经网络miniXception对矿工情绪特征的识别[J].西安科技大学学报,2022,42(3):562-571. 被引量：1
4郭克友,李雪,杨民.基于轻量化YOLOv4的交通信息实时检测方法[J].计算机应用,2023,43(1):74-80. 被引量：3

二级引证文献7

1王婷婷.基于HNC理论机器翻译系统中语义块主辅变换研究[J].吉林农业科技学院学报,2022,31(1):63-66.
2田苗.大学生英语学习中英语翻译APP优化设计[J].现代科学仪器,2022,39(4):41-45.
3陈朝新,徐恒博,郭磊,沈鹏,陈江义.基于双目视觉的混凝土电杆立杆参数测量方法[J].西安科技大学学报,2023,43(2):431-438. 被引量：1
4孙好,董兴法,王军,陈致远.基于改进YOLOv4-Tiny轻量化校内行人目标检测算法[J].计算机工程与应用,2023,59(15):97-106. 被引量：2
5蔡刘畅,杨培峰,张秋仪.基于YOLOv7的道路监控车辆检测方法[J].陕西科技大学学报,2023,41(6):155-161. 被引量：1
6张富洪.基于信息化的高速公路布线快速选择研究[J].公路交通技术,2024,40(2):11-16.
7赵阶旭,蔡君,杨雪佳.无线网络通信支持下的物流存储系统设计[J].信息技术,2024,48(9):120-124.

1杨新欣,陈坚波,刘旭敏.智能空调接入Google Assistant语音控制[J].日用电器,2019,0(8):17-19.
2屈丽丽.要避免被BAT打穿壁垒——访云知声创始人、CEO黄伟[J].中国中小企业,2019,0(7):44-45.
3夏锐.智能语音技术在电视技术上的应用现状和前景[J].科技风,2019,0(24):84-84. 被引量：1
4哈啰出行用AI技术管理共享单车[J].智能城市,2019,5(17):82-82.
5张春娥,张云峰,李瑛.智慧校园建设中校园百事通的设计与实现[J].北华航天工业学院学报,2019,29(2):5-6. 被引量：2
6张婷婷.“智慧课堂”在高中英语阅读课的应用案例[J].青少年日记（教育教学研究）,2019,0(9):126-127.
7周政宁,史新鹭.动量策略收益尾部风险的实证研究——基于两状态隐马尔科夫模型[J].中国经济问题,2019,0(4):40-50.
8邓美,李喻,龙亮海,黄丽娜,陈涵,夏璐,于佳卉.Trivial Pursuit：用知识付房费[J].销售与市场,2019,0(17):100-103.
9柯云.刍议城市道路的水土保持问题[J].中华建设,2019,0(19):50-51.
10胡义萍.浅谈多媒体技术在幼儿园教育教学中的应用[J].教育革新,2019,0(6):77-77.

微电子学与计算机

2019年第9期

浏览历史

内容加载中请稍等...

基于深度可分离卷积神经网络的关键词识别系统被引量：4

参考文献2

二级参考文献11

共引文献94

同被引文献45

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度可分离卷积神经网络的关键词识别系统 被引量：4

参考文献2

二级参考文献11

共引文献94

同被引文献45

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度可分离卷积神经网络的关键词识别系统被引量：4