基于改进卷积神经网络的声音事件分类模型被引量：1

下载PDF

导出

摘要声音事件通常发生在非结构化环境中,在这些环境中,它们的频率内容和时间结构都有很大的变化。卷积神经网络(convolutional neural network,CNN)能够提取对局部光谱和时间变化不变的更高层次特征但缺乏时间和频率不变性和时间上下文信息。递归神经网络(recurrent neural networks,RNN)在学习音频信号中的长期时间上下文方面功能强大。基于此,提出了一种将两种方法相结合的卷积递归神经网络模型(convolutional recurrent neural network,CRNN),并将其应用于声音事件检测任务。首先针对已知音频序列提取梅尔倒谱系数(Mel-frequency cepstral coeffi cients,MFCCs),然后将提取到的特征输入到CRNN神经网络进行识别;最后阈值化做出事件活动预测。通过在公开数据集ESC-50和TUT-sound-events-2016-devlopment进行的实验表明,本文提出的模型可以明显提高声音识别分类准确率。

作者王泽雨王国靖 WANG Zeyu;WANG Guojing

机构地区沈阳理工大学

出处《信息技术与信息化》 2023年第5期181-184,共4页 Information Technology and Informatization

关键词声音事件检测声音分类深度神经网络卷积神经网络递归神经网络

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献6

1邓江云,李晟.基于GMM-HMM的语音识别垃圾分类系统[J].现代计算机,2020,26(26):27-32. 被引量：3
2黄清,方木云.一种基于HMM算法改进的语音识别系统[J].重庆工商大学学报（自然科学版）,2022,39(5):56-61. 被引量：10
3韦娟,杨皇卫,宁方立.基于NMF与CNN联合优化的声学场景分类[J].系统工程与电子技术,2022,44(5):1433-1438. 被引量：3
4马晗,唐柔冰,张义,张巧灵.语音识别研究综述[J].计算机系统应用,2022,31(1):1-10. 被引量：27
5徐睿,李志华,韩灿灿.基于特征融合和改进卷积神经网络的环境音识别[J].计算机与现代化,2021(2):62-67. 被引量：5
6杨利平,郝峻永,辜小花,侯振威.音频标记一致性约束CRNN声音事件检测[J].电子与信息学报,2022,44(3):1102-1110. 被引量：4

二级参考文献16

1周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：12
2李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12
3徐坤玉,张彩珍,药雪崧.语音信号的加窗傅里叶变换研究[J].山西师范大学学报（自然科学版）,2011,25(3):79-82. 被引量：6
4赵明明,王洪春.一种用于语音识别的高效分帧函数的研究[J].重庆工商大学学报（自然科学版）,2012,29(5):68-72. 被引量：4
5何强,毛士艺,张有为.汉语语音识别的平滑声韵基元HMM算法[J].北京航空航天大学学报,2001,27(2):146-149. 被引量：2
6许丽红,余小清,万旺根.基于HMM算法的语音识别系统设计及其混合编程实现[J].计算机工程,2002,28(5):139-140. 被引量：7
7鲁睿,张力.基于D-S证据理论的传感器网络数据融合算法[J].信息通信,2015,28(3):14-14. 被引量：3
8高珍珍,鲍长春.能量匹配的MFS-HMM语音增强方法[J].信号处理,2016,32(8):937-944. 被引量：2
9李强,陈浩,陈丁当.基于隐马尔可夫模型的语音激活检测算法[J].计算机应用,2016,36(11):3212-3216. 被引量：4
10李伟,李硕.理解数字声音——基于一般音频/环境声的计算机听觉综述[J].复旦学报（自然科学版）,2019,58(3):269-313. 被引量：28

共引文献44

1卓凡,陈凯,刘宪国.DFSMN语音识别技术在智能安全帽上的应用研究[J].中国高新科技,2021(20):48-50. 被引量：2
2许丞.基于卷积神经网络的钢琴音频信号识别算法[J].自动化与仪器仪表,2021(12):12-15. 被引量：2
3胡章芳,蹇芳,唐珊珊,明子平,姜博文.DFSMN-T:结合强语言模型Transformer的中文语音识别[J].计算机工程与应用,2022,58(9):187-194. 被引量：9
4韩文聪.智能音箱安全风险分析及其应对措施[J].轻工标准与质量,2022(3):52-56.
5张炳凯,刘浩,郑雯欣,嵇淮,张洁豪,李挺,张秋菊.基于语音控制的机器人下棋系统开发[J].科学技术创新,2022(25):159-162.
6贾子龙,潘士杰,郭子昊,唐进,姚燕.基于FPGA的声纹识别系统设计[J].电子器件,2022,45(4):997-1003. 被引量：2
7马晓亮,梁裕林,赖化宇.广州电信客户服务数智化升级工程[J].广东通信技术,2022,42(9):56-59.
8罗伟,房云龙,吴旭东,朱慧媛.基于Android的盲用手机阅读器设计[J].中国集成电路,2022,31(10):66-71.
9梁亚敏,李亚峰.基于语音识别的智能英语翻译机器人人机交互系统[J].自动化与仪器仪表,2022(9):196-200. 被引量：5
10霍伟明,徐浩.用于大词汇量语音识别的门控残差DFSMN声波模型[J].家电科技,2022(5):22-25. 被引量：2

同被引文献12

1张慧敏.基于动态时间规整算法的语音识别技术研究[J].科技资讯,2017,15(26):28-31. 被引量：4
2杨正哲,任玉玲,杜省,柳瑞波.分区域方言客服语音识别系统研究[J].网络新媒体技术,2019,8(1):37-42. 被引量：3
3黄永忠.语音信号处理课程教学改革的探讨[J].科技创新导报,2019,16(1):181-182. 被引量：3
4张辉,邓继周,周经纬,朱成顺,刘李明,张胜文.基于几何特征的桌面静态手势识别[J].计算机工程与设计,2020,41(10):2977-2981. 被引量：6
5赵海君,张玉婷,曳永芳.基于MATLAB的静态手势识别系统设计[J].电子质量,2021(6):28-33. 被引量：2
6潘志洋.探讨大数据时代机器学习的应用及发展[J].电子元器件与信息技术,2022,6(4):66-69. 被引量：3
7赵从义,姚旭峰.头影测量标志点自动识别算法研究进展[J].软件导刊,2022,21(8):221-227. 被引量：1
8李腾辉.基于机器学习的贷款分析与预测研究[J].电子元器件与信息技术,2023,7(2):66-72. 被引量：1
9徐静,李敬兆,石晴,袁浩然,赵天瑞,李小朋.基于MA-DBNN的带式输送机健康监测系统[J].机械工程与自动化,2023(3):4-6. 被引量：1
10陈虹玉,张福鼎.基于FPGA的手势识别系统研究[J].电子产品世界,2023,30(6):8-11. 被引量：1

引证文献1

1刘姝廷,娄浩云,张媛媛,张贺.基于语音识别的信号灯图像模拟控制系统研究[J].电子元器件与信息技术,2023,7(10):150-153.

1郑金艳,李琰,邓成.基于改进递归神经网络的同步电机短路故障模式识别[J].浙江水利水电学院学报,2023,35(2):85-90.
2阿卜杜勒拉扎克·古尔纳,宋佥(译).最后的礼物(节选)[J].外国文艺,2022(1):83-93.
3杨莲,崔永春,王圣芳.基于递归神经网络的非结构化数据加密存储[J].信息技术,2023,47(4):167-172.
4宋菲菲.绩效考核在事业单位人力资源管理中的应用实践探索[J].虹,2022(3):0183-0185.
5BETTY RICHARDSON.TEPITO Hard-hitting Mexican from the Keltey Lee Empire[J].城市漫步（上海版、英文）,2016(4):81-81.
6赵先平.老实的愿望(短篇小说)[J].红豆,2022(11):50-53.
7肖妍,霍林.基于复合卷积和自注意力的会话推荐[J].计算机工程与应用,2023,59(10):104-113.
8禹建申,高斯如,李铭慧,翟永超.基于心率的新陈代谢率预测模型研究[J].暖通空调,2023,53(4):149-155.
9Lanfeng Hua,Kaibo Shi,Zheng-Guang Wu,Soohee Han,Shouming Zhong.Sliding Mode Control for Recurrent Neural Networks With Time-Varying Delays and Impulsive Effects[J].IEEE/CAA Journal of Automatica Sinica,2023,10(5):1319-1321.
10张岩,李凤莲,张雪英,王夙喆,章洪涛.基于卷积融合和残差-注意力的脑卒中病灶分割[J].重庆理工大学学报（自然科学）,2023,37(5):185-193.

信息技术与信息化

2023年第5期

浏览历史

内容加载中请稍等...

基于改进卷积神经网络的声音事件分类模型被引量：1

参考文献6

二级参考文献16

共引文献44

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进卷积神经网络的声音事件分类模型 被引量：1

参考文献6

二级参考文献16

共引文献44

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于改进卷积神经网络的声音事件分类模型被引量：1