融合多维时频特征的环境声识别

Enviromental sound recognition using fusion of multi-dimensional time-frequency features

下载PDF

导出

摘要针对单一的时频特征无法完全表征声信号在时频域上演变过程,从而导致环境声识别性能差的问题。首先,以对数梅尔和耳蜗时频特征为基础,提出一种在时、频两个维度上的一阶差分特征,用于表征声信号在时频域中能量变化的动态关系;然后融合对数梅尔、耳蜗及其一阶差分特征形成多维时频特征;最后,构建卷积神经网络充分提取更具判别性的特征信息,并使用DS证据理论进行信息融合,提出一种新的环境声识别模型。在ESC-10和ESC-50数据集上分别达到了96%与85.3%的识别率,比先进的DS-CNN模型分别提升了3.4%和2.2%,比人耳识别性能分别提升0.3%和4%。实验结果表明,所提出的模型在环境声识别任务能够达到较好的识别效果。

作者李林桦王学渊李小霞 LI Lin-hua;WANG Xue-yuan;LI Xiao-xia

机构地区西南科技大学信息工程学院特殊环境机器人技术四川省重点实验室

出处《制造业自动化》 CSCD 北大核心 2021年第6期49-52,94,共5页 Manufacturing Automation

基金国家自然科学基金资助项目(61771411)。

关键词环境声识别多维时频特征卷积神经网络 DS证据理论

分类号 TB529 [理学—声学]

引文网络
相关文献

参考文献3

1李伟红,王伟冰,龚卫国.低信噪比下公共场所异常声音声学特征提取[J].声学学报,2019,44(5):934-944. 被引量：4
2刘昊天,姜海燕,舒欣,徐彦,伍艳莲,郭小清.基于特征迁移的多物种鸟声识别方法[J].数据采集与处理,2017,32(6):1239-1247. 被引量：8
3阴法明,王诗佳,赵力.Deep ESC网络的环境声分类方法研究[J].声学技术,2019,38(5):590-593. 被引量：3

二级参考文献11

1李燕萍,唐振民,钱博,张燕.基于PLAR特征补偿的鲁棒性说话人识别仿真研究[J].系统仿真学报,2009,21(2):409-412. 被引量：2
2栾少文,龚卫国.公共场所典型异常声音的特征提取[J].计算机工程,2010,36(7):208-210. 被引量：16
3张伟豪,许枫.基于ERB尺度的心理声学模型及其数值计算[J].声学技术,2011,30(2):161-166. 被引量：5
4尹辉,谢湘,匡镜明.基于听觉模型与自适应分数阶Fourier变换的声学特征在语音识别中的应用[J].声学学报,2012,37(1):97-103. 被引量：14
5周强,张晓俊,顾济华,赵鹤鸣,朱俊杰,陶智.嗓音多频带非线性分析的声带病变识别[J].声学学报,2014,39(1):111-118. 被引量：11
6魏静明,李应.利用抗噪纹理特征的快速鸟鸣声识别[J].电子学报,2015,43(1):185-190. 被引量：16
7孙斌,万鹏威,陶达,赵玉晓.基于自适应最优核时频分布的鸟类识别[J].数据采集与处理,2015,30(6):1187-1195. 被引量：7
8李伟红,田真真,龚卫国,王伟冰.改进的ESMD用于公共场所异常声音特征提取[J].仪器仪表学报,2016,37(11):2429-2437. 被引量：18
9樊晓鹤,赵鹤鸣,陈雪勤,周燕.倒谱参数稀疏分解下的汉语音谎言检测[J].声学学报,2018,43(1):121-128. 被引量：4
10周挺挺,曾毓敏,王蓉蓉,卞乐.基于ERB尺度划分的多子带语声信号抗噪谱减算法[J].应用声学,2017,36(3):212-219. 被引量：1

共引文献11

1孙袖山,李剑,贺斌,庞润嘉,马翊翔,郭锦铭.基于ZYNQ的枪声识别系统设计[J].电子测量技术,2023,46(2):1-6. 被引量：1
2冯郁茜,谢将剑,李星光.基于移动端的嵌入式鸟类识别系统设计与开发[J].电子技术与软件工程,2019(8):184-186. 被引量：1
3乔玉,钱昆,赵子平.基于机器听觉的鸟声识别的中文研究综述[J].复旦学报（自然科学版）,2020,59(3):375-380. 被引量：11
4邢照亮,吴伟银,张正晓,陈麒麟,倪东明.基于C-LSTM的鸟鸣声识别方法[J].科技创新与应用,2021,11(15):15-18. 被引量：2
5阙鑫华,乔倩,蒋慧,吴旭成,柴晨思,王瑞,郑红.基于改进DTW算法的海岛水鸟鸣声识别应用研究[J].农村经济与科技,2021,32(11):320-322. 被引量：2
6樊翔宇,张聪,杨柳.融合梅尔谱和循环残差的小样本音频分类模型[J].计算机仿真,2022,39(2):195-202. 被引量：1
7张永梅,孙捷.基于动静态特征双输入神经网络的咳嗽声诊断COVID-19算法[J].电子学报,2023,51(1):202-212. 被引量：2
8于强,张健,殷程凯,陈青.鸟害防治技术及其在农林中的应用展望[J].中国农机化学报,2023,44(3):64-72. 被引量：4
9申小虎,朱翔宇,史洪飞,王传之.基于机器学习鸟声识别算法研究进展[J].生物多样性,2023,31(11):164-189.
10王彦麟,孙静,杨宏波,郭涛,潘家华,王威廉.基于时频融合特征的肺动脉高压心音分类模型[J].计算机科学,2024,51(S01):375-381.

1林智伟,朱文章,陈浩.差分特征融合改进的动态手势识别分类网络模型[J].厦门理工学院学报,2021,29(1):35-42.
2毕海胜,贠智强,李慧瑶,李洪松,张庆雷,苗嘉旭.基于盲目反卷积算法的声发射源信号复原研究进展[J].激光与光电子学进展,2021,58(6):65-75. 被引量：3
3本刊社.亨德利再出击,对决中国斯诺克新星,胜者挑战丁俊晖接班人[J].当代体育,2021(13):2-2.
4吴泽源.《东城梦魇》隐而不发的女性赞歌[J].南方人物周刊,2021(18):78-79.
5魏勤,陈仕军,谭政宇,黄炜斌,马光文.基于SA-LSTM的水电站站间流量动态滞时关系[J].水电能源科学,2021,39(6):16-19. 被引量：4
6韩光辉,韩守亮,李高鹏,郑维,纪秉男,张涛.纯电动车用驱动电机滚动轴承状态监测方法[J].电子测量与仪器学报,2021,35(2):130-135. 被引量：1
7任碧云,郭猛.基于文本挖掘的数字化水平与运营绩效研究[J].统计与信息论坛,2021,36(6):51-61. 被引量：25
8杜小妮,段娥娥,王天心.基于混沌的双模块Feistel结构高安全性高速分组密码算法安全性分析[J].电子与信息学报,2021,43(5):1365-1371. 被引量：1
9林文雅,杨小明,杜诗雅.探讨听觉诱发电位在胆红素脑病早期诊断中的应用价值及检出率[J].齐齐哈尔医学院学报,2021,42(8):675-677.
10张宏国,吕丁友,官大勇,王启明,刘军钊.辽东湾地区辽中凹陷东营组湖底扇成藏差异性研究[J].中国石油勘探,2021,26(3):95-106. 被引量：8

制造业自动化

2021年第6期

浏览历史

内容加载中请稍等...

融合多维时频特征的环境声识别

参考文献3

二级参考文献11

共引文献11

相关作者

相关机构

相关主题

浏览历史