基于耳蜗谱图纹理特征的声音事件识别被引量：6

Sound event recognition based on texture features of cochleagram

下载PDF

导出

摘要针对在各种环境下声音事件的识别问题,提出了一种基于谱图纹理特征的声音事件识别方法。首先,将声音信号通过伽马通(Gammatone)滤波器组,使原始声音样本转化为灰度耳蜗谱图;然后,对谱图进行曲波(Curvelet)变换,得到不同尺度、不同方向的Curvelet子带;再采用改进完全局部二值模式(Improved Completed Local Binary Pattern,ICLBP)提取Curvelet子带的纹理特征,并生成分块统计直方图,将统计直方图级联作为一种新的声音事件特征;最后,使用支持向量机作为分类器对16种声音事件在不同噪声和不同信噪比下进行识别。实验结果表明,所提特征与其他声音特征相比,可以有效识别各种噪声环境下不同种类的声音事件。 A sound event recognition method based on texture features of cochleagram is proposed for improving sound event recognition in various environments.Firstly,the original sound sample is converted into a grayscale cochleagram by Gammatone filter bank.Then,the cochleagram is processed by Curvelet transform to obtain Curvelet sub-bands with different scales and directions.The texture features of Curvelet sub-bands are extracted by using the improved completed local binary pattern(ICLBP)to generate the block statistical histograms which are cascaded as a new sound event feature for recognition.Finally,the support vector machine is used as a classifier to identify 16 kinds of sound events under different noise environments and different signal-to-noise ratios.The experimental results show that the proposed algorithm can effectively identify different kinds of sound events in various noise environments compared with other sound features.

作者曾金芳黄费贞白冰徐林涛 ZENG Jinfang;HUANG Feizhen;BAI Bing;XU Lintao(School of Physics and Optoelectronic Engineering,Xiangtan University,Xiangtan 411105,Hunan,China)

机构地区湘潭大学物理与光电工程学院

出处《声学技术》 CSCD 北大核心 2020年第1期69-75,共7页 Technical Acoustics

基金湖南省自然科学基金项目(2018JJ3486) 湘潭大学校级科研项目(16XZX02) 湘潭大学博士启动项目(15QDZ28)。

关键词 Gammatone滤波器组耳蜗谱图 CURVELET变换完全局部二值模式支持向量机 Gammatone filter bank cochleagram Curvelet transform completed local binary pattern support vector machine

分类号 TN911.7 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1张柯欣,龙哲,王雪峰,赵宏.基于肺音谱图Hough变换的喘鸣音识别方法[J].东北大学学报（自然科学版）,2017,38(11):1534-1537. 被引量：2
2李玲俐,陈晓明.类独立特征提取法在环境声音识别中的应用[J].计算机工程与应用,2012,48(22):156-160. 被引量：2
3陈含露,杨宏晖,申昇.用于水声目标识别的近邻无监督特征选择算法[J].声学技术,2016,35(3):204-207. 被引量：2

二级参考文献33

1Klapuri.Audio signal classification[R].ISMIR Graduate School, 2004.
2Gerhard D.Audio signal classification: history and cur- rent techniques[R].Department of Computer Science, University of Regina, Regina, Canada, 2007-11.
3Shin W H, Lee B-S, Lee Y-K, et al.Speech/non-speech classification using multiple feature for robust endpoint[C]// IEEE International Conference on Detection, Acoustics, Speech, and Signal Processing (ICASSP2000) , 2000, 3: 1399-1402.
4Cowling M, Sitte R.Analysis of speech recognition tech- niques for use in a non-speech sound recognition sys- tem[M]//Honray B,Wysocki T,Darnell M.Advanced Sig- nal Processing for Commtuaication Systems.[S.1.]: Kluwer Academic Publishers, 2004:131-46.
5Cowling M.Non-speech environmental sound classifica- tion systems for autonomous surveillance[D].School of Information Technology, G~:iffith University, Gold Coast Campus, 2004.
6Barry S J, Dane A D, Alya H, et al.The automatic rec- ognition and counting of cough[J].Cough,2006,2(8).
7Kimber D, Wilcox L.Acoustic segmentation for audio browersers[C]//Proceedings of Interface Conf, Australia, 1996.
8Rabiner L, Juang B H.Fundamentals of speech recogni- tion[M].[S.1.] :Prentice Hall, 1999.
9Zhang T, Kuo C-C J.Audio content analysis for online audiovisual data segmentation and classification[J].IEEE Trans on Speech and Audio Processing,2001,9(4) :441-457.
10Abu-EI-Quran A R, Goubran R A,Chan A D C.Securi- ty monitoring using microphone arrays and audio clas- sification[J].IEEE Trans on Instrumental and Measure- ments,2006,55 (8) : 1025-1032.

共引文献3

1张振华,吴宁,俞剑.一种特征模板匹配的水声识别系统的设计与实现[J].计算机与数字工程,2018,46(11):2274-2278. 被引量：3
2赵斌财,林骞,于凯,孟博.基于神经网络的变压器故障声识别研究[J].自动化技术与应用,2023,42(7):16-19.
3吴婷,刘琼,郭慧茹.基于鲁棒纹理特征的环境声音事件检测方法[J].电子器件,2024,47(2):530-535.

同被引文献66

1李响,李国正,邓明君,万平,严利鑫.基于语音频谱图像特征的人体疲劳检测方法[J].仪器仪表学报,2021,42(2):123-132. 被引量：14
2李佳芮,洪缨.喘鸣音的声谱图熵特征分析及检测[J].声学学报,2020,45(1):131-136. 被引量：3
3贾科,杨哲,魏超,郑黎明,李彦宾,毕天姝.基于斯皮尔曼等级相关系数的新能源送出线路纵联保护[J].电力系统自动化,2020(15):103-115. 被引量：43
4韦娟,顾兴权,宁方立.一种基于EEMD的异常声音识别方法[J].北京邮电大学学报,2020(5):112-117. 被引量：3
5张重远,罗世豪,岳浩天,王博闻,刘云鹏.基于Mel时频谱-卷积神经网络的变压器铁芯声纹模式识别方法[J].高电压技术,2020,46(2):413-423. 被引量：70
6冯兵,李芝棠,花广路.基于灰度—梯度共生矩阵的图像型垃圾邮件识别方法[J].通信学报,2013,34(S2):1-4. 被引量：11
7李允公,张金萍,戴丽,张占一,刘杰.基于听觉模型ZCPA的故障诊断特征提取方法研究[J].中国机械工程,2009(24):2988-2992. 被引量：9
8朱勇,詹永照.基于CBP-TOP特征的人脸表情识别[J].计算机应用研究,2011,28(5):1957-1960. 被引量：2
9彭佑多,谢伟华,郭迎福,李新.矿井掘进工作面粉尘对机器噪声衰减的影响[J].湖南科技大学学报（自然科学版）,2012,27(1):23-29. 被引量：4
10王静远,李超,熊璋,单志广.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014,51(2):239-259. 被引量：225

引证文献6

1吴佳赛,高振斌.基于双二流卷积和多特征融合的D-S声音分类[J].计算机应用研究,2022,39(3):693-698. 被引量：2
2孙继平,余星辰,王云泉.基于声谱图和SVM的煤矿瓦斯和煤尘爆炸识别方法[J].煤炭科学技术,2023,51(2):366-376. 被引量：3
3陈晓梅,王晓玮,钟波,杨佳燕,商莹莹.基于伽玛通滤波器的双谱特征语音可懂度算法[J].计算机工程与设计,2023,44(5):1288-1296.
4石庆升,陈家良,董哲.基于听觉显著性特征的发电机组主轴承性能评估[J].科学技术与工程,2024,24(1):205-214.
5吴婷,刘琼,郭慧茹.基于鲁棒纹理特征的环境声音事件检测方法[J].电子器件,2024,47(2):530-535.
6余星辰,李小伟.基于小波散射变换的煤矿瓦斯和煤尘爆炸声音识别方法[J].煤炭科学技术,2024,52(S01):70-79.

二级引证文献5

1孙继平,程继杰,王云泉.基于掩埋图像特征的煤矿冲击地压和煤与瓦斯突出感知报警方法[J].工矿自动化,2023,49(5):1-6. 被引量：2
2周帅,李理,彭章君,黄鹏程.基于多通道特征和混合注意力的环境声音分类[J].计算机技术与发展,2023,33(8):43-50. 被引量：1
3姜海燕,宋庆辉,宋庆军,刘治江,郝文超.基于机器视觉的煤矸识别实验教学平台研发[J].实验室研究与探索,2023,42(11):124-129.
4余星辰,李小伟.基于特征融合的煤矿瓦斯和煤尘爆炸声音识别方法[J].煤炭学报,2023,48(S02):638-646. 被引量：1
5程继杰,刘毅.基于深度特征的煤矿冲击地压和煤与瓦斯突出图像感知报警方法[J].煤炭科学技术,2024,52(3):245-257. 被引量：2

1邢鑫瑞,何素艳.体育群体性事件的特征分析与应对[J].体育科技文献通报,2020,28(2):155-156.
2杨子元,许晓斌,李欣,赵一萌.基于智能感知技术的用电事件识别方法研究[J].物联网学报,2019,3(4):109-115. 被引量：3
3陈闯,贾文武,王亚.基于时域演化特征的细胞有丝分裂事件识别与检测[J].激光与光电子学进展,2019,56(24):124-131. 被引量：1
4朱晴晴.声音信号的计量与专业电声设备的电平表[J].电声技术,2019,43(12):78-80.
5张治国,李德平,柳宁.电器标签分类的SVM方法研究[J].机电工程技术,2019,48(12):1-4. 被引量：2
6高旭,黄建琼.一种基于LBP改进的人脸识别算法[J].河南科技学院学报（自然科学版）,2019,47(6):70-74. 被引量：3
7徐建亮,周明安,毛建辉,方坤礼.基于一种卷积神经式类网络的实时人脸识别方法研究[J].计算机科学与应用,2020,10(1):11-20. 被引量：2
8王立伟.浅谈功放与音箱的匹配[J].科技资讯,2019,17(36):17-18.
9张健,钟中志,柯艳国,凡远柱.基于MHSW特征融合的火焰检测[J].计算机技术与发展,2019,29(12):184-188. 被引量：1
10王爱丽,赵元,王子腾,于士尧,孙喜利.城市轨道交通客流信息智能检测与管控系统研究与设计[J].铁路计算机应用,2020,29(2):68-72. 被引量：8

声学技术

2020年第1期

浏览历史

内容加载中请稍等...

基于耳蜗谱图纹理特征的声音事件识别被引量：6

参考文献3

二级参考文献33

共引文献3

同被引文献66

引证文献6

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于耳蜗谱图纹理特征的声音事件识别 被引量：6

参考文献3

二级参考文献33

共引文献3

同被引文献66

引证文献6

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于耳蜗谱图纹理特征的声音事件识别被引量：6