基于Radon和平移不变性小波变换的鸟类声音识别被引量：7

Bird sounds recognition based on Radon and translation invariant discrete wavelet transform

下载PDF

导出

摘要针对低信噪比(SNR)环境下鸟叫声识别率不够高的问题,提出一种对声谱图进行Radon变换(RT)和平移不变性离散小波变换(TIDWT)的抗噪型鸟类声音识别技术。首先,使用改进的多频带谱减法对鸟叫声进行降噪处理;其次,利用短时能量检测降噪后的鸟叫声的静音段,并去除静音段;接着,将去除静音段的声音信号转化为声谱图,并对声谱图进行RT和TIDWT,提取特征值;最后,采用支持向量机(SVM)分类器对提取的特征值进行分类识别。实验结果表明,该方法在信噪比为10 dB及以下仍可以达到较好的识别效果。 To improve the accuracy of bird sounds recognition in low Signal-to-Noise Ratio （SNR） environment, a new bird sounds recognition technology based on Radon Transform （RT） and Translation Invariant Discrete Wavelet Transform （TIDWT） from spectrogram after the noise reduction was proposed. First, an improved multi-band spectral subtraction method was presented to reduce the background noise. Second, short-time energy was used to detect silence of clean bird sound, and the silence was removed. Then, the bird sound was translated into spectrogram, RT and TIDWT were used to extract features. Finally, classification was achieved by Support Vector Machine （SVM） classifier. The experimental results show that the method can achieve better recognition effect even the SNR belows 10 dB.

作者周晓敏李应

机构地区福州大学数学与计算机科学学院

出处《计算机应用》 CSCD 北大核心 2014年第5期1391-1396,1417,共7页 journal of Computer Applications

基金国家自然科学基金资助项目(61075022)

关键词鸟类声音识别多频带谱减法短时能量 RADON变换平移不变性离散小波变换特征提取 bird sounds recognition multi-band spectral subtraction method short-time energy Radon Transform （RT） Translation Invariant Discrete Wavelet Transform （TIDWT） feature extraction

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1NEAL L,BRIGGS F,RAICH R,et al.Time-frequency segmentation of bird song in noisy acoustic environments[C]//Proceedings of the 2011 IEEE International Conference on Acoustics,Speech and Signal Processing.Piscataway:IEEE Press,2011:2012-2015.
2CHOU C H,LIU P H.Bird species recognition by wavelet transformation of a section of birdsong[C]//Proceedings of the 2009 Symposia and Workshops on Ubiquitous,Autonomic and Trusted Computing.Piscataway:IEEE Press,2009:189-193.
3BRIGGS F,RAICH R,FERN X Z.Audio classification of bird species:a statistical manifold approach[C]//Proceedings of the 2009 9th IEEE International Conference on Data Mining.Piscataway:IEEE Press,2009:51-60.
4LEE C H,HAN C C,CHUANG C C.Automatic classification of bird species from their sounds using two-dimensional cepstral coefficients[J].IEEE Transactions on Audio,Speech,and Language Processing,2008,16(8):1541-1550.
5WIELGAT R,SWIETOJANSKI P,POTEMPA T,et al.On using prefiltration in HMM-based bird species recognition[C]//Proceedings of the 2012 International Conference on Signals and Electronic Systems.Piscataway:IEEE Press,2012:1-5.
6JUANG C F,CHEN T M.Birdsong recognition using predictionbased recurrent neural fuzzy networks[J].Neurocomputing,2007,71(1/2/3):121-130.
7黄苏雨,梁声灼,黄苏园.语音增强方法综述[J].计算机与现代化,2007(3):16-20. 被引量：15
8KAMATH S,LOIZOU P.A multi-band spectral subtraction method for enhancing speech corrupted by colored noise[C]//Proceedings of the 2002 International Conference on Acoustics,Speech,and Signal Processing.Piscataway:IEEE Press,2002,4:4164.
9COHEN I,BERDUGO B.Noise estimation by minima controlled recursive averaging for robust speech enhancement[J].IEEE Signal Processing Letters,2002,9(1):12-15.
10李富强,万红,黄俊杰.基于MATLAB的语谱图显示与分析[J].微计算机信息,2005,21(10X):172-174. 被引量：27

二级参考文献41

1BOLL S F.Suppression of acoustics noise in speech using spectral subtraction[J].IEEE Transactions on Acoustics,Speech,and Signal Procession,1979,27(2):113-120.
2BEROUTI M,SCHWARTZ R,MAKHOUL J.Enhancement of speech corrupted by acoustic noise[C] //Proceeding of IEEE1979 ICASSP.[S.l.] :IEEE Press,1979,4:208-211.
3EPHRAIM Y,MALAH D.Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator[J].IEEE Trans.on Speech Signal Process.1984,ASSP-32(6):1109-1121.
4EPHRAIM Y,VAN-TREES H L.A signal suhspace approach for speech enhancement[J].IEEE Transactions on Speech and Audio Processing,1995,3(4):251-266.
5MEDIMA C A,ALCAIM A.Using neural networks wavelet denoising of speech for threshold selection[J].Electronics Letters,2003,37(25):1869-1871.
6MARTIN R.Noise power spectral density estimation based on optimal smoothing and minimum statics[J].IEEE Trans.on Speech Audio Process,2001,9(5):504-512.
7COHEN I.Noise estimation by minima controlled recursive averaging for robust speech enhancement[J].IEEE Trans.on Signal Process Letters,2002,9(1):12-15.
8COHEN I.Noise spectrum estimation in adverse environments:improved minima controlled recursive averageing[J].IEEE Trans.on Speech Audio Process,2003,11(5).466-475.
9RANGACHARI S,LOIZOU C.Noise-estimation algorithm for highly non-stationary environments[J].Speech Communication,2006,48:220-231.
10COHEN I.Speech enhancement using super-Gaussian speech models and noncausal a priori SNR estimation[J].Speech Communication,2005,47:336-350.

共引文献60

1吕坤朋,孙斌,赵玉晓.基于鸟鸣声及深度学习的鸟类识别方法研究[J].科技通报,2021,37(10):24-30. 被引量：5
2童强,黄剑,王永骥.浴室噪声环境下小词汇量语音识别系统研究[J].华中科技大学学报（自然科学版）,2011,39(S2):309-311.
3王凤瑛,张丽丽.功率谱估计及其MATLAB仿真[J].微计算机信息,2006,22(11S):287-289. 被引量：39
4林琴,张道信,吴小培.一种基于改进谱减法的语音去噪新方法[J].计算机技术与发展,2007,17(7):63-66. 被引量：17
5何莹,吴效明,岑人经,周静.基于高阶统计量的心音信号分析[J].微计算机信息,2007,23(02S):258-259. 被引量：11
6崔秀美.基于子空间语音增强方法的研究[J].数理医药学杂志,2008,21(3):265-267. 被引量：2
7张俊.基于谱减算法语音增强的研究[J].信息技术,2009,33(3):74-76. 被引量：9
8杨春风,张贵仓.语谱图在音频数字水印中的应用[J].科技信息,2009(5):14-14.
9陈莹莹,彭仕勇,高勇.莫尔斯报务信号的检测和识别[J].计算机应用与软件,2009,26(6):241-243. 被引量：7
10陈正宇,张燕,郑玮.基于内容的音频检索系统的前端抗噪技术[J].电子设计工程,2009,17(12):60-61.

同被引文献125

1刘浩,尹忠科,王建英.正交匹配跟踪(OMP)算法的收敛性研究[J].微计算机信息,2008,24(3):209-210. 被引量：7
2根据不同声音类型识别煤岩体地震冲量[J].煤矿安全,2008(10):10-10. 被引量：1
3李炜恒,王林生.声纹识别技术在金刚石压机顶锤防护中的应用[J].金刚石与磨料磨具工程,2013,33(3):71-74. 被引量：3
4王树才,任奕林,陈红,熊利荣,文友先.利用敲击声音信号进行禽蛋破损检测和模糊识别[J].农业工程学报,2004,20(4):130-133. 被引量：48
5李超,熊璋,孟岩,韩军.基于视听信息融合的智能监控系统[J].计算机工程与应用,2004,40(31):218-221. 被引量：3
6徐朴.内燃机故障声响信号时间序列模型诊断方法[J].中南林学院学报,1989,9(1):77-84. 被引量：1
7于水生.DSP芯片介绍及其选型[J].世界电子元器件,2006(1):56-60. 被引量：1
8马宁,高勇.直升机声信号的检测和识别[J].信息与电子工程,2006,4(3):165-169. 被引量：5
9倪宁,卢刚,卜佳俊.基于音频分析的视频场景检测[J].计算机仿真,2006,23(8):184-187. 被引量：3
10李超英,赵文阁,亓新华.温度、湿度、饲养密度、噪音对实验动物福利的影响[J].河南科技学院学报,2006,34(3):24-25. 被引量：20

引证文献7

1吕坤朋,孙斌,赵玉晓.基于鸟鸣声及深度学习的鸟类识别方法研究[J].科技通报,2021,37(10):24-30. 被引量：5
2李应,陈秋菊.基于优化的正交匹配追踪声音事件识别[J].电子与信息学报,2017,39(1):183-190. 被引量：8
3陈秋菊,李应.基于优化正交匹配追踪和深度置信网的声音识别[J].计算机应用,2017,37(2):505-511. 被引量：10
4董红松,刘振宇,马辉栋,闫静.语音增强在去除猪咳嗽噪声中的应用研究[J].山西农业大学学报（自然科学版）,2017,37(11):831-836. 被引量：2
5周映荷,刘琪,李天乐,刘龙申.基于SVM的蛋鸡叫声异常检测系统研究[J].中国农业文摘（农业工程）,2019,31(1):61-62. 被引量：3
6李伟,李硕.理解数字声音——基于一般音频/环境声的计算机听觉综述[J].复旦学报（自然科学版）,2019,58(3):269-313. 被引量：28
7陈秋菊,徐建国.优化正交匹配追踪和短时谱估计用于声音识别[J].计算机工程与应用,2020,56(7):162-169. 被引量：2

二级引证文献57

1陈子正,行鸿彦,王瑞,段儒杰.一种铁路隧道衬砌掉块声音检测方法[J].电子测量与仪器学报,2022,36(1):134-140. 被引量：2
2李卓凌,黄炳彬,刘畅,薛万来,刘可暄,王景仕.北京市密云水库流域智慧水生态管理系统建设构想[J].北京水务,2021(S02):47-50. 被引量：1
3章晓明,王扬.一体化仿真支撑软件PROSIMS[J].计算机仿真,2000,17(1):64-67. 被引量：16
4欧国建,蒋清平,秦长春.基于子空间的三阶多项式相位信号快速稀疏分解算法[J].电子与信息学报,2018,40(3):648-655. 被引量：1
5叶华,谭冠政,李广,刘晓琼,李晋,周聪,朱会杰.基于稀疏表示与粒子群优化算法的非平稳信号去噪研究[J].红外与激光工程,2018,47(7):318-325. 被引量：14
6邱东,刘德雨.基于模糊深度学习网络的行人检测方法[J].计算机技术与发展,2018,28(10):22-26. 被引量：1
7韦民.音乐表演声准校对平台的设计与实现[J].现代电子技术,2017,40(20):34-36.
8陈君.远程分布式数据库动态图像信息检索系统设计[J].计算机测量与控制,2018,26(3):150-152. 被引量：4
9郑皓,赵庶旭,屈睿涛.一种用于城市交通的优化声音识别仿真[J].计算机技术与发展,2019,29(2):60-64. 被引量：4
10杨静.基于HMM模型的多声部乐谱音符基频识别方法研究[J].科技通报,2019,35(11):109-112. 被引量：3

1陈壮叔.声音识别技术进入市场[J].现代化,1994(8):12-13.
2声音识别技术取得实际进展[J].江苏科技信息,1994,11(8):13-14.
3魏文岩.生物识别技术概况[J].电子与金系列工程信息,2001(4):12-14.
4刘鹏,李兴银,张华.自动识别技术及其在美军中的应用[J].科技信息,2013(2):310-310.
5会找人的机器人APriAlPha[J].科技展望（幻想大王）,2006(2):15-15.
6周晓敏,李应.基于小波矩和BP网络的声音识别[J].计算机工程与应用,2015,51(3):192-196. 被引量：6
7王伟,梁晓玲,张晋华.一种流媒体不良信息实时监控技术的研究与实现[J].科技创新导报,2013,10(3):35-35.
8王宪忠.前景光明的声音识别技术[J].海峡科技,2001(10):40-40.
9孔旭,关佶红.以声谱图相似度为度量的波形音乐检索[J].计算机工程与应用,2009,45(13):136-141. 被引量：7
10弓彦婷,程小雪,任洪梅,陈雁翔.声谱图显著性在音频识别中的应用[J].合肥工业大学学报（自然科学版）,2016,39(1):62-66. 被引量：4

计算机应用

2014年第5期

浏览历史

内容加载中请稍等...

基于Radon和平移不变性小波变换的鸟类声音识别被引量：7

参考文献16

二级参考文献41

共引文献60

同被引文献125

引证文献7

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于Radon和平移不变性小波变换的鸟类声音识别 被引量：7

参考文献16

二级参考文献41

共引文献60

同被引文献125

引证文献7

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于Radon和平移不变性小波变换的鸟类声音识别被引量：7