新型MFCC和波动模型相结合的二层环境声音识别被引量：2

Two-layer environmental sounds recognition based on new MFCC and fluctuation pat-tern

下载PDF

导出

摘要对生态环境中各种不同的声音进行快速准确的识别有重要的现实意义,但是因其具有较高背景噪声加大了识别的难度。提出一种具有良好抗噪能力和较高识别性能的两层音频识别技术。选择经过改进的新型的MFCC参数以及波动模型作为生态环境声音的特征集合。利用这种新型的MFCC系数构造音频信号的高斯分布模型,并且计算未知音频信号与样本音频信号的高斯分布模型之间的Kullback-Leibler距离,随后计算它们的波动模型之间的欧几里德距离。根据计算出的Kullback-Leibler距离和欧几里德距离实现两层音频识别系统。实验结果表明两层音频识别技术即使在噪声的影响下也能保持较高的识别率。 There are many kinds of sounds in the eco-environment and it is significant to recognize them quickly and accurately,but the recognition difficulty is greatly increased because of the background noise.Therefore,this paper presents a two-layer recognition technology which has good anti-noise ability and high recognition performance.Two kinds of features which are new improved MFCC and fluctuation pattern are selected as feature sets of the eco-environmental sound.The new MFCC parameters are used to construct single Gaussian distribution model and then the Kullback-Leibler distance between the unknown signal＇s Gaussian and the sample signal＇s Gaussian is measured and subsequently Euclidean distance between the sample signal＇s fluctuation pattern and the unknown signal＇s is calculated.The calculated Kullback-Leibler distance and the Euclidean distance can be used to achieve a two-layer system for environmental sound recognition.Experimental results show that the two-layer recognition technology can maintain a high recognition rate even under the influence of noise.

作者李勇李应余清清

机构地区福州大学数学与计算机科学学院

出处《计算机工程与应用》 CSCD 北大核心 2011年第30期132-135,139,共5页 Computer Engineering and Applications

基金国家自然科学基金No.61075022 福建省教育厅A类科技项目(No.JA09021)~~

关键词生态环境声音识别改进的Mel频率倒谱参数波动模型 Kullback-Leibler距离 eco-environment sound recognition improved Mel-scaled Cepstrum Coefficients（MFCC） fluctuation pattern Kullback-Leibler distance

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献11

1Nakamura S,Kumatani K, Tamura S.Multi-modal temporal asyn- chronicity modeling by product HMMs for robust audio-visual speech recognition[C]//Proceedings of the 4th IEEE Internation- al Conference on Multimodal Interfaces,2002: 305-309.
2Pan Wenjuan, Yao Yong, Liu Zhijing, et al.Audio classification in a weighted SVM[C]//Intemational Symposium on Communica- tions and Information Technologies,2007:468-472.
3Chandmkala 'S, Sekhar C C.Model based clustering of audio clips using Ganssian mixture models[C]//Seventh International Confer- ence on Advances in Pattern Recognition,2009:47-50.
4Freeman G,Dony R D,Areibi S M.Audio environment classica- tion for heating aids using artificial neural networks with win- dowed input[C]//Computational Intelligence in Image and Signal Processing, 2007: 183-188.
5Chu Selina,Narayanan S.Environmental sound recognition usingMP-based features[C]/flEEE International Conference on Acouties, Speech and Signal Processing(ICASSP 2008),2008.
6Yeganeh FI,Ahadi S M, Ziaei A.A new MFCC improvement method for robust ASR[C]//9th International Conference on Sig- nal Processing,2008.
7Zwicker E, Fastl H.Psychoaeoustics, facts and models[M].2ed. Berlin: Springer, 1999.
8L Lidy T,Rauber A.Evaluation of feature extractors and psycho-acous- tic transformations[C]//Proceedings of the 6th International Con- ference on Music InformationRetrieval (ISMIR' 05 ), 2005 : 34-41.
9Pampalk E.Audio-based music ing a spectral similarity model similarity and retrieval: combin- with information extracted from fluctuation pattems[C]//IT,AIST, 1-1-1 Umezono,Tsukuba,Ibara- ki 305-8568, Japan,2006.
10Penny W D.Kullback-Liebler divergences of normal,gamma, Dirichlet and Wishart densities[R].Wellcome Department of Cog- nitive Neurology,2001.

同被引文献14

1罗茜,王鸿斌,张真,孔祥波.基于MFCC与神经网络的小蠹声音种类自动鉴别[J].北京林业大学学报,2011,33(5):81-85. 被引量：9
2韦丽兴,张淼,钟映春,韩光.采用PCNN的有噪特定人语音识别系统[J].计算机工程与应用,2012,48(3):133-136. 被引量：2
3单煜翔,邓妍,刘加.一种联合语种识别的新型大词汇量连续语音识别算法[J].自动化学报,2012,38(3):366-374. 被引量：10
4姜莹,俞一彪.基于语音结构化模型的数字语音识别[J].计算机工程与设计,2012,33(4):1482-1485. 被引量：3
5宋志章,马丽,刘省非,李奇楠.混合语音识别模型的设计与仿真研究[J].计算机仿真,2012,29(5):152-155. 被引量：5
6马仲海.多噪声环境下声音的身份鉴定技术研究与仿真[J].计算机仿真,2012,29(5):396-399. 被引量：1
7竺乐庆,张真.基于MFCC和GMM的昆虫声音自动识别[J].昆虫学报,2012,55(4):466-471. 被引量：16
8周阿转,俞一彪.采用特征空间随机映射的鲁棒性语音识别[J].计算机应用,2012,32(7):2070-2073. 被引量：5
9曹洁,余丽珍.基于MFCC和运动强度聚类初始化的多说话人识别[J].计算机应用研究,2012,29(9):3295-3298. 被引量：10
10周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1736

引证文献2

1田莎莎,唐菀,佘纬.改进MFCC参数在非特定人语音识别中的研究[J].科技通报,2013,29(3):139-142. 被引量：15
2戴本尧.使用原始音频波形的超深层环境声音识别卷积网络[J].电脑知识与技术,2019,15(3Z):130-132.

二级引证文献15

1杜文龙.一种提高语音特征参数稳健性MLMCC算法的研究[J].智能计算机与应用,2014,4(4):94-96.
2张建英,刘学航,冯翔.园林生态古镇遥感图像特征信息灰阶量化分析[J].科技通报,2014,30(8):212-214. 被引量：1
3华斌,张丽超,赵富强.基于加权MFCC的音频检索[J].计算机工程与应用,2015,51(8):200-204. 被引量：8
4邹东伯,刘海,赵亮,康迎杰.分布式光纤振动传感信号识别的研究[J].激光技术,2016,40(1):86-89. 被引量：28
5宣传忠,马彦华,武佩,张丽娜,郝敏,张曦宇.基于声信号特征加权的设施养殖羊行为分类识别[J].农业工程学报,2016,32(19):195-202. 被引量：19
6王丰华,王邵菁,陈颂,袁国刚,张君.基于改进MFCC和VQ的变压器声纹识别模型[J].中国电机工程学报,2017,37(5):1535-1542. 被引量：84
7刘利波,张文明.基于智能蚁群算法的移动机器人轨迹规划[J].机械与电子,2017,35(11):62-64. 被引量：2
8胡耀文,龙华,孙俊,周涛,邵玉斌.基于音频特征的乐器分类研究[J].软件导刊,2018,17(6):17-21. 被引量：3
9张文宇,刘畅.卷积神经网络算法在语音识别中的应用[J].信息技术,2018,42(10):147-152. 被引量：15
10蒋晓永,杨涛.基于变步长LMS和SVM的电能表内异物声音识别[J].传感器与微系统,2019,38(2):143-146. 被引量：6

1陈芳炯,梁剑,韦岗.超宽带系统中同步和信道参数的闭式估计算法[J].电路与系统学报,2010,15(1):1-4.
2冯登国,肖国镇.布尔函数的线性结构的特征[J].电子科学学刊,1995,17(3):324-328. 被引量：2
3何思颖.水,大自然的演奏家[J].小学生导刊（中年级版）,2015,0(6):39-39.
4孙文清,门汝静.IMS:在不断质疑中前进[J].现代电信科技,2008,38(4):31-36.
5龙艳花,郭武,戴礼荣.用于SVM说话者确认系统的序列核[J].清华大学学报（自然科学版）,2008,48(S1):688-692. 被引量：1
6于丽萍,邢立新.射极耦合型数字分频器输出信号的相位波动研究[J].哈尔滨商业大学学报（自然科学版）,1998,14(4):39-43.
7王鹏辉,杜兰,刘宏伟,李彦兵,吴兆平.雷达高分辨距离像分帧新方法[J].西安电子科技大学学报,2011,38(6):22-29. 被引量：7
8杜舟.RIM中国区酝酿新变改善娱乐化体验对抗苹果[J].IT时代周刊,2010(24):66-67.
9米瑞琪,周振国.基于12阶割圆序列具有三级自相关性的伪随机密钥流研究[J].信息与电脑,2016,28(7):75-76.
10唐道济.音响里的误区[J].高保真音响,2010(10):87-89.

计算机工程与应用

2011年第30期

浏览历史

内容加载中请稍等...

新型MFCC和波动模型相结合的二层环境声音识别被引量：2

参考文献11

同被引文献14

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

新型MFCC和波动模型相结合的二层环境声音识别 被引量：2

参考文献11

同被引文献14

引证文献2

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

新型MFCC和波动模型相结合的二层环境声音识别被引量：2