基于CASA的噪声环境下的话者辨认

CASA-based Speaker Identification in Specific Noisy Environment

下载PDF

导出

摘要传统的说话人识别系统在噪声环境下的识别率较低.基于计算听觉场景分析得到的二值掩码可以对噪声占主导部分进行重建,从而将与说话人相关的被破坏的信息重建起来.但是重建的效果受到该帧中可靠帧的比例的影响.因此,根据提取的二值掩码来设定阈值,从而对测试特征的帧进行选取,将测试特征的帧划分为三类,分别用于重建、保留和丢弃.最终使用重建后的帧和保留的帧进行后续处理,并用于识别过程.实验结果表明,相较于原来的重建系统,该算法的识别率有了一定的提高. Conventional sperker recognition system perform pooly under noisy conditions. The extracted Binary Mask based on Computational auditory scene analysis can reconstruct the noise dominanted part of the speech, so that the information which is related to the speaker and destroyed can be rebuilt. However, the result is affected by the ratio of the reliable of the frame. Therefore, this paper set a threshold based on the extracted binary mask and use the threadshold to select frames. The frame is divided into three respectively, for reconstruction, retain and discard. The reconstructed and the retained frame will be used to identification. Experimental results show that compared to the original reconstruction system, the recognition rate of the algorithm has been improved.

作者李冬冬唐建李然军李辉

机构地区中国科学技术大学电子科学与技术系语音信息处理实验室

出处《小型微型计算机系统》 CSCD 北大核心 2016年第5期1107-1111,共5页 Journal of Chinese Computer Systems

关键词计算听觉场景分析 Gammatone频率倒谱系数(GFCC) 理想二值掩码(IBM) 阈值 computational auditory sense analysis （ CASA ） gammatone frequency cepstral coefficient （ GFCC ） ideal binary mask （IBM） threshold

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1王雨,林家骏,袁文浩,陈宁.基于计算听觉场景分析的改进清音分离方法[J].华东理工大学学报（自然科学版）,2014,40(2):212-217. 被引量：3
2王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28

二级参考文献26

1赵鹤鸣,葛良,陈雪勤,俞一彪.基于声音定位和听觉掩蔽效应的语音分离研究[J].电子学报,2005,33(1):158-160. 被引量：16
2S Furui. Digital Speech Processing, Synthesis, and Recognition [ M]. New York: Marcel Dekker, 2001.
3H Gish, M Schmidt. Text-independent speaker identification [ J]. IEEE Signal Proc, 1994,11 (4): 18 - 32.
4D A Reynolds, et al. The SuperSID project: Exploiting high- level information for high-accuracy speaker recognition [ A ]. International Conference on Acoustics, Speech, and Signal Processing[ C]. Hong Kong, China: IEEE, 2003.4:784 - 787.
5A Drygajlo,M El-Maliki. Speaker verification in noisy environments with combined spectral subtraction and missing feature theory [ A ]. IEEE International Conference on Acoustics, Speech, and Signal Processing[ C]. Seattle, USA: IEEE, 1998. 1 : 121 - 124.
6SHAO Y, WANG D L. Robust speaker recognition using binary time-frequency masks [ A ]. IEEE International Conference on Acoustics,Speech,and Signal Processing[ C]. Toulouse: IEEE, 2006.1:645-648.
7Z Wanfeng, Y Yingchun, W Zhaohui, S Lifeng. Experimental evaluation of a new speaker identification framework using PCA[ A]. IEEE. International Conference on Systems, Man and Cybernetics[C]. Washington, DC: IEEE., 2003.4147 - 4152.
8WU Xihong. A Chinese Speech Database for Speaker Recognition[ EB/OL]. http://nlpr-web. ia. ac. cn/englisb_/irds/chinese / sinobiometrics- pdf/wuxihong.pdf, 2002.
9D A Reynolds, R C Rose. Robust text-independent speaker identification using Gaussian mixture speaker models[ J].Proc IEEE. Trans Speech Audio Process, 1995,3 ( 1 ) : 72 - 83.
10YOUNG S, EVERMANN G, GALES M, et al. The HTK Book[ M]. Cambridge: Cambridge University, 2006.

共引文献29

1何朝霞,潘平.基于听觉模型的说话人语音特征提取[J].微型机与应用,2012,31(1):37-39. 被引量：2
2王磊,彭圆,林正青,蒋行海,牟林,张凤珍.听觉外周计算模型在水中目标分类识别中的应用[J].电子学报,2012,40(1):199-203. 被引量：21
3黄山奇,张连海,屈丹.一种基于人耳听觉感知和子带补偿滤波的鲁棒语言辨识特征参数提取算法[J].模式识别与人工智能,2012,25(1):166-171. 被引量：2
4胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：29
5颜鑫,李应.利用抗噪幂归一化倒谱系数的鸟类声音识别[J].电子学报,2013,41(2):295-300. 被引量：17
6林琳,陈虹,陈建.基于鲁棒听觉特征的说话人识别[J].电子学报,2013,41(3):619-624. 被引量：10
7罗元,陈君,张毅.基于伽马啁啾滤波器组的听觉特征提取算法[J].信息与控制,2013,42(5):589-594. 被引量：2
8茅正冲,王正创,龚熙.一种低信噪比下的说话人识别算法研究[J].计算机应用与软件,2014,31(12):218-220. 被引量：3
9茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
10茅正冲,王正创,黄芳.基于GFCC与RLS的说话人识别抗噪系统研究[J].计算机工程与应用,2015,51(10):215-218. 被引量：5

1茅正冲,王正创,黄芳.基于GFCC与RLS的说话人识别抗噪系统研究[J].计算机工程与应用,2015,51(10):215-218. 被引量：5
2茅正冲,王正创,王丹.基于Gammatone滤波器组的说话人识别算法研究[J].计算机工程与应用,2015,51(1):200-203. 被引量：9
3张永亮,张先庭,鲁宇明.基于FMFCC和HMM的说话人识别[J].计算机仿真,2010,27(5):352-354. 被引量：8
4王瑞,王康晏,冯玉田,张海燕,金彦亮,张有正.复杂场景下声频传感器网络核稀疏表示车辆识别[J].西安电子科技大学学报,2015,42(4):114-120. 被引量：7
5刘文举,聂帅,梁山,张学良.基于深度学习语音分离技术的研究现状与进展[J].自动化学报,2016,42(6):819-833. 被引量：69
6邱伟,黄秀轩.计算听觉场景分析介绍[J].高技术通讯,2002,12(1):106-110. 被引量：1
7王想实,刘培林.计算听觉场景的算法研究[J].电脑与电信,2010(1):41-43.
8屈俊玲,李鸿燕.基于计算听觉场景分析的混合语音信号分离算法研究[J].计算机应用研究,2014,31(12):3822-3824. 被引量：6
9吴姚振,杨益新,田丰,杨龙,陶灿.基于Gammatone频率离散小波系数的水下目标鲁棒识别[J].西北工业大学学报,2014,32(6):906-911. 被引量：6
10袁霞,赵向阳.基于MEL频率倒谱系数技术的音控汽车天窗的研究设计[J].河南机电高等专科学校学报,2015,23(2):13-14.

小型微型计算机系统

2016年第5期

浏览历史

内容加载中请稍等...

基于CASA的噪声环境下的话者辨认

参考文献2

二级参考文献26

共引文献29

相关作者

相关机构

相关主题

浏览历史