基于小波变换的鲁棒型特征提取及说话人识别被引量：7

A robust feature-extraction method based on wavelet transform for text-independent speaker identification

下载PDF

导出

摘要说话人识别系统在实际应用中面临的主要困难之一是鲁棒性问题,干净语音环境下识别率很高的说话人识别系统,在有噪语音环境下识别性能显著降低。解决这一问题的方法之一是寻找具有鲁棒性的特征参数。本文结合具有多分辨率分析特点的小波变换技术,提出一种基于小波变换的鲁棒型特征提取算法,以提高说话人识别系统在噪声环境下的识别性能。对40个说话人的语音库SUDA2002-D2,在加性高斯白噪声环境下进行的识别实验结果表明,本文提出的特征提取算法可以有效地提高说话人识别系统在噪声环境下的识别性能。 One of difficulties in application of speaker recognition system is robust problem. A speaker recognition system with high performance in relatively clean environment will become deficient with unacceptable recognition performance in noisy environment. One method to solve this problem is to detect robust features against noises. In this paper, a new robust feature-extraction algorithm based on wavelet transform is proposed. Benefit from its multi-resolution analysis abilities, the cepstrum features detected from several different time-frequency channels are integrated with a statistical entropy values. Experiments on SUDA2002-D2 Chinese speech corpus show that the proposed algorithm is quite efficient for speaker identification in noisy environment.

作者芮贤义俞一彪

机构地区苏州大学电子信息学院

出处《电路与系统学报》 CSCD 北大核心 2005年第5期129-132,共4页 Journal of Circuits and Systems

关键词说话人识别鲁棒型特征小波变换矢量量化 speaker identification robust features wavelet transform vector quantization

分类号 TN912.3 [电子电信—通信与信息系统] TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Wong L, et al. Text-dependent speaker verification under noisy conditions parallel model combination [A]. ICASSP [C]. 2001, 1: 457-460.
2徐义芳,张金杰,姚开盛,曹志刚,王勇前.语音增强用于抗噪声语音识别[J].清华大学学报（自然科学版）,2001,41(1):41-44. 被引量：15
3Hermansky H. Perceptual linear predictive (PLP) analysis of speech [J]. Journal of Acoust. Am., 1990, 87(4): 1738-1752.
4Ching-Tang HSIEH, Regular Member, WANG You-Chuang. A Robust Speaker Identification System Based on Wavelet Transform [J]. IEICE Trans. Inf. & Syst., 2001, E84-D(7).
5赵铮,侯伯亨.基于小波变换说话人识别技术的研究[J].西安电子科技大学学报,2000,27(4):437-441. 被引量：16
6Huang X, A Acero, Hon H. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development [M]. Prentice Hall, 2001.
7俞一彪,王朔中.基于互信息匹配模型的说话人识别[J].声学学报,2004,29(5):462-466. 被引量：8
8许允喜俞一彪.基于GMM的汉语说话人识别特性分析[J].通信技术,2004,(5).

二级参考文献13

1俞一彪,赵鹤鸣,周旭东.运用互信息匹配及关键词分析的语音对话系统[J].小型微型计算机系统,2003,24(1):147-150. 被引量：4
2曹志刚,郑文涛.基于短时谱最小均方误差估计的语音增强和剩余噪声衰减[J].电子学报,1993,21(4):7-12. 被引量：7
3程俊,张璞,戴善荣,易克初.小波变换用于信号突变的检测[J].通信学报,1995,16(3):96-104. 被引量：36
4程正兴（译），小波分析导论，1995年
5杨行峻，语音信号数据处理，1995年
6Young S J，http://svrwwwengcamacuk，1997年，72页
7Young S J，http://svrwwwengcamacuk，1989年
8岳喜才,伍晓宇,郑崇勋.用神经阵列网络进行文本无关的说话人识别[J].声学学报,2000,25(3):230-234. 被引量：14
9俞一彪,赵鹤鸣,周旭东.语音识别浏览器VoiceIE设计与实现[J].数据采集与处理,2002,17(1):95-99. 被引量：6
10侯风雷,王炳锡.基于支持向量机的说话人辨认研究[J].通信学报,2002,23(6):61-67. 被引量：17

共引文献37

1魏臻,张景达,陆阳.嵌入式系统中语音增强改进算法的研究[J].仪器仪表学报,2007,28(S1):282-286.
2丁沛,曹志刚.基于语音增强失真补偿的抗噪声语音识别技术[J].中文信息学报,2004,18(5):64-69. 被引量：3
3武妍,金明曦,王洪波.基于KL-小波包分析的文本无关的说话人识别[J].计算机工程与应用,2005,41(4):26-28. 被引量：6
4勾轶,刘晓丽,陈长征.基于小波与神经网络的说话人身份识别[J].沈阳工业大学学报,2005,27(1):87-90.
5芮贤义,俞一彪.采用遗传算法的VQ码本设计及说话人识别[J].信号处理,2005,21(3):289-292. 被引量：2
6张海英,赵军,潘永湘.一种基于小波变换的混叠语音基音提取方法[J].西安理工大学学报,2005,21(2):200-203.
7YUYibiao,WANGShuozhong.Speaker identification based on complete feature corpus and evaluation of mutual information[J].Chinese Journal of Acoustics,2005,24(3):280-288. 被引量：1
8邱政权,尹俊勋.针对说话人识别进行的加权小波去噪方法[J].电声技术,2005,29(9):53-56. 被引量：3
9俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
10王化兵.2006中国电子书产业年会聚焦“转型”[J].出版参考,2006(05X):10-10.

同被引文献41

1武妍,金明曦,王洪波.基于KL-小波包分析的文本无关的说话人识别[J].计算机工程与应用,2005,41(4):26-28. 被引量：6
2邱政权,尹俊勋.针对说话人识别进行的加权小波去噪方法[J].电声技术,2005,29(9):53-56. 被引量：3
3俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
4包永强,赵力,邹采荣.采用归一化补偿变换的与文本无关的说话人识别[J].声学学报,2006,31(1):55-60. 被引量：13
5刘雅琴,裘雪红.应用小波包变换提取说话人识别的特征参数[J].计算机工程与应用,2006,42(9):67-69. 被引量：15
6白莹,赵振东,戚银城,王斌,郭建勇.基于小波神经网络的与文本无关说话人识别方法研究[J].电子与信息学报,2006,28(6):1036-1039. 被引量：7
7张玲华,郑宝玉,杨震.基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用[J].电子与信息学报,2006,28(10):1786-1789. 被引量：3
8芮贤义,俞一彪.噪声环境下说话人识别的组合特征提取方法[J].信号处理,2006,22(5):673-677. 被引量：12
9You Kuo-hwei, Wang Hsiao-chuan. Robust features for noisy speech recognition based on temporal trajectory filtering of short-time autocorrelation sequences. Speech Communication, 1999,28 : 13-24.
10Hsieh C T, Lai E, Wang Y C. Robust speech features based on wavelet transform with application to speaker identification. IEEE Proc.-Vis. Image Signal Process, 2002, 149 (2) : 108-144.

引证文献7

1邱政权,尹俊勋,杨俊.用于说话人辨认的新的语音去噪方法[J].声学与电子工程,2006(3):31-33.
2俞一彪,袁冬梅,薛峰.一种适于说话人识别的非线性频率尺度变换[J].声学学报,2008,33(5):450-455. 被引量：12
3刘雪燕,张娜,袁宝玲.说话人识别综述[J].电脑知识与技术,2009,5(1):169-171. 被引量：3
4YU Yibiao YUAN Dongmei XUE Feng.A non-linear frequency transform and its application to speaker recognition[J].Chinese Journal of Acoustics,2009,28(3):280-288. 被引量：1
5薛峰,俞一彪.倒谱域特征分量置信度分析及说话人识别应用[J].信号处理,2010,26(1):127-131. 被引量：4
6阎福智.语音信号处理中特征提取方法研究[J].中国新通信,2013,15(21):127-128. 被引量：1
7项要杰,杨俊安,李晋徽,杨瑞国.关联小波神经网络与高斯混合模型说话人识别[J].探测与控制学报,2013,35(6):65-70. 被引量：1

二级引证文献22

1薛峰,俞一彪.倒谱域特征分量置信度分析及说话人识别应用[J].信号处理,2010,26(1):127-131. 被引量：4
2李燕萍,唐振民,丁辉,张燕.一种适于说话人辨认的自适应频率尺度变换[J].南京理工大学学报,2010,34(2):182-186. 被引量：2
3卢小春,尹俊勋,王修信.基于听觉模型特征的与文本无关说话人识别系统[J].广西师范大学学报（自然科学版）,2010,28(2):22-26. 被引量：2
4郭春霞.说话人识别算法的研究[J].西安邮电学院学报,2010,15(5):104-106. 被引量：5
5杨顺辽,林峰,刘焕升,陈玉炎.改进加权线性预测倒谱的复合参数说话人识别[J].计算机应用与软件,2011,28(2):242-245.
6刘辉,杨俊安,周志增.听觉模型倒谱系数及其在声目标识别中的应用[J].应用科学学报,2011,29(1):51-55. 被引量：1
7姜涛,韩纪庆,郑铁然.基于高斯混合模型移动因子补偿的说话人识别方法[J].声学学报,2011,36(6):658-664. 被引量：2
8王志锋,贺前华,李艳雄.录音设备的建模和识别算法[J].信号处理,2013,29(4):419-428. 被引量：6
9曹文明,王耀南.基于音频识别的无人值守变电站设备在线监测[J].湖南大学学报（自然科学版）,2013,40(9):48-55. 被引量：12
10项要杰,杨俊安,李晋徽,陆俊.一种适用于说话人识别的改进Mel滤波器[J].计算机工程,2013,39(11):214-217. 被引量：8

1张学震.半导体激光泵浦高功率棒型Nd：YAG激光器[J].激光集锦,2002,12(4):16-22.
2王科平,张志刚,王福忠.一种非线性系统的鲁棒型预测控制算法[J].河南理工大学学报（自然科学版）,2007,26(3):307-310.
3刘斌,席裕庚.一种基于状态估计的鲁棒型预测控制器[J].控制与决策,2012,27(10):1531-1536.
4芮贤义,俞一彪.噪声环境下说话人识别的组合特征提取方法[J].信号处理,2006,22(5):673-677. 被引量：12
5温淑焕,王科平.基于Elman网络的鲁棒型广义预测控制方法研究[J].系统工程学报,2004,19(5):503-506. 被引量：2
6刘俊清,耿新清.基于小波变换的鲁棒型多水印算法研究[J].沈阳工程学院学报（自然科学版）,2011,7(2):168-170.
7李凤沼.一种鲁棒型阵列处理器设计中的坐标变换[J].天津理工学院学报,1994,10(2):62-67.
8Abe,Y,朱晓红.应用与声学／语音环境有关的音素样板的动态...[J].南邮科技译丛,1991(2):60-66.
9文学志,袁淮,刘威,赵宏.一种改进的小波特征提取算法及其应用[J].小型微型计算机系统,2009,30(2):336-340. 被引量：5
10孙瑾,顾宏斌,秦小麟,周娜.一种鲁棒型Hausdorff距离图像匹配方法[J].中国图象图形学报,2008,13(4):761-767. 被引量：13

电路与系统学报

2005年第5期

浏览历史

内容加载中请稍等...

基于小波变换的鲁棒型特征提取及说话人识别被引量：7

参考文献8

二级参考文献13

共引文献37

同被引文献41

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于小波变换的鲁棒型特征提取及说话人识别 被引量：7

参考文献8

二级参考文献13

共引文献37

同被引文献41

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于小波变换的鲁棒型特征提取及说话人识别被引量：7