基于i-vector局部加权线性判别分析的说话人识别被引量：6

I-vector based speaker recognition using local weighted linear discriminant analysis

下载PDF

导出

摘要基于i-vector的说话人识别系统通常采用LDA来消除训练和测试语音之间信道失配,不能保证样本在待识别语音近邻区域内具有最佳的分离度,这就使得目标说话人和其近邻间的得分差异较小,进而导致识别准确性下降。针对该问题,提出基于i-vector局部加权线性判别分析的说话人识别方法(LWLDA)。在计算类内和类间散度时,增加待识别语音近邻样本权重。在此基础上,通过提高待识别语音近邻域局部类间的分辨能力,尽可能减少因信道差异而产生的识别错误。在不同语音库上的实验结果表明:LWLDA在复杂信道环境下能够保持良好的鲁棒性;在交叉信道条件下的识别准确率比LDA平均提高3.6%。 Linear discriminant analysis（ LDA） is often employed to eliminate the channel mismatch between training and testing speeches in identity vector（ i-vector） based speaker recognition systems,which can not provide optimum separation of the samples in the near region of the utterance to be identified. In particular,there is small score difference between the target speaker and corresponding near neighbors,which results in the degradation of recognition accuracy. Aiming at this problem,the i-vector based speaker recognition method with local weighted linear discriminant analysis（ LWLDA） is proposed. In the calculation of inter-class scatter and intra-class scatter,we increase the weights of the samples near the utterance to be identified; based on which,through enhancing the local inter-class discrimination ability in the near region of the utterance to be identified,the recognition errors caused by channel difference are reduced as much as possible. The experiments on different speech databases were conducted. The results demonstrate that,the LWLDA achieves good robustness under complex channel noise environment,and the recognition accuracy ratio is increased by 3. 6% under cross channel conditions compared with that of LDA method.

作者王明合唐振民张二华

机构地区南京理工大学计算机科学与工程学院

出处《仪器仪表学报》 EI CAS CSCD 北大核心 2015年第12期2842-2848,共7页 Chinese Journal of Scientific Instrument

基金国家自然科学基金(61473154)项目资助

关键词语音处理说话人识别身份认证向量局部加权线性判别分析 speech processing speaker recognition identity vector（i-vector） local weighted linear discriminant analysis（LWLDA）

分类号 TN912.34 [电子电信—通信与信息系统] TH693.4 [机械工程—机械制造及自动化]

引文网络
相关文献

参考文献19

1KINNUNEN T, LI H ZH. An overview of text-independent speaker recognition: From features to super-vectors [ J ]. Speech Communication, 2010, 52( 1 ) : 12- 40.
2LIU Shuang,MENG Jiayuan,ZHAO Xin,YANG Jiajia,HE Feng,QI Hongzhi,ZHOU Peng,HU Yong,MING Dong.Cross-task emotion recognition using EEG measures: first step towards practical application[J].Instrumentation,2014,1(3):17-24. 被引量：2
3许良凤,李艳秋,胡敏,刘盛中,王晓华.基于I-DCV的人脸识别方法[J].电子测量与仪器学报,2015,29(1):106-110. 被引量：8
4毕雪芹,苏艳娟,王琪.嵌入式指纹识别系统的设计及试验研究[J].国外电子测量技术,2015,34(2):50-53. 被引量：22
5邱政权,范小春,王俊年.基于维纳滤波和混合模型的说话人识别[J].仪器仪表学报,2009,30(7):1436-1440. 被引量：5
6GONZALEZ-RODRIGUEZ J. Evaluating automatic speaker recognition systems: An overview of the NIST speaker recognition evaluations ( 1996-2014 ) [ J ]. Lo- quens, 2014, 1 ( 1 ) : 1-15.
7KHOURY E, VESNICER B, FRANCO-PEDROSO J, et al. The 2013 speaker recognition evaluation in mobile en- vironment[ C ]. Proceedings of IAPR International Con- ference on Biometrics (ICB), 2013: 1-8.
8KENNY P, BOULIANNE G, OUELLET P, et al. Joint factor analysis versus eigenchannels in speaker recogni- tion[J]. IEEE Transactions on Audio, Speech and Lan- guage Processing, 2007, 15(4) : 1435-1447.
9DEHAK N, KENNY P, DEHAK R, et al. Front-end factor analysis for speaker verification [ J ]. IEEE Trans-actions on Audio, Speech, and Language Processing, 2011, 19(4) : 788-798.
10MCLAREN M, LEEUWEN D V. Source normalised and weighted LDA for robust speaker recognition u- sing i-veetors[ C ]. IEEE International Conferenee on Acoustics Speech and Signal Processing (ICASSP) , 2011:5456 -5459.

二级参考文献117

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2樊桂花,唐斌.基于小波变换的语音基音周期鲁棒性检测[J].信号处理,2004,20(4):365-368. 被引量：8
3李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
4张玲华,郑宝玉,杨震.基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用[J].电子与信息学报,2006,28(10):1786-1789. 被引量：3
5韩丁,沈保锁.一种有效的语音变调算法[J].电子测量技术,2006,29(5):55-56. 被引量：3
6HERMANSKY H, MORGAN N. RASTA processing of speech [ J ] . Speech and Audio Processing, IEEE Transactions on, 2, Issue 4, Oct. 1994,2(s) :578-589.
7DE LIMA C B, DA SILVA D G, ALCAIM A, et al. Jr. AR-vector using CMS for robust text independent speaker verification [ J ]. Digital Signal Processing, 2002. DSP 2002. 2002 14th International Conference on. Volume 2,1-3 July 2002,2 ( s ) : 1073-1076.
8KOSAKA T, YAMAMOTO H, YAMADA M, et al. In- stantaneous environment adaptation techniques based on fast PMC and MAP-CMS methods [ A ]. Acoustics, Speech, and Signal Processing, 1998. Proceedings of the 1998 IEEE International Conference on [ C ], Volume 2, 12-15 May 1998,2(s) :789-792.
9DING G H, LI CH R, BO X,et al. Comparison of MLLR and CDCN for speech recognition in additive noise by experiments [ J ]. ISCSL P. , 2002.
10DU L M, HOU Z Q. Determination of the instants of glottal closure from speech wave using wavelet transform [ J ]. Chinese Journal of Electronics, 1996,5 ( 2 ) :70-75.

共引文献88

1刘元,匡文凯,苏盛,李彬.基于双通道能量差的环网柜局放信号消噪方法[J].仪器仪表学报,2021,42(2):218-227. 被引量：5
2邱政权,范小春,王俊年.基于动态环境下的说话人识别[J].科学技术与工程,2010,10(2):498-500.
3安冬,荣超群,杨丹,王骄.基于PSOA聚类和KMP算法的说话人识别方法[J].仪器仪表学报,2013,34(6):1306-1311. 被引量：8
4酆勇,李宓,李子明.文本无关的说话人识别研究[J].数字通信,2013,40(4):48-52. 被引量：1
5栗志意,张卫强,何亮,刘加.基于核函数的IVEC-SVM说话人识别系统研究[J].自动化学报,2014,40(4):780-784. 被引量：9
6栗志意,张卫强,何亮,刘加.基于总体变化子空间自适应的i-vector说话人识别系统研究[J].自动化学报,2014,40(8):1836-1840. 被引量：17
7储岳中,徐波,高有涛,邰伟鹏.基于近邻传播聚类与核匹配追踪的遥感图像目标识别方法[J].电子与信息学报,2014,36(12):2923-2928. 被引量：8
8邢玉娟,潘颖,曹晓丽.改进i-向量说话人识别算法研究[J].科学技术与工程,2014,22(34):224-228. 被引量：2
9桑海峰,武红娇,何大阔.手形、掌纹和掌静脉多特征融合识别[J].仪器仪表学报,2015,36(6):1356-1362. 被引量：13
10王金甲,薛芳,李慧.基于稀疏组lasso的脑机接口通道和特征选择研究[J].仪器仪表学报,2015,36(8):1831-1837. 被引量：8

同被引文献23

1高士杰.维吾尔语和田方言的主要特点[J].中央民族大学学报（哲学社会科学版）,1984,11(2):69-77. 被引量：5
2时秀娟.汉语方言元音格局的系统性表现[J].方言,2006(4):323-331. 被引量：20
3杨阳,陈永明.声纹识别技术及其应用[J].电声技术,2007,31(2):45-46. 被引量：22
4俞一彪,袁冬梅,薛峰.一种适于说话人识别的非线性频率尺度变换[J].声学学报,2008,33(5):450-455. 被引量：12
5郭武,李轶杰,戴礼荣,王仁华.说话人识别中的因子分析以及空间拼接[J].自动化学报,2009,35(9):1193-1198. 被引量：14
6黄程韦,赵艳,金赟,于寅骅,赵力.实用语音情感的特征分析与识别的研究[J].电子与信息学报,2011,33(1):112-116. 被引量：33
7栗志意,何亮,张卫强,刘加.基于鉴别性i-vector局部距离保持映射的说话人识别[J].清华大学学报（自然科学版）,2012,52(5):598-601. 被引量：11
8项要杰,杨俊安,李晋徽,陆俊.一种适用于说话人识别的改进Mel滤波器[J].计算机工程,2013,39(11):214-217. 被引量：8
9韩文静,李海峰,阮华斌,马琳.语音情感识别研究进展综述[J].软件学报,2014,25(1):37-50. 被引量：163
10许云飞,周若华,颜永红.基于PLDA的多信道多语音说话人确认研究[J].网络新媒体技术,2014,3(1):13-19. 被引量：3

引证文献6

1李湾湾,范承志,祁才君.基于改进MFD的I-Vector说话人识别[J].电声技术,2016,40(12):43-48. 被引量：1
2刘恒,吴迪,苏家仪,杨春勇,侯金.运用高斯混合模型识别动物声音情绪[J].国外电子测量技术,2016,35(11):82-87. 被引量：6
3茅正冲,王俊俊,黄舒伟.基于PLDA信道补偿的说话人识别算法[J].计算机与数字工程,2019,47(11):2757-2762. 被引量：2
4孙杰,吾守尔·斯拉木,热依曼·吐尔逊,张晶晶.维吾尔语方言识别及相关声学分析[J].声学学报,2019,44(6):1083-1092. 被引量：3
5SUN Jie,WUSHOUER Silamu,REYIMAN Turson,ZHANG Jingjing.Acoustic analysis of the vowel system in Hotan dialect and its contribution to dialect recognition of Uyghur dialects[J].Chinese Journal of Acoustics,2020,39(1):117-132.
6景维鹏,肖庆欣,罗辉.基于概率球面判别分析的说话人识别信道补偿算法[J].计算机应用,2024,44(2):556-562.

二级引证文献11

1赵其杰,柯震南,陶靖,卢建霞.基于密度-距离的t混合模型流式数据聚类[J].仪器仪表学报,2017,38(9):2130-2137. 被引量：7
2张铁民,黄俊端.基于音频特征和模糊神经网络的禽流感病鸡检测[J].农业工程学报,2019,35(2):168-174. 被引量：13
3李强伟,马妙琳,茆建昱,王梦芝,Dominique Blache.动物性情特性分类及性情判别方法的研究进展[J].中国畜牧杂志,2019,55(2):21-26. 被引量：2
4孙杰,王宏,吾守尔·斯拉木.结合注意力机制和因果卷积网络的维吾尔语方言识别[J].声学技术,2020,39(6):697-703. 被引量：3
5苏学军,谢存祥,于文龙.基于STM32的语音声纹识别系统设计[J].电子测量技术,2020,43(24):1-5. 被引量：4
6刘立勋,郑嘉仪,卢曼妮,陈焯鹏.智能宠物项圈设计[J].电子测试,2021,32(16):25-26. 被引量：2
7罗家诚.基于改进信道补偿的I-vector说话人识别[J].电子设计工程,2021,29(20):96-100. 被引量：1
8徐凡,杨剑峰,颜为之,王明文.基于自注意力的端到端方言语音识别模型[J].信号处理,2021,37(10):1860-1871. 被引量：4
9郝焕香.基于深度学习的方言语音识别模型构建[J].自动化与仪器仪表,2022(4):48-51. 被引量：3
10景维鹏,肖庆欣,罗辉.基于概率球面判别分析的说话人识别信道补偿算法[J].计算机应用,2024,44(2):556-562.

1董秀洁,王莉,王素菊.一种改进的LS信道估计算法[J].哈尔滨理工大学学报,2009,14(1):47-50. 被引量：6
2王怡,王艳温,王克家.一种具有校正信道失配功能的二维DOA估计方法[J].弹箭与制导学报,2005,25(SD):956-958.
3李全力,肖先赐.空间谱估计测向系统信道失配的单信号源校正方法[J].电子学报,1991,19(2):123-125. 被引量：13
4陈成钢,王晓勇.一种3Gpp改进型IA-AKA方案的应用研究[J].电脑知识与技术（过刊）,2012,18(7X):4811-4815.
5王甲池.GPS信道不一致性对数字波束形成算法性能影响的研究[J].舰船电子工程,2009,29(2):67-69.
6XU Longting,YANG Zhen,SUN Linhui.Simplification of I-Vector Extraction for Speaker Identification[J].Chinese Journal of Electronics,2016,25(6):1121-1126. 被引量：4
7李亚琦,黄浩.语音识别中基于i-vector的说话人归一化研究[J].现代计算机（中旬刊）,2014(5):3-7. 被引量：1
8衣云峰.波动信号处理的中心值图解法[J].数据采集与处理,1989,4(2):27-37. 被引量：1
9李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
10马平,黄浩,程露红,杨萌萌.基于i-vector说话人识别算法中训练时长研究[J].现代电子技术,2016,39(14):1-3. 被引量：2

仪器仪表学报

2015年第12期

浏览历史

内容加载中请稍等...

基于i-vector局部加权线性判别分析的说话人识别被引量：6

参考文献19

二级参考文献117

共引文献88

同被引文献23

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于i-vector局部加权线性判别分析的说话人识别 被引量：6

参考文献19

二级参考文献117

共引文献88

同被引文献23

引证文献6

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于i-vector局部加权线性判别分析的说话人识别被引量：6