干扰空间投影在本征音说话人自适应中的应用

APPLICATION OF NUISANCE SPACE PROJECTION IN EIGENVOICE SPEAKER ADAPTATION

下载PDF

导出

摘要本征音自适应是一种快速高效的自适应算法,它被广泛应用到说话人识别中,但由于同一个说话人的本征音自适应的说话人因子之间的信道特征和噪声存在差异,导致了算法的识别精度降低。针对这一问题,提出基于干扰空间投影的本征音说话人识别(EV-NSP)算法。将训练语音通过主成分分析(PCA)方法计算得到干扰投影矩阵;将投影矩阵应用到生成本征音矢量算法中;利用最大似然估计算法自适应地得到说话人因子的估计值。实验结果表明,EV-NSP算法相对于传统的本征音自适应算法识别性能有了较大的提高。 However, Eigenvoice adaption is a fast and efficient adaptive algorithm which is widely used the speaker factor of eigenvoice adaption from the same speaker has different channel c in speaker recognition. haracteristies and noise feature, thus reduced the recognition accuracy. To solve this problem, we propose an eigenvoice speaker recognition algorithm based on nuisance space projection （EV-NSP）. We calculated the nuisance space projection matrix by principal component analyzing training data, and then run the eigenvoice vector algorithm by using projection matrix. The maximum likelihood estimation algorithm was used to adaptively estimate the speaker factor. Experimental results indicate that EV-NSP algorithm have better performance compared with traditional adaptive eigenvoice algorithm.

作者刘建航杨喜鹏李世宝陈海华黄庭培

机构地区中国石油大学(华东)计算机与通信工程学院

出处《计算机应用与软件》 2017年第11期188-191,263,共5页 Computer Applications and Software

基金国家自然科学基金青年基金项目(61601519 61402433) 山东省自然科学基金项目(ZR2014FM017) 青岛市科技创新计划项目(15-9-80-jch)

关键词本征音自适应干扰空间投影主成分分析信道失配 Eigenvoice adaption Nuance space projection PCA Channel mismatch

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献7

1张文林,张连海,牛铜,屈丹,李弼程.基于正则化的本征音说话人自适应方法[J].自动化学报,2012,38(12):1950-1957. 被引量：9
2潘镭,郭武,李轶杰,戴礼荣.基于本征音因子分析的短时说话人识别[J].数据采集与处理,2009,24(4):449-452. 被引量：3
3屈丹,杨绪魁,张文林.特征空间本征音说话人自适应[J].自动化学报,2015,41(7):1244-1252. 被引量：4
4张庆芳,赵鹤鸣,龚呈卉.基于因子分析和特征映射的耳语说话人识别[J].数据采集与处理,2016,31(2):362-369. 被引量：3
5齐耀辉,潘复平,葛凤培,颜永红.鉴别性最大后验概率线性回归说话人自适应研究[J].北京理工大学学报,2015,35(9):946-950. 被引量：2
6李虎生,刘加,刘润生.语音识别说话人自适应研究现状及发展趋势[J].电子学报,2003,31(1):103-108. 被引量：32
7郭武,戴礼荣,王仁华.采用主成分分析的特征映射[J].自动化学报,2008,34(8):876-879. 被引量：8

二级参考文献58

1LIN Wei YANG Lili XU Boling.A new frequency scale of Chinese whispered speech in the application of speaker identification[J].Progress in Natural Science:Materials International,2006,16(10):1072-1078. 被引量：5
2张昊天.[D].北京:清华大学电子工程系,2000.
3Reynolds D A, Quatieri T F, Dunn R B. Speaker verification using adapted Gaussian mixture models. Digital Signal Processing, 2000, 10(1): 19-41
4Campbell W M, Sturim D E, Reynolds D A. Support vector machines using GMM supervectors for speaker verification. IEEE Signal Processing Letters, 2006, 13(5): 308-311
5Campbell W M, Sturim D E, Reynolds D A, Solomonoff A. SVM based speaker verification using a GMM supervector kernel and NAP variability compensation. In: Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Toulouse, France: IEEE, 2006. 97-100
6Deng J, Zheng T F, Wu W H. Session variability subspace projection based model compensation for speaker verificatio. In: Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington D. C., USA: IEEE, 2007. 47-50
7Reynolds D A. Channel robust speaker verification via feature mapping. In: Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Hong Kong, China: IEEE, 2003. 53-56
8Matejka P, Burget L, Schwarz P, Glembek O, Karafiat M, Grezl F. STBU system for the NIST 2006 speaker recognition evaluation. In: Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington D. C., USA: IEEE, 2007. 221-224
9NIST. The NIST year 2006 speaker recognition evaluation plan [Online], available: http://www.nist.gov/speech/tests/ spk/2006/sre-06-evalplan-v9.pdf, February, 2007
10Lamel L, Rabiner L, Rosenberq A, Wilpon J. An improved endpoint detector for isolated word recognition. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1981, 29(4): 777-785

共引文献53

1杨吉斌,邢艳玲,曹铁勇,张雄伟.基于Mellin变换和Mel频率分析的非特定人语音识别特征研究[J].模式识别与人工智能,2005,18(3):350-353. 被引量：2
2李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
3蔡铁,朱杰.基于支持说话人权重的快速说话人自适应算法[J].上海交通大学学报,2005,39(12):1997-2001.
4徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
5黄盈椿,王欢良,冯涛.应用MAP方差估计的话者自适应训练方法[J].计算机工程,2006,32(20):203-204.
6倪建克,曾虹,张翔.基于最大均值似然判决规则的说话人辨认研究[J].杭州电子科技大学学报（自然科学版）,2006,26(5):96-99.
7申朝文,何家峰,蔡继祖.说话人识别技术的方法与展望[J].中国科技信息,2007(4):269-270.
8朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
9武永星,郑海,周波,杨常青,李茂林.基于距离和相关性准则的混合参数说话人识别[J].系统仿真学报,2008,20(4):926-930.
10雷建军,杨震,刘刚,郭军.噪声鲁棒语音识别研究综述[J].计算机应用研究,2009,26(4):1210-1216. 被引量：13

1胡振兴,彭勇,罗晓康.山区光伏组件间距的通用简化算法[J].四川电力技术,2017,40(5):84-86.
2杨建斌,张卫强,刘加.深度神经网络自适应中基于身份认证向量的归一化方法[J].中国科学院大学学报（中英文）,2017,34(5):633-639. 被引量：6
3陈汉武,李文骞,刘志昊,赵生妹.完全图上结构异常的搜索算法——融入量子计算思维的经典算法探讨[J].东南大学学报（自然科学版）,2017,47(5):866-872. 被引量：1
4李静.基于递归图理论的舰船辐射噪声的特征量分析[J].舰船科学技术,2017,39(18):34-36. 被引量：1
5范雪,杨鸿波,李永.基于深度学习的人脸图像扭正算法[J].信息通信,2017,30(7):5-9. 被引量：1
6李伟,李开宇.基于特征提取矩阵的稀疏系数求解算法[J].电子测量技术,2017,40(9):146-150. 被引量：3
7周毅波,龚小蓉,于锋.MiR-150调控Nanog对鼻咽癌侧群细胞增殖、侵袭的影响[J].山东大学耳鼻喉眼学报,2017,31(5):79-84. 被引量：1
8孟祥成.基于eNSP的二层VLAN虚拟仿真实验[J].实验室研究与探索,2017,36(9):102-106. 被引量：15
9姜楠,靳换,李逸,陈艳红,周磊.猪繁殖与呼吸综合征病毒非结构蛋白nsp11结构与功能[J].中国兽医杂志,2017,53(8):59-62. 被引量：1

计算机应用与软件

2017年第11期

浏览历史

内容加载中请稍等...

干扰空间投影在本征音说话人自适应中的应用

参考文献7

二级参考文献58

共引文献53

相关作者

相关机构

相关主题

浏览历史