高斯序列核支持向量机用于说话人识别被引量：5

Gaussian sequence kernel support vector machine for speaker recognition

下载PDF

导出

摘要说话人识别问题具有重要的理论价值和深远的实用意义,在研究支持向量机核方法理论的基础上,将其与传统高斯混合模型(GMM)相结合构建成基于高斯序列核的支持向量机(SVM)。SVM的灵活性和强大分类能力主要在于可以根据要处理的问题来相应的选取核函数。在识别的过程中引入特征空间归正技术NAP(Nuisance Attribute Projection)对同一说话人在不同信道和环境所带来的特征差异进行弥补。用美国国家标准与技术研究所(NIST)2004年评测数据集进行实验,结果表明该方法可以大幅度提高识别率。 Speaker recognition problems have important theoretical value and farreaching practical significance.On the basis of the support vector machine kernel methods,this paper combines it with traditional Gaussian Mixture Mode（lGMM） to build into a new support vector machine based on Gaussian sequence kernel.Much of the flexibility and classification power of SVM resides in the choice of kernel.And in the process of identifying,it introduces feature space norm technology performed by Nuisance Attribute Projection（NAP） to compensate the feature difference in different channels and environment from the same speaker.It is tested on the National Institute of Standards and Technology（NIST） 2004 evaluation database.Experiments results show that this method can greatly improve the recognition rate.

作者李杰刘贺平

机构地区北京科技大学信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第18期183-185,共3页 Computer Engineering and Applications

关键词支持向量机高斯线性核高斯非线性核 NAP技术说话人识别 support vector machine Gaussian linear kernel Gaussian non-linear kernel Nuisance Attribute Projection（NAP） speak-er recognition

分类号 TP912 [自动化与计算机技术]

引文网络
相关文献

参考文献6

1Fine S,Navratil J,Gopinath R A.A hybrid GMM/SVM approach to speaker identification[C]//Proc ICASSP,2001:417-420.
2Sturim D E,Reynolds D A,Singer E,et al.Speaker indexing in large audio databases using anchor models[C]//Proceedings of ICASSP, 2001 : 429-432.
3Solomonoff A,Campbell W,Boardman I.Advances in channel compensation for SVM speaker recognition[C]//ICASSP, 2005,1:629-632.
4Campbell W M.Generalized linear discriminant sequence kernels for speaker recognition[C]//Proceedings of ICASSP, 2002 : 161-164.
5Moreno P,Ho P,Vasconcelos N.A generative model based kernel for SVM classification in multimedia applications[C]//NIPS,2003.
6Kenny P,Dumouchel P.Experiments in speaker verification using factor analysis likelihood ratios[C]//Odyssey, 2004:219-226.

同被引文献47

1鲍焕军,郑方.GMM-UBM和SVM说话人辨认系统及融合的分析[J].清华大学学报（自然科学版）,2008,48(S1):693-698. 被引量：9
2程俊,张璞,戴善荣,易克初.小波变换用于信号突变的检测[J].通信学报,1995,16(3):96-104. 被引量：36
3奉国和,李拥军,朱思铭.边界邻近支持向量机[J].计算机应用研究,2006,23(4):11-12. 被引量：7
4王波,徐毅琼,李弼程.基于SVM的多分类器融合算法在说话人识别中的应用[J].计算机工程与设计,2007,28(12):2909-2910. 被引量：5
5邓菁.电话信道下多说话人识别研究[D].北京:清华大学,2007.
6Wooters C, Ftmg J, Peskin B, et al.Towards robust speaker seg- mentation: The ICSI-SRI fall 2004 diarization system[C]//Proc of Fall 2004 Rich Transcription Workshop,New York,Palisades, 2004:315-320.
7Anguera X, Wooters C, Peskin B, et al.Robust speaker segmentation for meetings: The ICSI-SRI spring 2005 diarization system[J].Machine Learning for Multimodal Interaction,2006,3869:402-414.
8Anguera X, Wooters C, Pardo J M.Robust speaker diarization for meetings:ICSI RT06s evaluation system[J].Lecture Notes in Computer Science,2006,4299 : 346-358.
9Wooters C, Huijbregts M.The ICSI RT07s speaker diarization system[J].Multimodal Technologies for Perception of Humans, 2008,4625 : 509-519.
10Carletta J,Ashby S,Bourban S,et al.The AMI meeting corpus: A preannouncement[C]//Proc of the Workshop on Machine Learning for Multimodal Interaction(MLMI), Edinburgh,2005 : 325-336.

引证文献5

1曹洁,潘鹏.基于GMM的说话人识别技术研究[J].计算机工程与应用,2011,47(11):114-117. 被引量：6
2刘晋胜.采用熵相关性优化分离性的SVM说话人识别[J].计算机工程与设计,2011,32(8):2845-2848.
3李鉴,李杰.基于临界小波参数和新序列核支持向量机的说话人识别[J].信阳师范学院学报（自然科学版）,2012,25(3):398-401. 被引量：1
4邢玉娟,谭萍.基于稀疏表示分类的说话人识别算法及其在智能考勤系统中的应用[J].工业仪表与自动化装置,2016(2):84-87. 被引量：1
5吴文昭.基于i向量的SVM说话人确认[J].兰州文理学院学报（自然科学版）,2016,30(3):53-55.

二级引证文献8

1王晨旸,李新华.基于双正交小波变换的彩色图像水印嵌入算法[J].安徽大学学报（自然科学版）,2013,37(6):65-71. 被引量：4
2李强,彭益武.基于FPGA的GMM说话人辨认系统[J].广东交通职业技术学院学报,2014,13(2):42-46.
3冉国敬,夏秀渝,张凤仪.信道失配环境下鲁棒说话人识别[J].计算机系统应用,2015,24(3):235-240. 被引量：2
4张凤仪,夏秀渝,冉国敬,何礼,叶于林.多声源环境下的鲁棒说话人识别[J].计算机系统应用,2015,24(4):32-37. 被引量：1
5王波,钟映春,陈俊彬.融合AP和GMM的说话人识别方法研究[J].广东工业大学学报,2015,32(4):145-149. 被引量：1
6王涛,王国中,朱林林.一种基于声纹识别的智能门锁系统设计与实现[J].电子测量技术,2019,42(3):107-111. 被引量：8
7于波,张涛.人工智能技术在企业信息化中的应用[J].信息与电脑,2018,30(15):134-135. 被引量：1
8Nan Jiang,Ting Liu.Research on Voiceprint Recognition of Camouflage Voice Based on Deep Belief Network[J].International Journal of Automation and computing,2021,18(6):947-962. 被引量：4

1陈雪如,杨成梧.随机2D离散系统的统计特性[J].南京理工大学学报,2000,24(4):359-363. 被引量：1
2祁清华.NAP技术的前世今生[J].软件世界,2008(6):89-90.
3邸兰振,赵友军,刘曙光.一种新的基于图像内容的量化盲水印算法[J].计算机应用,2005,25(B12):100-101.
4ProCurve Networking完美融合Microsoft NAP技术，进一步加强网络安全[J].微电脑世界,2008(6):163-163.
5刘运杰,周立俭,李俊伟.一种基于DCT数字水印新算法[J].电脑知识与技术（过刊）,2011,17(9X):6494-6496. 被引量：2
6何军辉,唐韶华,邢宜博.基于变步长量化的安全图像隐写[J].计算机科学,2009,36(7):56-59. 被引量：1
7宁宁.终于靠谱 GTX950显卡导购[J].电脑爱好者,2016,0(4):90-91.
8丁汉吉,何蕾,阮树骅.AES算法研究及实现分析[J].网络安全技术与应用,2007(11):80-81. 被引量：15
9武风波,汪峰.基于HVS的小波变换数字图像水印算法[J].应用光学,2014,35(2):254-259. 被引量：14
10陈江,彭新光.网络访问控制技术的分析与比较[J].电脑开发与应用,2011,24(5):6-8.

计算机工程与应用

2010年第18期

浏览历史

内容加载中请稍等...

高斯序列核支持向量机用于说话人识别被引量：5

参考文献6

同被引文献47

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

高斯序列核支持向量机用于说话人识别 被引量：5

参考文献6

同被引文献47

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

高斯序列核支持向量机用于说话人识别被引量：5