GMM-UBM和SVM在说话人识别中的应用被引量：7

Application of GMM-UBM and SVM in Speaker Recognition

下载PDF

导出

摘要针对说话识别领域短语音导致的训练数据不充分的问题,选择能够突出说话人个性特征的GMM-UBM作为基线系统模型,并引入SVM解决GMM-UBM导致的系统鲁棒性差的问题.选择不同的核函数对SVM的识别性能有较大的影响,针对多项式核函数泛化能力较强、学习能力较差与径向基核函数学习能力较强、泛化能力较差的特性,对两种单核核函数进行线性加权组合,以使组合核函数兼具各单核的优点.仿真实验结果表明,组合核函数SVM的识别率和等错误率明显优于不引入SVM的GMM-UBM的基线系统及其它三个单核函数,并在不同信噪比情况下也兼顾了系统识别准确率与鲁棒性. Aiming at the problem that training data is insufficient due to little training data in speaker recognition system, this paper adopts GMM-UBM as the background model which can identify the characteristics of the target speaker. And SVM is introduced to solve the problem of poor robustness of the system caused by GMM-UBM. It has much influence on SVM identification performance with different kernel functions. Aiming at the Characteristics of Polynomial kernel with good generalization ability and poor earning ability and Gaussian kernel with good earning ability and poor generalization ability, it structures a new combination kernel function which combines the advantages of each single kernel function by linear weighted method. The experimental results show that the recognition rate and Equal Error Rate of the combination kernel is more ideal than other kernel functions. And it achieves satisfactory recognition rate and robustness in the situations of different signal-to-noise ratio.

作者李荟赵云敏

机构地区东北石油大学计算机与信息技术学院大庆油田第一采油厂

出处《计算机系统应用》 2018年第1期225-230,共6页 Computer Systems & Applications

关键词说话人识别 GMM-UBM SVM 组合核函数 speaker recognition GMM-UBM SVM combination kernel function

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1鲍焕军,郑方.GMM-UBM和SVM说话人辨认系统及融合的分析[J].清华大学学报（自然科学版）,2008,48(S1):693-698. 被引量：9
2吕洪艳,刘芳.组合核函数SVM在说话人识别中的应用[J].计算机系统应用,2016,25(5):168-172. 被引量：3
3栗志意,张卫强,何亮,刘加.基于核函数的IVEC-SVM说话人识别系统研究[J].自动化学报,2014,40(4):780-784. 被引量：9

二级参考文献27

1Reynolds D A, Quatieri T F, Dunn R B. Speaker verification using adapted Gaussian mixture models. Digital Signal Processing, 2000, 10(1-3): 19-41.
2Kinnunen T, Li H Z. An overview of text-independent speaker recognition: from features to supervectors. Speech Communication, 2010, 52(1): 12-40.
3Campbell W M, Campbell J P, Reynolds D A, Singer E, Torres-Carrasquillo P A. Support vector machines for speaker and language recognition. Computer Speech and Language, 2006, 20(2-3): 210-229.
4Kenny P, Boulianne G, Ouellet P, Dumouchel P. Speaker and session variability in GMM-based speaker verification. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(4): 1448-1460.
5Kenny P, Boulianne G, Ouellet P, Dumouchel P. Joint factor analysis versus eigenchannels in speaker recognition. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(4): 1435-1447.
6Dehak N, Kenny P J, Dehak R, Dumouchel P, Ouellet P. Front-end factor analysis for speaker verification. IEEE Transactions on Audio, Speech, and Language Processing, 2011, 19(4): 788-798.
7Kenny P, Boulianne G, Dumouchel P. Eigenvoice modeling with sparse training data. IEEE Transactions on Speech and Audio Processing, 2005, 13(3): 345-354.
8Hatch A O, Kajarekar S S, Stolcke A. Within-class covariance normalization for SVM-based speaker recognition. In: Proceedings of the International Conference on Spoken Language. Pittsburgh, PA, 2006. 1471-1474.
9Bishop C M. Pattern Recognition and Machine Learning. Berlin: Springer, 2008.
10Cortes C, Vapnik V. Support-vector networks. Machine Learning, 1995, 20(3): 273-297.

共引文献18

1展领,景新幸.基于VQ-MAP和SVM融合的说话人识别系统[J].计算机工程与应用,2011,47(13):136-138. 被引量：5
2姚红,谭敏,郭武.音素层特征超矢量的说话人识别性能及优化[J].计算机工程与应用,2011,47(26):140-142.
3杨迪,戚银城,刘明军,张华芳子,武军娜.说话人识别综述[J].电子科技,2012,25(6):162-165. 被引量：5
4李鉴,李杰.基于临界小波参数和新序列核支持向量机的说话人识别[J].信阳师范学院学报（自然科学版）,2012,25(3):398-401. 被引量：1
5丁聪敏,唐建,郭立.基于WCCN和余弦评分的话者确认研究[J].中国科学技术大学学报,2012,42(10):813-819.
6赵小蕾,邝晓滨.基于说话人及语音识别协同决策点名系统设计[J].信息安全与技术,2015,6(4):93-96. 被引量：3
7罗元,孙龙.一种新的鲁棒声纹特征提取与融合方法[J].计算机科学,2016,43(8):297-299. 被引量：1
8张峰,陈华伟,李妍文.基于多核最小二乘支持向量回归的TDOA-DOA映射方法[J].数据采集与处理,2017,32(3):540-549. 被引量：6
9吕金锐.一种改进的支持向量机参数寻优方法[J].计算机与数字工程,2017,45(7):1318-1322. 被引量：2
10吴文昭.基于GMM聚类的鲁棒性i向量说话人确认[J].工业仪表与自动化装置,2017(4):55-59.

同被引文献57

1刘红星,戴蓓蒨,陆伟.基于共振峰谐波能量的语音端点检测[J].清华大学学报（自然科学版）,2008,48(S1):754-759. 被引量：11
2庞程,李晓飞,刘宏.基于MFCC与基频特征贡献度识别说话人性别[J].华中科技大学学报（自然科学版）,2013,41(S1):108-111. 被引量：8
3牛军峰,余刚,韩文亚.应用遗传算法建立云杉针叶表面PCDD/Fs光解半衰期的预测模型[J].环境科学,2005,26(2):28-33. 被引量：10
4牛军峰,余刚,刘希涛.水相中POPs光化学降解研究进展[J].化学进展,2005,17(5):938-948. 被引量：20
5王蕾,刘新会,侯娟,崔保山.电性拓扑态指数预测PCDFs光解半衰期[J].化学学报,2007,65(3):184-190. 被引量：13
6肖汉光,何为.基于MFCC和SVM的说话人性别识别[J].重庆大学学报（自然科学版）,2009,32(7):770-774. 被引量：4
7李美萍,张生万,胡永钢,王增巧.分子电性距离矢量用于多氯代二苯并呋喃光解半衰期的QSPR研究[J].生态毒理学报,2010,5(2):208-214. 被引量：8
8曹洁,李伟.基于多特征融合的目标跟踪算法[J].兰州理工大学学报,2011,37(2):80-84. 被引量：15
9刘树深,刘堰,李志良,蔡绍皙.一个新的分子电性距离矢量(MEDV)[J].化学学报,2000,58(11):1353-1357. 被引量：94
10杜晓青,于凤芹.基于HHT倒谱系数的说话人识别算法[J].计算机工程与应用,2014,50(3):198-202. 被引量：4

引证文献7

1贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：5
2项扬,殷锋,袁平.基于x-vector嵌入与BLSOM模型的声纹聚类系统[J].现代计算机,2020,26(9):3-7. 被引量：1
3于海英,李美萍,郝俊生.基于MLP-ANN和SVM方法的多氯代二苯并呋喃光解半衰期QSPR比较研究[J].生态毒理学报,2020,15(4):240-247. 被引量：1
4来能烨.考虑情感强度的加权社会网络偏好信息识别研究[J].智能计算机与应用,2020,10(11):169-173. 被引量：1
5何建军.基于GMM的说话人识别系统研究及其MATLAB实现[J].软件导刊,2021,20(8):49-57. 被引量：4
6邱晨,孙成楠,张琪,葛煦.基于语音特征的说话人性别智能识别方法研究[J].自动化与仪器仪表,2021(8):235-238. 被引量：1
7何建军.安卓平台说话人识别系统的实现[J].中国新通信,2021,23(16):7-11.

二级引证文献13

1张明键,张悦.基于语谱图HOG特征的两步法长沙话说话人识别[J].信息技术与信息化,2020(8):188-192. 被引量：1
2张明键,张悦.基于语谱图和深度置信网络的方言自动辨识与说话人识别[J].电子技术与软件工程,2020(14):151-154. 被引量：1
3乐妍.基于人工神经网络无监督聚类方法的青少年体质综合评价模型研究[J].江苏科技信息,2020,37(33):76-79.
4王芷悦,崔琳.基于非线性堆叠双向网络的端到端声纹识别[J].计算机与现代化,2022(3):13-17.
5贾嘉敏,潘文林.基于改进Inception-ResNet_v2的低资源少数民族语音识别[J].软件导刊,2022,21(8):51-55. 被引量：2
6汪兰兰,蔡昌新.基于改进线性预测基音频率的语音情感识别系统[J].科学技术与工程,2022,22(26):11524-11532. 被引量：3
7黄卫东,程小香.基于微博平台的舆情参与主体情感强度研究[J].计算机技术与发展,2022,32(11):140-145. 被引量：1
8徐军莉.基于眼动和脑电的疲劳特征的性别差异[J].电脑知识与技术,2023,19(9):9-12.
9廖玉婷,饶火瑜,乐长高,徐珍珍.基于分子边邻接指数的多氯代二苯并呋喃光解半衰期QSPR研究[J].化学研究与应用,2023,35(7):1549-1555.
10马志举,杜庆治,龙华,邵玉斌.基于改进语谱图的深度学习说话人识别[J].现代电子技术,2023,46(21):32-38. 被引量：1

1杜朋,戴加飞,李锦,王俊,侯凤贞.非线性格兰杰因果关系在睡眠生理信号分析中的应用[J].数据采集与处理,2017,32(5):1044-1051.
2张广群,李英杰,汪杭军.基于词袋模型的林业业务图像分类[J].浙江农林大学学报,2017,34(5):791-797. 被引量：6
3张立亭,徐志宽,罗亦泳.基于灰色关联和相关向量机的隧道地表沉降预测[J].大地测量与地球动力学,2017,37(10):1033-1037. 被引量：4
4高靖凯,林荣文.永磁同步电机AEKF无磁链直接转矩控制[J].电气开关,2017,55(6):69-75.
5潘泽锴,周晓芳.加入PSO算法在蔗糖结晶模糊控制中的应用[J].计算机测量与控制,2017,25(12):83-85. 被引量：1
6王桂荣,张士尉,丁莉芬,董学良.局部任务坐标系下的轮廓运动控制研究[J].煤矿机械,2017,38(12):44-46.
7钟成,李林升,丁鹏.基于色差与梯度特征的冰糖橙图像自动分割[J].科技风,2018(1):26-27. 被引量：1
8张园林,李晓峰,黄飞虎.基于二度冗余网络的人脸识别[J].计算机应用,2017,37(A02):160-162.
9刘畅,张一珂,张鹏远,颜永红.基于改进主题分布特征的神经网络语言模型[J].电子与信息学报,2018,40(1):219-225. 被引量：10
10杨朝辉,苏群,陈志辉,白俊武,钱新强.苏州太湖三山岛国家湿地公园景观健康评价[J].湿地科学,2017,15(5):657-664. 被引量：19

计算机系统应用

2018年第1期

浏览历史

内容加载中请稍等...

GMM-UBM和SVM在说话人识别中的应用被引量：7

参考文献3

二级参考文献27

共引文献18

同被引文献57

引证文献7

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

GMM-UBM和SVM在说话人识别中的应用 被引量：7

参考文献3

二级参考文献27

共引文献18

同被引文献57

引证文献7

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

GMM-UBM和SVM在说话人识别中的应用被引量：7