基于PLDA的多信道多语音说话人确认研究被引量：3

PLDA for Speaker Verification under Multi-Channel and Multi-Record

下载PDF

导出

摘要在NIST SRE 2012年评测和实际应用中,可以用说话人的多个语音样本来注册说话人模型,并且这些语音样本取自于各种各样的信道。本文基于PLDA,尝试了多种打分方法,并提出一种新的得分规整技术,在NIST SRE 2012核心测试集上,EER平均提升26.0%,MinCost平均提升12.4%。 In NIST SRE 2012 evaluation and practical applications,multiple recordings,which come from various channel conditions, can be used to train a speaker model. Based on PLDA,this paper will try several score methods and propose one score normalization technique. Equal error rate and minimum cost has been relatively improved 26. 0% and 12. 4% respectively on NIST SRE 2012 core test corpus.

作者许云飞周若华颜永红

机构地区中国科学院语言声学与内容理解重点实验室

出处《网络新媒体技术》 2014年第1期13-19,共7页 Network New Media Technology

基金国家自然科学基金(批准号:10925419 90920302 61072124 11074275 11161140319 91120001 61271426) 中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究编号:XDA06030100 XDA06030500) 国家863计划(资助号:2012AA012503) 中科院重点部署项目(编号:KGZD-EW-103-2)经费资助

关键词说话人识别 PLDA 多语音得分规整 speaker recognition PLDA multi-record score normalization

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献14

1N Dehak,P Kenny,R Dehak. Front-End Factor Analysis For Speaker Verification[J].IEEE Transactions on Audio Speech and Language Processing,2011,(04):788-798.
2P Kenny. Bayesian speaker verification with heavy tailed Priors[A].Brno,Czech Rebublic,2010.
3N Brummer. EM for Probabilistic LDA[OL].https://sites.google.com/site/nikobrummer,2010.
4M Senoussaoui,P Kenny,N Brummer. Mixture of PLDA models in i-vector space for gender independent speaker recognition[A].Florence,Italy,2011.
5P Matejka,O Glembek,F Castaldo. Full-covariance UBM and heavy-tailed PLDA in i-vector speaker verification[A].Prague,Czech Republic,2011.4536-4539.
6L Burget,O Plchot,S Cumani. Discriminatively trained probabilistic linear discriminant analysis for speaker verification[A].Prague,Czech Republic,2011.4832-4835.
7N Dehak,R Dehak,J Glass. Cosine similarity scoring without score normalization techniques[A].Brno,Czech Rebublic,2010.
8S Cumani,N Brummer,L Burget. Fast discriminative speaker verification in the i-vector space[A].Prague,Czech Republic,2011.4852-4855.
9J Villalba,N Brummer. Towards fully Bayesian speaker recognition:Integrating out the between speaker covariance[A].Florence,Italy,2011.
10T Stafylakis,P Kenny,M M Senoussaoui. Preliminary investigation of Boltzmann machine classifiers for speaker recognition[A].Biopolis,Singapore,2012.

同被引文献9

1杨阳,陈永明.声纹识别技术及其应用[J].电声技术,2007,31(2):45-46. 被引量：22
2郭武,李轶杰,戴礼荣,王仁华.说话人识别中的因子分析以及空间拼接[J].自动化学报,2009,35(9):1193-1198. 被引量：14
3栗志意,何亮,张卫强,刘加.基于鉴别性i-vector局部距离保持映射的说话人识别[J].清华大学学报（自然科学版）,2012,52(5):598-601. 被引量：11
4周国鑫,高勇.基于GMM-UBM模型的说话人辨识研究[J].无线电工程,2014,44(12):14-17. 被引量：5
5邢玉娟,潘颖,曹晓丽.改进i-向量说话人识别算法研究[J].科学技术与工程,2014,22(34):224-228. 被引量：2
6李琳,万丽虹,洪青阳,张君,李明.基于概率修正PLDA的说话人识别系统[J].天津大学学报（自然科学与工程技术版）,2015,48(8):692-696. 被引量：4
7洪新海,宋彦,蒋兵,戴礼荣.采用DBN的TV改进方法在语种识别中的应用[J].信号处理,2015,31(9):1152-1158. 被引量：4
8王明合,唐振民,张二华.基于i-vector局部加权线性判别分析的说话人识别[J].仪器仪表学报,2015,36(12):2842-2848. 被引量：6
9刘婷,刘晓洁,岳未然.基于主成分分析法的入侵检测特征选择方法[J].网络新媒体技术,2017,6(2):28-32. 被引量：6

引证文献3

1张涛涛,陈丽萍,戴礼荣.说话人确认中以音素为中心的特征端因子分析[J].信号处理,2016,32(10):1213-1219. 被引量：1
2李湾湾,范承志,祁才君.基于改进MFD的I-Vector说话人识别[J].电声技术,2016,40(12):43-48. 被引量：1
3王文超,黎塔.基于多时间尺度的深层说话人特征提取研究[J].网络新媒体技术,2019,8(5):21-26. 被引量：2

二级引证文献4

1李永,范雪,杨鸿波.声谱图在汉语普通话声调识别中的应用[J].信息通信,2017,30(7):89-92. 被引量：4
2白曦龙.基于深度学习神经网络的声纹识别方法[J].信息与电脑,2021,33(4):153-155. 被引量：1
3罗家诚.基于改进信道补偿的I-vector说话人识别[J].电子设计工程,2021,29(20):96-100. 被引量：1
4陈志高,李鹏,肖润秋,黎塔,王文超.文本无关说话人识别的一种多尺度特征提取方法[J].电子与信息学报,2021,43(11):3266-3271. 被引量：5

1郭武,李轶杰,戴礼荣,王仁华.采用非监督得分规整和因子分析的说话人确认[J].电子学报,2009,37(4):776-779. 被引量：1
2邢安昊,黎塔,颜永红.利用二重打分方法的激活词语音识别[J].声学技术,2013,32(S1):211-212.
3李战明,林娟,陈若珠.组合特征和二级判断模型相结合的说话人识别[J].计算机工程与应用,2011,47(10):180-182. 被引量：3
4李燕萍,丁辉,唐振民.EMD-Tnorm得分规整策略在说话人确认中的应用[J].中国工程科学,2010,12(2):95-100. 被引量：1
5Shao Caojie Lu Rongchun Yu Deyang Cai Xiaohong.Status of Internal Target at CSRe[J].IMP & HIRFL Annual Report,2011(1):189-189.
6李鹏,屈丹.语音查询项检索中的两阶段得分规整方法[J].模式识别与人工智能,2016,29(3):216-222.
7陈觉之,张贵荣,周宇欢.一种基于SVDD模型的说话人确认方法研究[J].计算机与现代化,2013(4):5-9.
8孙锦华,金力军.用于流星突发通信系统的RLS分数间隔均衡器[J].通信技术,2003,36(8):7-8. 被引量：2
9马红星,王海坤,刘聪.命令词语音识别系统的置信度改进方法[J].计算机与现代化,2011(10):146-149. 被引量：1
10凌波微步.B＆W CM系列全新旗舰CM10落地式音箱[J].视听前线,2013(11):2-6.

网络新媒体技术

2014年第1期

浏览历史

内容加载中请稍等...

基于PLDA的多信道多语音说话人确认研究被引量：3

参考文献14

同被引文献9

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于PLDA的多信道多语音说话人确认研究 被引量：3

参考文献14

同被引文献9

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于PLDA的多信道多语音说话人确认研究被引量：3