摘要
在NIST SRE 2012年评测和实际应用中,可以用说话人的多个语音样本来注册说话人模型,并且这些语音样本取自于各种各样的信道。本文基于PLDA,尝试了多种打分方法,并提出一种新的得分规整技术,在NIST SRE 2012核心测试集上,EER平均提升26.0%,MinCost平均提升12.4%。
In NIST SRE 2012 evaluation and practical applications,multiple recordings,which come from various channel conditions, can be used to train a speaker model. Based on PLDA,this paper will try several score methods and propose one score normalization technique. Equal error rate and minimum cost has been relatively improved 26. 0% and 12. 4% respectively on NIST SRE 2012 core test corpus.
出处
《网络新媒体技术》
2014年第1期13-19,共7页
Network New Media Technology
基金
国家自然科学基金(批准号:10925419
90920302
61072124
11074275
11161140319
91120001
61271426)
中国科学院战略性先导科技专项(面向感知中国的新一代信息技术研究
编号:XDA06030100
XDA06030500)
国家863计划(资助号:2012AA012503)
中科院重点部署项目(编号:KGZD-EW-103-2)经费资助
关键词
说话人识别
PLDA
多语音
得分规整
speaker recognition
PLDA
multi-record
score normalization