基于GMM托肯配比相似度校正得分的说话人识别被引量：1

Score regulation based on GMM token ratio similarity for speaker recognition

导出

摘要该文提出一种基于Gauss混合模型(GMM)托肯配比相似度校正得分(GMM token ratio similarity based score regulation,GTRSR)的说话人识别方法。基于GMM-UBM(通用背景模型)识别框架,在自适应训练和测试阶段计算并保存自适应训练语句和测试语句在UBM上使特征帧得分最高的Gauss分量编号(GMM token)出现的比例(配比),然后在测试阶段计算测试语句和自适应训练语句的GMM托肯分布的配比的相似度GTRS,当GTRS小于某阈值时对测试得分乘以一个惩罚因子,将结果作为测试语句的最终得分。在MASC数据库上进行的实验表明,该方法能够使系统识别性能有一定的提升。 A GMM token ratio similarity based score regulation approach for speaker recognition is presented in this paper to judge the reliability of a test score based on the GMM token ratio similarity. In the GMM-UBM （universal background model） method, the GMM token which is the index of the UBM component giving the highest score is saved for each frame to form a vector called the GMM token ratio （GTR） of an utterance during the training and testing phases. In the test phase, the test utterance GTR is compared to the training utterance GTR to compute the similarity for a target speaker. When the similarity is less than a threshold, the original likelihood score is regulated by multiplying by a penalty factor as the final score of this test utterance. Tests on MASC show that this method improves the speaker recognition performance.

作者杨莹春邓立才

机构地区浙江大学计算机学院

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2017年第1期28-32,共5页 Journal of Tsinghua University(Science and Technology)

基金国家"九七三"重点基础研究项目(2013CB329504) 国家自然科学基金面上项目(60970080)

关键词说话人识别 GMM托肯配比(GTR) 得分校正 speaker recognition GMM token ratio （GTR） scoreregulation

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J].中文信息学报,2006,20(5):77-82. 被引量：19

二级参考文献9

1侯精一．现代汉语方言音库[M]．上海：上海教育出版社，1994—1999．
2Wuei-He Tsai,Wen-Whei Chang,Discrimination Training of Guassian Mixture Bigram Models with Application to Chinese Dialect Identification[J].Speech Communication,2002,36:317-326.
3Y.K.Muthusamy,E.Barnard,and R.A.Cole,Reviewing Automatic Language Identification[J].IEEE Signal Processing Mag.,1994,11(4):33 -41.
4M.A.Zissman,Comparison of Four Approaches to Automatic Language Identification of Telephone Speech,[J].IEEE Trans.Speech and Audio Processing,1996,4 (1):31 -34.
5Alvin F.Martin,Mark A.Przybocki,NIST 2003 Language Recognition Evaluation[M].In:EuroSpeech[C],2003.
6Torres-Carrasquillo,P.A.; Reynolds,D.A.; Deller,J.R.,Jr.,Language identification using Gaussian mixture model tokenization[A].IEEE International Conference on Acoustics,Speech,and Signal Processing[C],Orlando,Florida,May 2002,USA.
7F.Jelinek,Statistical Methords for Speech Recognition[M].Cambridge,Massachusetts,MIT Press,1999.
8周志华,曹存根.经网络及其应用[M],北京:清华大学出版社,2004年9月.
9陈海伦.方言机器识别技术研究[J].中国人民公安大学学报（自然科学版）,2000,6(1):33-38. 被引量：2

共引文献18

1顾明亮,夏玉果,张长水.基于支撑矢量机的汉语方言辨识[J].计算机工程与应用,2007,43(29):210-213. 被引量：5
2顾明亮.一种新的汉语方言辨识特征[J].广西科学,2007,14(4):423-425.
3钱盛友,许慧燕.基于动态时间规整和神经网络的方言辨识研究[J].计算机工程与应用,2008,44(10):211-213. 被引量：9
4顾明亮,夏玉果,张长水,杨亦鸣.基于AdaBoost的汉语方言辨识[J].东南大学学报（自然科学版）,2008,38(4):585-588. 被引量：3
5洪拓夷.汉语方言语音数据库建设构想[J].图书情报工作,2009,53(5):83-86. 被引量：6
6朱颖,钱盛友,赵新民.基于SOM神经网络和支持向量机的方言辨识[J].计算机工程与应用,2009,45(22):200-201. 被引量：6
7夏玉果,戴红霞,顾明亮,徐敏.多信息融合的汉语方言辨识[J].电脑与信息技术,2009,17(5):32-36.
8夏玉果,顾明亮,陆渊章.汉语方言的集成决策辨识[J].计算技术与自动化,2010,29(1):134-137.
9顾明亮,张彪.半监督矢量量化的汉语方言辨识[J].计算机工程与应用,2011,47(33):109-111. 被引量：1
10陈默.第二语言学习者汉语声调范畴浮现的模拟研究[J].中文信息学报,2012,26(1):119-127.

同被引文献19

1刘敬伟,徐美芝,郑忠国,程乾生.基于DTW的语音识别和说话人识别的特征选择[J].模式识别与人工智能,2005,18(1):50-54. 被引量：13
2于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
3蒋晔,唐振民.GMM文本无关的说话人识别系统研究[J].计算机工程与应用,2010,46(11):179-182. 被引量：27
4张飞云,张鹏,高建生.噪声环境中基于DTW的说话人识别[J].许昌学院学报,2011,30(5):68-72. 被引量：1
5檀蕊莲,柏鹏,李哲,姚战宏,栾前进.基于小波变换的说话人识别技术[J].空军工程大学学报（自然科学版）,2013,14(1):85-89. 被引量：3
6陈雪芳,杨继臣.交叉验证KNN支持向量预选取算法在说话人识别上的应用[J].科学技术与工程,2013,21(20):5839-5842. 被引量：1
7陈觉之,张贵荣,周宇欢.基于GMM模型的自适应说话人识别研究[J].计算机与现代化,2013(7):91-93. 被引量：2
8兰胜坤.遗传算法优化BP神经网络的说话人识别系统[J].重庆理工大学学报（自然科学）,2013,27(10):91-95. 被引量：13
9杜晓青,于凤芹.基于HHT倒谱系数的说话人识别算法[J].计算机工程与应用,2014,50(3):198-202. 被引量：4
10赵立辉,毛竹,霍春宝,杨红喆.基于GMM-SVM的说话人识别系统研究[J].工矿自动化,2014,40(5):49-53. 被引量：7

引证文献1

1甄倩倩,张庭亮.说话人识别综述[J].科技资讯,2017,15(25):241-243. 被引量：1

二级引证文献1

1姜珊,张二华,张晗.基于Bi-GRU+BFE模型的短语音说话人识别[J].计算机与数字工程,2022,50(10):2233-2239. 被引量：2

1熊振宇,郑方,宋战江,吴文虎.基于树形通用背景模型的高效说话人辨认[J].清华大学学报（自然科学版）,2006,46(7):1305-1308. 被引量：3
2孟君,杨大利.说话人辨认中通用背景模型训练时长研究[J].北京信息科技大学学报（自然科学版）,2013,28(3):87-91. 被引量：4
3单振宇,杨莹春.基于UBM降阶算法的高效说话人识别系统[J].浙江大学学报（工学版）,2009,43(6):978-982.
4张陈昊,郑方,王琳琳.基于多音素类模型的文本无关短语音说话人识别[J].清华大学学报（自然科学版）,2013,53(6):813-817. 被引量：1
5葛幸平,张林.单片机GTR变频电源[J].电气传动自动化,1995,17(3):12-14.
6鲍焕军,郑方.GMM-UBM和SVM说话人辨认系统及融合的分析[J].清华大学学报（自然科学版）,2008,48(S1):693-698. 被引量：9
7郭武,戴礼荣,王仁华.采用UBM更新量作为支持向量机特征的说话人确认[J].清华大学学报（自然科学版）,2008,48(S1):704-707. 被引量：4
8Part 2 我们到底需要多快的CPU？[J].电脑自做,2004(1):37-42.
9guigui.自己动手，获得史上最高的显卡测试得分！[J].家用电脑世界,2002(9):86-88.
10王欣.风起云涌——2006年度笔记本电脑专题测试——性能测试得分表[J].个人电脑,2006,12(12):58-59.

清华大学学报（自然科学版）

2017年第1期

浏览历史

内容加载中请稍等...

基于GMM托肯配比相似度校正得分的说话人识别被引量：1

参考文献1

二级参考文献9

共引文献18

同被引文献19

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GMM托肯配比相似度校正得分的说话人识别 被引量：1

参考文献1

二级参考文献9

共引文献18

同被引文献19

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于GMM托肯配比相似度校正得分的说话人识别被引量：1