一种基于深度神经网络的话者确认方法被引量：4

A SPEAKER VERIFICATION METHOD BASED ON DEEP NEURAL NETWORK

下载PDF

导出

摘要主要研究基于深度神经网络的话者确认方法。在训练阶段,以语音倒谱特征参数作为输入,说话人标签作为输出有监督的训练DNN;在话者注册阶段,从已训练的DNN最后一个隐藏层抽取与说话人相关的特征矢量,称为d-vector,作为话者模型;在测试阶段,从测试语音中抽取其d-vector与注册的话者模型相比较然后做出判决。实验结果表明,基于DNN的话者确认方法是可行的,并且在噪声环境及低的错误拒绝率的条件下,基于DNN的话者确认系统性能比i-vector基线系统性能更优。最后,将两个系统进行融合,融合后的系统相对于i-vector基线系统在干净语音和噪声语音条件下等误识率(EER)分别下降了13%和27%。 In this paper we mainly investigate the method of using deep neural network ( DNN) for speaker verification. At the stage of training, the DNN is trained under supervision using the feature parameter of speech cepstrum as input and the label of speaker as output. At the stage of speaker registration, an eigenvector correlated to the speaker, namely d-vector, is extracted from the last hidden layer of the trained DNN and is used as the model of speaker. At test stage, from testing speech a d-vector is extracted to compare it with the model of the registered speaker and then to make the verification decision. Experimental results show that the DNN-based speaker verification method is feasible. Moreover, under the condition of noisy environment and low error-rejection rate, the DNN-based speaker verification system outperforms the i-vector base line system in performance. Finally, we integrate these two systems, relative to the i-vector base line system,the integrated system reduces the equal error rate (EER) by 1 3 % and 2 7 % for clean speech and noisy speck conditions respectively.

作者吴明辉胡群威李辉 Wu Minghui;Hu Qunwei;Li Hui(Department of Electronic Science and Technology, University of Science and Technology of China, Hefei 230027, Anhui, China)

机构地区中国科学技术大学电子科学与技术系

出处《计算机应用与软件》 CSCD 2016年第6期159-162,共4页 Computer Applications and Software

关键词话者确认深度神经网络深度学习 Speaker verification Deep neural network ( DNN) Deep learning

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献17

1Reynolds D A,Quatieri T F,Dunn R B.Speaker verification using adaptedGaussian mixture models [J].Digital signal processing, 2000,10(1):19-41.
2Kenny P,Boulianne G,0uellet P,et al. Joint factor analysis versus eigenchannelsin speaker recognition [J].Audio,Speech,and Language Processing,IEEE Transactions on,2007,15(4):1435-1447.
3Kenny P,Boulianne G,0uellet P,et al. Speaker and session variabilityin GMM-based speaker verification[J].Audio,Speech,and Language Processing,IEEE Transactions on,2007,15(4):1448-1460.
4Kenny P,0uellet P,Dehak N,et al. A study of interspeaker variabilityin speaker verification [J].Audio,Speech,and Language Processing,IEEE Transactions on,2008,16(5):980-988.
5Dehak N,Kenny P,Dehak R,et al.Front-end factor analysis for speakerverification [J].Audio,Speech,and Language Processing, IEEETransactions on,2011,19(4):788-798.
6Hinton G,Deng L,Yu D,et al. Deep neural networks for acoustic modelingin speech recognition:The shared views of four research groups[J].Signal Processing Magazine,IEEE,2012,29(6):82-97.
7Martin A F,Greenberg C S.The NIST 2010 speaker recognition evaluation[C]Interspeech 2010,11th Annual Conference of the InternationalSpeech Communication Association, Makuhari,Chiba,Japan,2010:2726-2729.
8Kenny P.Bayesian Speaker Verification with Heavy-Tailed Priors[C]Proc.Odyssey Speaker and Language Recognition Workshop, Brno,CzechRepublic,2010:14.
9Larcher A,Lee K A,Ma B,et al.Phonetically-constrained PLDA modelingfor text-dependent speaker verification with multiple short utterances[C]Acoustics,Speech and Signal Processing (ICASSP),20131EEE International Conference on.IEEE,2013:7673-7677.
10Yegnanarayana B,Kishore S P.AANN:an alternative to GMM for patternrecognition[J].Neural Networks,2002,15(3):459-469.

同被引文献31

1黄小红,姜卫东.空间目标RCS序列周期性判定与提取[J].航天电子对抗,2005,21(2):29-30. 被引量：20
2李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
3许小剑,黄培康.防空雷达中的目标识别技术[J].系统工程与电子技术,1996,18(5):48-62. 被引量：20
4林刚,许家栋.目标RCS动态数据的分布特征研究[J].现代雷达,2006,28(2):18-20. 被引量：10
5邵妍,霍春宝,金曦.基于改进的高斯混合模型算法的说话人识别[J].辽宁工业大学学报（自然科学版）,2010,30(1):8-10. 被引量：4
6金胜,高梅国,王洋.基于RCS的空间目标识别技术[J].现代雷达,2010,32(6):59-62. 被引量：21
7白广周,张洪祥.基于雷达RCS测量的空间翻滚目标识别研究[J].飞行器测控学报,1999,18(1):50-58. 被引量：4
8胡峰松,曹孝玉.基于Gammatone滤波器组的听觉特征提取[J].计算机工程,2012,38(21):168-170. 被引量：28
9邢健飞,罗志增,席旭刚.基于深度神经网络的实时人脸识别[J].杭州电子科技大学学报（自然科学版）,2013,33(6):107-110. 被引量：6
10赵立辉,毛竹,霍春宝,杨红喆.基于GMM-SVM的说话人识别系统研究[J].工矿自动化,2014,40(5):49-53. 被引量：7

引证文献4

1詹武平,郑永煌,王金霞.基于深度神经网络模型的雷达目标识别[J].现代雷达,2018,40(1):16-19. 被引量：11
2张学祥,雷菊阳.基于DNN与基音周期的说话人识别[J].计算机与现代化,2020,0(1):122-126. 被引量：4
3蔡倩,高勇.一种基于卷积神经网络的快速说话人识别方法[J].无线电工程,2020,50(6):447-451. 被引量：4
4刘勇,梁宏涛,刘国柱,胡强.基于ResNet-LSTM的声纹识别方法[J].计算机系统应用,2021,30(6):215-219. 被引量：1

二级引证文献20

1冯博迪,杨海涛,王晋宇,李高源,张长弓.基于数据融合的SAR图像目标识别算法[J].计算机系统应用,2022,31(12):342-349.
2王志诚,徐卉,梁小溪,王珺,周起华,朱骏.基于卷积神经网络技术的直升机旋翼谱识别方法[J].上海航天,2018,35(6):103-111.
3王容川,庄志洪,王宏波,陆锦辉.基于卷积神经网络的雷达目标HRRP分类识别方法[J].现代雷达,2019,41(5):33-38. 被引量：10
4周驰,李智,徐灿.基于DTW算法的空间目标结构识别研究[J].计算机仿真,2019,36(9):98-102. 被引量：12
5胡盟霄,卢旺,徐灿,来嘉哲.采用GRU模型的卫星RCS异常检测[J].西安电子科技大学学报,2019,46(6):125-130. 被引量：1
6胡盟霄,来嘉哲,徐灿.一种空间目标RCS序列的姿态异常检测方法[J].中国空间科学技术,2019,39(6):72-79. 被引量：3
7张明键,张悦.基于语谱图HOG特征的两步法长沙话说话人识别[J].信息技术与信息化,2020(8):188-192. 被引量：1
8张明键,张悦.基于语谱图和深度置信网络的方言自动辨识与说话人识别[J].电子技术与软件工程,2020(14):151-154. 被引量：1
9武风波,范梦宁,刘文远,赵盼,周远国.一种基于LSTM神经网络建模的时域电磁正演方法[J].西北大学学报（自然科学版）,2021,51(3):485-490. 被引量：1
10徐丽珍,吴功才.基于青少年在线学习的特定动作识别[J].信息与电脑,2021,33(13):24-26.

1方昕,李辉,刘青松.利用i-vectors构建区分性话者模型的话者确认[J].小型微型计算机系统,2014,35(3):685-688. 被引量：3
2许敏强,戴蓓蒨,刘青松,许东星.基于多微商核函数的SVM话者确认[J].数据采集与处理,2011,26(5):508-514.
3戴蓓蒨,辛文,赵问道.与文本无关的话者识别[J].中国科学技术大学学报,1991,21(3):84-92.
4琚炜,李锐,李辉.使用置信区间的基频特征对Ⅰ-Vector系统的性能补偿[J].小型微型计算机系统,2016,37(7):1629-1632.
5丁贵祥,王琪,翁默颖.基于数字信号处理方法的话者确认计算机识别系统[J].电子测量与仪器学报,1999,13(1):1-6.
6刘扬,曹宝峰,李茂生.遗传小波神经网络实现人脸和语音的认证系统[J].计算机工程与应用,2006,42(18):50-52. 被引量：7
7卓著,李辉.PCA变换下的GMM-SVM话者确认研究[J].小型微型计算机系统,2015,36(3):637-640. 被引量：1
8黄伟,戴蓓蒨.基于GMM统计特性参数和SVM的话者确认[J].数据采集与处理,2004,19(4):365-370. 被引量：5
9花城,李辉.使用阈值提升基频特征对话者确认的补偿性能[J].小型微型计算机系统,2014,35(4):869-871. 被引量：1
10黄光许,田垚,康健,刘加,夏善红.低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统[J].计算机应用研究,2017,34(2):392-396. 被引量：21

计算机应用与软件

2016年第6期

浏览历史

内容加载中请稍等...

一种基于深度神经网络的话者确认方法被引量：4

参考文献17

同被引文献31

引证文献4

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

一种基于深度神经网络的话者确认方法 被引量：4

参考文献17

同被引文献31

引证文献4

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

一种基于深度神经网络的话者确认方法被引量：4