具有环境自学习机制的鲁棒说话人识别算法被引量：2

Robust Speaker-Recognition Algorithm with Environmental Self-Learning Mechanism

下载PDF

导出

摘要说话人识别系统实际应用时,一旦应用环境和训练环境不一致,系统的性能会急剧下降。由于环境噪声的多变性,系统训练时无法预测实际应用中的环境噪声。因此,引入环境自学习和自适应思想,通过改进的矢量泰勒级数(Vector Taylor Series,VTS)刻画环境噪声模型和说话人语音模型之间的统计关系,提出一种具有环境自学习能力的鲁棒说话人识别算法。系统应用中每当环境变化时利用语音输入前采集到的环境噪声信号来迭代更新环境噪声模型参数,进一步基于VTS确立的统计关系,将说话人语音模型自适应到实际应用环境来补偿环境失配的影响。说话人辨认实验结果表明,提出的方法在低信噪比条件下对于不同种类的噪声都能显著提升系统的识别性能。 In the actual application of the speaker recognition system,once application environment and the training environment are inconsistent,the performance of the system will drop significantly.Due to the variability of environmental noise,the environmental noise in practical applications cannot be predicted during system training.Therefore,the environment self-learning and adaptive ideas are introduced to describe the statistical relationship between the environmental noise model and the speaker’s speech model through the improved VTS(Vector Taylor Series),and a robust speaker-recognition algorithm with environmental self-learning ability is proposed.In system application,when environment changes,the environment noise before speech input is collected to iteratively update the model parameters of environment noise,and further adapt the speaker model to the application environment to compensate for the environmental mismatch based on the statistical relationship established by VTS.The speaker-recognition experiment results indicate that the proposed method can significantly improve the recognition performance of the system for different kinds of noise under low SNR conditions.

作者张靖俞一彪 ZHANG Jing;YU Yi-biao(School of Electronic Information,Soochow University,Suzhou Jiangsu 215000,China)

机构地区苏州大学电子信息学院

出处《通信技术》 2020年第3期618-624,共7页 Communications Technology

关键词说话人识别自学习自适应矢量泰勒级数环境噪声 speaker recognition self-learning self-adaptation VTS(Vector Taylor Series) environmental noise

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1吴海洋,杨飞然,周琳,吴镇扬.矢量泰勒级数特征补偿的说话人识别[J].声学学报,2013,38(1):105-112. 被引量：6
2李聪,葛洪伟.自适应并行模型组合的鲁棒语音身份识别算法[J].信号处理,2018,34(7):867-875. 被引量：6
3俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7

二级参考文献36

1俞一彪,王朔中.基于互信息匹配模型的说话人识别[J].声学学报,2004,29(5):462-466. 被引量：8
2刘海滨,吴镇扬,赵力,曾毓敏.噪声环境下基于最大后验非线性变换的隐马尔可夫模型自适应算法[J].声学学报,2004,29(5):467-471. 被引量：4
3赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
4Chen C T, Chen C. Efficient genetic algorithm of codebook design for text-independent speaker recognition. IEICE,2002, E85-A(11): 2529-2531.
5Lee Y -T. Information-theoretic distortion measures for speech recognition. IEEE-ASSP, 1991; 39:330-335.
6Okawa S, Kobayashi T, Shirai K. Automatic training of phoneme dictionary based on mutual information criterion.ICASSP, 1994:241-244.
7Bahl L R, Brown P F. Maximum mutual information estimation of hidden Markov model parameters for speech recognition. ICASSP, 1986:49-52.
8Shaughnessy D O. Speech communications-human and machine. IEEE Press, NJ., 2000:378-383.
9Naik J. Speaker verification: A tutorial. IEEE Commun.Mag., 1990; 28(1): 42-48.
10Campbell J P. Speaker recognition: A tutorial. IEEE Proc., 1997; 85(9): 1436-1462.

共引文献16

1俞一彪,芮贤义,许允喜.说话人语音特征子空间分离及识别应用[J].电路与系统学报,2008,13(1):7-11.
2俞一彪,袁冬梅,薛峰.一种适于说话人识别的非线性频率尺度变换[J].声学学报,2008,33(5):450-455. 被引量：13
3YU Yibiao YUAN Dongmei XUE Feng.A non-linear frequency transform and its application to speaker recognition[J].Chinese Journal of Acoustics,2009,28(3):280-288. 被引量：1
4张勇,胡瑞敏.基于高斯混合模型的语音带宽扩展算法的研究[J].声学学报,2009,34(5):471-480. 被引量：7
5尹全海.江泽民新安全观初探[J].信阳师范学院学报（哲学社会科学版）,2000,20(1):7-12.
6李荟,赵云敏.特征音方法在说话人识别中的应用[J].计算机系统应用,2013,22(8):176-179.
7冉国敬,夏秀渝,张凤仪.信道失配环境下鲁棒说话人识别[J].计算机系统应用,2015,24(3):235-240. 被引量：2
8王现彬,杨洁,贾英茜,饶立婵.基于MATLAB的说话人识别系统设计与实现[J].石家庄学院学报,2016,18(3):5-8.
9酆勇,熊庆宇,石为人,曹俊华.深度非线性度量学习在说话人确认中的应用[J].声学学报,2018,43(1):112-120. 被引量：3
10仲伟峰,方祥,范存航,温正棋,陶建华.深浅层特征及模型融合的说话人识别[J].声学学报,2018,43(2):263-272. 被引量：13

同被引文献11

1刘凤增,李国辉,李博.OM-LSA和小波阈值去噪结合的语音增强[J].计算机科学与探索,2011,5(6):547-552. 被引量：3
2酆勇,熊庆宇,石为人,曹俊华.深度非线性度量学习在说话人确认中的应用[J].声学学报,2018,43(1):112-120. 被引量：3
3张建伟,陶亮,周健,王华彬.基于改进谱平滑策略的IMCRA算法及其语音增强[J].计算机工程与应用,2017,53(1):153-157. 被引量：12
4周于皓,张红玲,李芳菲,祁鹏.局部关注支持向量机算法[J].计算机应用,2018,38(4):945-948. 被引量：10
5张玉来,李良荣.一种改进的DNN瓶颈特征提取方法[J].通信技术,2019,52(3):587-591. 被引量：3
6曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.深度学习框架下说话人识别研究综述[J].计算机工程与应用,2020,56(7):8-16. 被引量：9
7曾春艳,马超峰,王志锋,孔祥斌.基于卷积神经网络的鲁棒性说话人识别方法[J].华中科技大学学报（自然科学版）,2020,48(6):39-44. 被引量：9
8邓丽君,王涛.基于阈值的英语语音自动识别系统研究[J].微型电脑应用,2020,36(8):48-50. 被引量：4
9牛晓可,黄伊鑫,徐华兴,蒋震阳.基于听皮层神经元感受野的强噪声环境下说话人识别[J].计算机应用,2020,40(10):3034-3040. 被引量：3
10牛立保,马永辉.基于语音识别技术的日语学习系统的设计与实现[J].微型电脑应用,2021,37(6):49-51. 被引量：2

引证文献2

1牛晓可,黄伊鑫,徐华兴,蒋震阳.基于听皮层神经元感受野的强噪声环境下说话人识别[J].计算机应用,2020,40(10):3034-3040. 被引量：3
2倪美玉,曹为刚.基于特征加权与改进DCNN的说话人识别算法[J].微型电脑应用,2022,38(6):145-148.

二级引证文献3

1罗春梅,张风雷.基于均值特征和改进深度神经网络的说话人识别算法[J].声学技术,2021,40(4):503-507. 被引量：2
2倪美玉,曹为刚.基于特征加权与改进DCNN的说话人识别算法[J].微型电脑应用,2022,38(6):145-148.
3邓立军,尚文天,刘剑,周煜凯,宋莹.基于DWT与SVM的风门开闭阶段识别方法[J].中国安全科学学报,2023,33(1):95-104. 被引量：1

1窦建中,罗深增,金勇,李群山,杨超,杨绪升.基于深度神经网络的电力调度语音识别研究及应用[J].湖北电力,2019,43(3):16-22. 被引量：16
2王发仓,熊磊,柴星池.中厚板机架间冷却应用研究[J].江苏科技信息,2020,37(4):59-62. 被引量：2
3麻荔波.AIS在航标领域中应用存在的问题探究[J].科技风,2020,0(2):101-101. 被引量：2
4刘伟波,曾庆宁,卜玉婷,郑展恒.基于双微阵列与卷积神经网络的语音识别方法[J].计算机应用,2019,39(11):3268-3273. 被引量：13
5刘斌,何进荣,李远成,韩宏.基于分布式神经网络的苹果价格预测方法[J].计算机应用,2020,40(2):369-374. 被引量：12
6徐燕,艾万政,刘虎.宁波舟山港老塘山港区锚地资源紧缺原因分析及对策[J].水运管理,2020,42(1):26-29. 被引量：1
7樊璠.计算机“虚拟现实”技术在高校体育训练中的应用[J].电子世界,2020,0(2):175-176. 被引量：6
8冯军伟.“不过X罢了/而已”构件的构式化和整体构式化[J].湖州师范学院学报,2020,42(1):96-102.
9练朝春,李淑英,肖峰,梁仁德,季伟伟.基于手机车机融合的智能车联网系统开发[J].电子元器件与信息技术,2019,3(12):21-26. 被引量：3
10宋桂奇.暗示语更具穿透力[J].高中生之友,2020,0(2):43-44.

通信技术

2020年第3期

浏览历史

内容加载中请稍等...

具有环境自学习机制的鲁棒说话人识别算法被引量：2

参考文献3

二级参考文献36

共引文献16

同被引文献11

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

具有环境自学习机制的鲁棒说话人识别算法 被引量：2

参考文献3

二级参考文献36

共引文献16

同被引文献11

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

具有环境自学习机制的鲁棒说话人识别算法被引量：2