基于特征加权与改进DCNN的说话人识别算法

Speaker Recognition Algorithm Based on Feature Weighting and Improved DCNN

下载PDF

导出

摘要针对DCNN网络缺乏直观的物理声学特征描述等问题,为了提高其在说话人识别系统中的识别性能,提出基于MFCC加权与改进深度卷积神经网络的说话人识别算法。算法首先提取信号的MFCC特征,并对特征进行分量凸显和加权改进,以提高特征中对最终识别准确率贡献大的分量的作用,然后通过改进深度卷积神经网络的结构并增加深度残差网络,进一步对准帧间信息,提高网络对说话人识别需求的适应性。实验结果表明,文中算法在不同的分段信噪比下均取得最优的识别准确率。 In response to the lack of intuitive physical acoustic feature descriptions in the DCNN network,to improve its recognition performance in the speaker recognition system,a speaker recognition algorithm based on MFCC weighting and improved deep convolutional neural network is proposed.The MFCC features of the signal is first extracted and component is highlighted,and weighting improvements is performed on the features to improve the role of the components in the features that have a large contribution to the final recognition accuracy.And then,by improving the structure of the deep convolutional neural network and adding a deep residual network,the inter-frame information is further aligned,and the adaptability of the network to the speaker recognition needs is improved.Experimental results show that the algorithm proposed in this paper achieves the best recognition accuracy under different segmented signal-to-noise ratios.

作者倪美玉曹为刚 NI Meiyu;CAO Weigang(Department of Electronic Information, Zhejang Vocational College of Science and Trade, Jinhua 321019, China)

机构地区浙江科贸职业技术学院

出处《微型电脑应用》 2022年第6期145-148,共4页 Microcomputer Applications

关键词说话人识别梅尔频率倒谱系数特征加权优化深度卷积神经网络深度残差网络 speaker recognition Mel frequency cestrum coefficient feature weighting optimization deep convolutional neural network deep residual network

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1酆勇,熊庆宇,石为人,曹俊华.深度非线性度量学习在说话人确认中的应用[J].声学学报,2018,43(1):112-120. 被引量：3
2余玲飞,刘强.基于深度循环网络的声纹识别方法研究及应用[J].计算机应用研究,2019,36(1):153-158. 被引量：27
3张玉来,李良荣.一种改进的DNN瓶颈特征提取方法[J].通信技术,2019,52(3):587-591. 被引量：3
4曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.深度学习框架下说话人识别研究综述[J].计算机工程与应用,2020,56(7):8-16. 被引量：9
5张建伟,陶亮,周健,王华彬.基于改进谱平滑策略的IMCRA算法及其语音增强[J].计算机工程与应用,2017,53(1):153-157. 被引量：12
6牛晓可,黄伊鑫,徐华兴,蒋震阳.基于听皮层神经元感受野的强噪声环境下说话人识别[J].计算机应用,2020,40(10):3034-3040. 被引量：3
7张靖,俞一彪.具有环境自学习机制的鲁棒说话人识别算法[J].通信技术,2020,53(3):618-624. 被引量：2
8牛立保,马永辉.基于语音识别技术的日语学习系统的设计与实现[J].微型电脑应用,2021,37(6):49-51. 被引量：2
9曾春艳,马超峰,王志锋,孔祥斌.基于卷积神经网络的鲁棒性说话人识别方法[J].华中科技大学学报（自然科学版）,2020,48(6):39-44. 被引量：9
10邓丽君,王涛.基于阈值的英语语音自动识别系统研究[J].微型电脑应用,2020,36(8):48-50. 被引量：4

二级参考文献33

1俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
2刘凤增,李国辉,李博.OM-LSA和小波阈值去噪结合的语音增强[J].计算机科学与探索,2011,5(6):547-552. 被引量：3
3曹洁,余丽珍.基于MFCC和运动强度聚类初始化的多说话人识别[J].计算机应用研究,2012,29(9):3295-3298. 被引量：10
4吴海洋,杨飞然,周琳,吴镇扬.矢量泰勒级数特征补偿的说话人识别[J].声学学报,2013,38(1):105-112. 被引量：6
5林琳,陈虹,陈建.基于鲁棒听觉特征的说话人识别[J].电子学报,2013,41(3):619-624. 被引量：10
6陈丽萍,王尔玉,戴礼荣,宋彦.基于深层置信网络的说话人信息提取方法[J].模式识别与人工智能,2013,26(12):1089-1095. 被引量：5
7戴礼荣,张仕良.深度语音信号与信息处理:研究进展与展望[J].数据采集与处理,2014,29(2):171-179. 被引量：31
8栗志意,张卫强,何亮,刘加.基于总体变化子空间自适应的i-vector说话人识别系统研究[J].自动化学报,2014,40(8):1836-1840. 被引量：17
9梁春燕,杨琳,周若华,颜永红.韵律特征在概率线性判别分析说话人确认中的应用[J].声学学报,2015,40(1):28-33. 被引量：6
10酆勇,熊庆宇,石为人,曹俊华.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262. 被引量：19

共引文献59

1王文益,伊雪.基于改进语音存在概率的自适应噪声跟踪算法[J].信号处理,2020,36(1):32-41. 被引量：7
2艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：9
3崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：2
4姚远,王秋菊,周伟,鲍程毅,彭磊.改进谱减法结合神经网络的语音增强研究[J].电子测量技术,2017,40(7):75-79. 被引量：12
5吴进,赵隽,李乔深.基于维纳过滤的IMCRA算法[J].西安邮电大学学报,2017,22(5):73-77. 被引量：2
6邵虹,王杰.基于连续频谱最小值跟踪的语音增强算法[J].电子测量技术,2018,41(14):16-20. 被引量：3
7胡岸,高勇.基于变窗长搜索的改进型噪声估计算法[J].计算机系统应用,2018,27(9):124-129. 被引量：3
8何鑫,高勇.一种语音增强中新的噪声预估计算法[J].通信技术,2018,51(10):2320-2324. 被引量：2
9牟廉明.自适应特征选择加权k子凸包分类[J].山东大学学报（工学版）,2018,48(5):32-37.
10毛维,曾庆宁,龙超.一种适用于双微阵列的语音增强算法[J].科学技术与工程,2018,18(10):245-249.

1陈子正,行鸿彦,王瑞,段儒杰.一种铁路隧道衬砌掉块声音检测方法[J].电子测量与仪器学报,2022,36(1):134-140. 被引量：2
2姜琦,冯庆胜.基于多尺度梅尔倒谱系数的转辙机声信号状态识别方法[J].科学技术与工程,2022,22(16):6680-6686. 被引量：1
3庞涛,黄浩奇,邱雪芳,沈洪宇.基于MFCC和SVM的起重机减速器故障诊断系统研究[J].自动化与仪器仪表,2022(6):70-74. 被引量：3
4张广秀,李文广,李维肖,李旭伟,刘海.乘用车车内声品质客观评价特征提取方法研究[J].汽车技术,2022(5):11-15. 被引量：1
5楚宪腾,杨海涛,闫道申,许铭洋,王华朋.基于全局注意力机制的CNN-LSTM说话人识别研究[J].电声技术,2022,46(2):38-45. 被引量：1
6何赞园,王凯,吉立新.基于矢量量化的说话人识别系统硬件实现[J].现代电子技术,2022,45(1):171-175.
7方泽彬,吴小笛,杨帆,何杰逊.一种基于功耗分析的深度卷积神经网络识别方法[J].声学与电子工程,2022(2):14-18. 被引量：1
8韩鑫怡,张洪德,柳林,柳扬.基于WDGAN-div的语音增强方法[J].电子测量技术,2021,44(21):64-70. 被引量：3
9黎英,宋佩华.迁移学习在医学图像分类中的研究进展[J].中国图象图形学报,2022,27(3):672-686. 被引量：18
10刘冰,陈堃,邹超,沈曙光,谢万顺.基于MFCC声音特征信号提取的风机叶片故障诊断[J].设备管理与维修,2022(12):148-149. 被引量：1

微型电脑应用

2022年第6期

浏览历史

内容加载中请稍等...

基于特征加权与改进DCNN的说话人识别算法

参考文献10

二级参考文献33

共引文献59

相关作者

相关机构

相关主题

浏览历史