基于3A-RCNN网络的说话人识别研究

下载PDF

导出

摘要本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相比于ResCNN和CNN-LSTM模型准确率分别提升5.48%和2.72%。

作者李建文赵统军

机构地区陕西科技大学电子信息与人工智能学院

出处《电子技术与软件工程》 2020年第14期23-27,共5页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

关键词多维度注意力机制残差块末端嵌入说话人识别 3A-RCNN网络梅尔语谱图

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1闫河,董莺艳,王鹏,罗成,李焕.基于CNN-LSTM网络的声纹识别研究[J].计算机应用与软件,2019,36(4):166-170. 被引量：19
2余玲飞,刘强.基于深度循环网络的声纹识别方法研究及应用[J].计算机应用研究,2019,36(1):153-158. 被引量：27

二级参考文献3

1曹洁,余丽珍.基于MFCC和运动强度聚类初始化的多说话人识别[J].计算机应用研究,2012,29(9):3295-3298. 被引量：10
2林琳,陈虹,陈建.基于鲁棒听觉特征的说话人识别[J].电子学报,2013,41(3):619-624. 被引量：10
3余玲飞,刘强.基于深度循环网络的声纹识别方法研究及应用[J].计算机应用研究,2019,36(1):153-158. 被引量：27

共引文献39

1王丹丹,陈刚,杨青.基于ELSTM的集合型故障诊断方法研究[J].沈阳理工大学学报,2020(4):70-75. 被引量：4
2艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.基于余弦相似度的动态语音特征提取算法[J].计算机应用研究,2020,37(S02):147-149. 被引量：9
3崔琳,王芷悦.基于LFBank与FBank混合特征的声纹识别研究[J].计算机科学,2022,49(S02):621-625. 被引量：2
4闫河,董莺艳,王鹏,罗成,李焕.基于CNN-LSTM网络的声纹识别研究[J].计算机应用与软件,2019,36(4):166-170. 被引量：19
5陈泽龙,张少涵,张振昌,林少炜,陈自谦.基于Android平台的精神疲劳检测系统的设计与应用[J].医疗卫生装备,2019,40(12):28-32. 被引量：5
6吴俊杰.基于非单调共轭梯度算法的声纹识别机器人控制系统设计[J].计算机测量与控制,2020,28(1):116-119.
7曾霞,李霜.语音信号声纹识别的研究和仿真[J].新一代信息技术,2019,2(16):61-65. 被引量：1
8曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.深度学习框架下说话人识别研究综述[J].计算机工程与应用,2020,56(7):8-16. 被引量：9
9白勇,齐林,帖云.基于强化学习Actor-Critic算法的音乐生成[J].计算机应用与软件,2020,37(5):118-122. 被引量：2
10李蜜.基于语谱图和神经网络的声纹识别研究[J].高师理科学刊,2020,40(4):39-42. 被引量：2

1潘淑倩,余金鹏,徐华胜,周永贤,张丽,王鹏飞.前驱试剂对铬系催化剂丙烷脱氢反应的影响[J].石油与天然气化工,2020,49(4):48-55. 被引量：2

电子技术与软件工程

2020年第14期

浏览历史

内容加载中请稍等...

基于3A-RCNN网络的说话人识别研究

参考文献2

二级参考文献3

共引文献39

相关作者

相关机构

相关主题

浏览历史