期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于3A-RCNN网络的说话人识别研究
下载PDF
职称材料
导出
摘要
本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相比于ResCNN和CNN-LSTM模型准确率分别提升5.48%和2.72%。
作者
李建文
赵统军
机构地区
陕西科技大学电子信息与人工智能学院
出处
《电子技术与软件工程》
2020年第14期23-27,共5页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
关键词
多维度注意力机制
残差块末端嵌入
说话人识别
3A-RCNN网络
梅尔语谱图
分类号
TN912.34 [电子电信—通信与信息系统]
引文网络
相关文献
节点文献
二级参考文献
3
参考文献
2
共引文献
39
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
2
1
闫河,董莺艳,王鹏,罗成,李焕.
基于CNN-LSTM网络的声纹识别研究[J]
.计算机应用与软件,2019,36(4):166-170.
被引量:19
2
余玲飞,刘强.
基于深度循环网络的声纹识别方法研究及应用[J]
.计算机应用研究,2019,36(1):153-158.
被引量:27
二级参考文献
3
1
曹洁,余丽珍.
基于MFCC和运动强度聚类初始化的多说话人识别[J]
.计算机应用研究,2012,29(9):3295-3298.
被引量:10
2
林琳,陈虹,陈建.
基于鲁棒听觉特征的说话人识别[J]
.电子学报,2013,41(3):619-624.
被引量:10
3
余玲飞,刘强.
基于深度循环网络的声纹识别方法研究及应用[J]
.计算机应用研究,2019,36(1):153-158.
被引量:27
共引文献
39
1
王丹丹,陈刚,杨青.
基于ELSTM的集合型故障诊断方法研究[J]
.沈阳理工大学学报,2020(4):70-75.
被引量:4
2
艾佳琪,左毅,刘君霞,贺培超,李铁山,陈俊龙.
基于余弦相似度的动态语音特征提取算法[J]
.计算机应用研究,2020,37(S02):147-149.
被引量:9
3
崔琳,王芷悦.
基于LFBank与FBank混合特征的声纹识别研究[J]
.计算机科学,2022,49(S02):621-625.
被引量:2
4
闫河,董莺艳,王鹏,罗成,李焕.
基于CNN-LSTM网络的声纹识别研究[J]
.计算机应用与软件,2019,36(4):166-170.
被引量:19
5
陈泽龙,张少涵,张振昌,林少炜,陈自谦.
基于Android平台的精神疲劳检测系统的设计与应用[J]
.医疗卫生装备,2019,40(12):28-32.
被引量:5
6
吴俊杰.
基于非单调共轭梯度算法的声纹识别机器人控制系统设计[J]
.计算机测量与控制,2020,28(1):116-119.
7
曾霞,李霜.
语音信号声纹识别的研究和仿真[J]
.新一代信息技术,2019,2(16):61-65.
被引量:1
8
曾春艳,马超峰,王志锋,朱栋梁,赵楠,王娟,刘聪.
深度学习框架下说话人识别研究综述[J]
.计算机工程与应用,2020,56(7):8-16.
被引量:9
9
白勇,齐林,帖云.
基于强化学习Actor-Critic算法的音乐生成[J]
.计算机应用与软件,2020,37(5):118-122.
被引量:2
10
李蜜.
基于语谱图和神经网络的声纹识别研究[J]
.高师理科学刊,2020,40(4):39-42.
被引量:2
1
潘淑倩,余金鹏,徐华胜,周永贤,张丽,王鹏飞.
前驱试剂对铬系催化剂丙烷脱氢反应的影响[J]
.石油与天然气化工,2020,49(4):48-55.
被引量:2
电子技术与软件工程
2020年 第14期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部