期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于3A-RCNN网络的说话人识别研究
1
作者 李建文 赵统军 《电子技术与软件工程》 2020年第14期23-27,共5页
本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相... 本文为了更加有针对性的从语音信息中筛选出说话人的身份信息,减少冗余信息,提出一种将通道维度、时间维度、频率维度三种维度的多重注意力机制嵌入每个残差块末端的模型(3A-RCNN)。结果表明,3A-RCNN模型收敛后平均准确率达到98.0%。相比于ResCNN和CNN-LSTM模型准确率分别提升5.48%和2.72%。 展开更多
关键词 多维度注意力机制 残差块末端嵌入 说话人识别 3A-RCNN网络 梅尔语谱图
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部