期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Transformer的汉语歌声识别方法
1
作者 吴影 徐雅斌 孟晶晶 《北京信息科技大学学报(自然科学版)》 2023年第3期35-42,51,共9页
为提高歌声识别准确率,提出一种基于Transformer并带有纠正模型的歌声识别方法TSC(transformer with spelling correction)。利用注意力机制,使网络学习对应的歌词发音。在模型输入模块,增加由卷积神经网络组成的特征提取层,提取歌声特... 为提高歌声识别准确率,提出一种基于Transformer并带有纠正模型的歌声识别方法TSC(transformer with spelling correction)。利用注意力机制,使网络学习对应的歌词发音。在模型输入模块,增加由卷积神经网络组成的特征提取层,提取歌声特征。在输出模块后面,增加由卷积神经网络和双向循环神经网络组成的纠正模型,修正模型的输出结果。针对歌声样本量较少,模型训练困难的问题,提出了使用汉语语音数据集AISHELL-1进行预训练,并自制一组数据进行数据增强,对歌声识别模型参数进行微调。在增强的Opencpop歌声数据集上进行实验的结果表明,提出的歌声识别系统的字错率降低到了31.92%。 展开更多
关键词 TRANSFORMER 迁移学习 汉语歌声识别 拼写纠正
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部