期刊文献+

基于递归神经网络的藏语语音转文本应用研究

下载PDF
导出
摘要 本文针对藏语中的卫藏方言,探讨了自动语音识别(automatic speech recognition,ASR)技术在语音识别模型构建方面的应用。利用时间递归神经网络(recurrent neural network,RNN)及其变体来提升ASR系统的性能。通过引入LAS(listen,attend and spell)模型,并结合多任务学习框架、深度卷积神经网络和改进的注意力机制,显著提升了ASR系统的性能。在实验中,改进后的LAS模型在测试集和训练集上的词错误率分别达到了12.40%和16.23%,实验结果验证了方法的有效性。
出处 《互联网周刊》 2024年第17期23-25,共3页 China Internet Week
基金 国家级大学生创新创业训练计划项目——深度递归神经网络在藏语语音转文字中的应用研究(编号:202410694031)。
  • 相关文献

参考文献4

二级参考文献10

共引文献492

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部