期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
多特征融合的越英端到端语音翻译方法
1
作者 马候丽 董凌 +3 位作者 王剑 王文君 高盛祥 余正涛 《中文信息学报》 CSCD 北大核心 2024年第10期35-45,共11页
语音翻译的编码器需要同时编码语音中的声学信息和语义信息,单一的Fbank或Wav2vec2语音特征表征能力存在不足。通过分析人工的Fbank特征与自监督的Wav2vec2特征间的差异性,提出基于交叉注意力机制的声学特征融合方法,并探究了不同的自... 语音翻译的编码器需要同时编码语音中的声学信息和语义信息,单一的Fbank或Wav2vec2语音特征表征能力存在不足。通过分析人工的Fbank特征与自监督的Wav2vec2特征间的差异性,提出基于交叉注意力机制的声学特征融合方法,并探究了不同的自监督特征和融合方式,加强模型对语音中声学和语义信息的学习。结合越南语语音特点,以Fbank特征为主、Pitch特征为辅混合编码Fbank表征,构建多特征融合的越-英语音翻译模型。实验表明,使用多特征的语音翻译模型相比单特征翻译效果更优,与简单的特征拼接方法相比更有效,该文所提出的多特征融合方法在越-英语音翻译任务上提升了1.97个BLEU值。 展开更多
关键词 语音翻译 越南语 特征融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部