-
题名基于前向注意力机制的长句子语音合成方法
被引量:2
- 1
-
-
作者
田泽佳
门豪
卓奕炜
刘宇
-
机构
武汉邮电科学研究院
南京烽火天地通信科技有限公司
-
出处
《电子设计工程》
2022年第18期86-90,共5页
-
文摘
针对基于注意力机制的序列到序列模型在合成长句子语音时出现的漏读、重读问题,根据前向算法提出了前向注意力机制,其利用前一时刻的注意力得分平滑当前异常得分。在此基础上,进一步提出了带约束的前向注意力机制,通过引入约束因子自适应平滑当前异常得分。实验结果表明,提出的前向注意力机制能够有效解决长句子语音合成中出现的漏读、重读问题,并具有更快的收敛速度和较好的稳定性,同时带约束的前向注意力机制又能够控制合成语音的速度,提高其自然度,在MOS得分上,相比基线模型Tacotron2,有2.5%左右的提升。
-
关键词
前向注意力机制
序列到序列
自适应平滑
语音合成
-
Keywords
forward attention mechanism
sequence to sequence
adaptive smoothing
speech synthesis
-
分类号
TN912.33
[电子电信—通信与信息系统]
-
-
题名一种多尺度前向注意力模型的语音识别方法
被引量:18
- 2
-
-
作者
唐海桃
薛嘉宾
韩纪庆
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2020年第7期1255-1260,共6页
-
基金
国家重点研发项目(No.2017YFB1002102)。
-
文摘
注意力模型是当前语音识别中的主流模型,然而其存在一个缺点,即当前时刻的注意力模型可能产生异常得分.为此,本文首先提出前向注意力模型,其采用上一时刻正常注意力得分平滑当前时刻异常得分.接着通过对上一时刻的注意力得分添加约束因子来对前向注意力模型进行优化,达到自适应平滑的目的.最后,在优化模型基础上提出多尺度前向注意力模型,其通过引入多尺度模型来对不同等级的语音基元进行建模,进而将所得到的不同等级目标向量进行融合,以达到解决注意力得分异常值的目的.采用SwitchBoard作为训练集,Hub5’00作为测试集进行实验,相比于基线系统,多尺度前向注意力模型的词错误率(Word Error Rate,WER)相对降低14.28%.
-
关键词
前向注意力机制
自适应平滑
多尺度
语音识别
-
Keywords
forward attention mechanism
adaptive smoothing
multi-scale
speech recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-