期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于LPCNet的语音合成方法研究
被引量:
3
1
作者
陈小东
宋文爱
刘晓峰
《计算机与数字工程》
2020年第5期1143-1147,1226,共6页
针对诸如WaveNet的神经声码器合成语音缓慢和模型复杂的问题,提出一种基于LPCNet的语音合成方法。首先将中文带调拼音序列作为输入,然后通过引入Query-Key self attention注意力机制的Seq2Seq(Sequence to Sequence)特征预测网络生成相...
针对诸如WaveNet的神经声码器合成语音缓慢和模型复杂的问题,提出一种基于LPCNet的语音合成方法。首先将中文带调拼音序列作为输入,然后通过引入Query-Key self attention注意力机制的Seq2Seq(Sequence to Sequence)特征预测网络生成相应的梅尔声谱图,最后使用LPCNet模型将梅尔声谱图还原为语音波形。实验结果表明,主观评测MOS(Mean Opinion Score)得分4.07,客观评测MCD(Mel Cepstral Distance)得分12.14,合成语音的质量优于参数式语音合成模型和采用传统声码器的Seq2Seq语音合成模型,是一种优良的语音合成方法。
展开更多
关键词
语音合成
Seq2Seq
WaveNet
注意力机制
lpcnet
下载PDF
职称材料
题名
基于LPCNet的语音合成方法研究
被引量:
3
1
作者
陈小东
宋文爱
刘晓峰
机构
中北大学软件学院
出处
《计算机与数字工程》
2020年第5期1143-1147,1226,共6页
基金
国家自然科学基金项目(编号:61602427)资助。
文摘
针对诸如WaveNet的神经声码器合成语音缓慢和模型复杂的问题,提出一种基于LPCNet的语音合成方法。首先将中文带调拼音序列作为输入,然后通过引入Query-Key self attention注意力机制的Seq2Seq(Sequence to Sequence)特征预测网络生成相应的梅尔声谱图,最后使用LPCNet模型将梅尔声谱图还原为语音波形。实验结果表明,主观评测MOS(Mean Opinion Score)得分4.07,客观评测MCD(Mel Cepstral Distance)得分12.14,合成语音的质量优于参数式语音合成模型和采用传统声码器的Seq2Seq语音合成模型,是一种优良的语音合成方法。
关键词
语音合成
Seq2Seq
WaveNet
注意力机制
lpcnet
Keywords
speech synthesis
Seq2Seq
WaveNet
attention mechanism
lpcnet
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于LPCNet的语音合成方法研究
陈小东
宋文爱
刘晓峰
《计算机与数字工程》
2020
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部