期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
结合轻量卷积的非自回归语音合成方法
1
作者
钟巧霞
曾碧
+1 位作者
林镇涛
林伟
《计算机工程与设计》
北大核心
2024年第4期1166-1172,共7页
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律...
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律缺乏问题。训练模型获取梅尔频谱,结合预先训练好的声码器转化为音频。实验结果表明,提出的LCTTS模型优于先前提出的SpeedySpeech模型,在Emotional Speech Database数据集上平均意见得分获得2.8%的提升,梅尔倒谱失真测度下降0.15。
展开更多
关键词
语音合成
轻量级卷积
韵律合成
梅尔频谱生成
非自回归方法
深度学习
自然语言处理
下载PDF
职称材料
题名
结合轻量卷积的非自回归语音合成方法
1
作者
钟巧霞
曾碧
林镇涛
林伟
机构
广东工业大学计算机学院
出处
《计算机工程与设计》
北大核心
2024年第4期1166-1172,共7页
基金
国家自然科学基金项目(62172111)
广东省自然科学基金项目(2019A1515011056)
顺德区核心技术攻关基金项目(2130218003002)。
文摘
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律缺乏问题。训练模型获取梅尔频谱,结合预先训练好的声码器转化为音频。实验结果表明,提出的LCTTS模型优于先前提出的SpeedySpeech模型,在Emotional Speech Database数据集上平均意见得分获得2.8%的提升,梅尔倒谱失真测度下降0.15。
关键词
语音合成
轻量级卷积
韵律合成
梅尔频谱生成
非自回归方法
深度学习
自然语言处理
Keywords
speech synthesis
lightweight convolution
prosodic synthesis
Mel spectrum generation
non-autoregressive methods
deep learning
natural language processing
分类号
TP912.33 [自动化与计算机技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
结合轻量卷积的非自回归语音合成方法
钟巧霞
曾碧
林镇涛
林伟
《计算机工程与设计》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部