-
题名结合轻量卷积的非自回归语音合成方法
- 1
-
-
作者
钟巧霞
曾碧
林镇涛
林伟
-
机构
广东工业大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2024年第4期1166-1172,共7页
-
基金
国家自然科学基金项目(62172111)
广东省自然科学基金项目(2019A1515011056)
顺德区核心技术攻关基金项目(2130218003002)。
-
文摘
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律缺乏问题。训练模型获取梅尔频谱,结合预先训练好的声码器转化为音频。实验结果表明,提出的LCTTS模型优于先前提出的SpeedySpeech模型,在Emotional Speech Database数据集上平均意见得分获得2.8%的提升,梅尔倒谱失真测度下降0.15。
-
关键词
语音合成
轻量级卷积
韵律合成
梅尔频谱生成
非自回归方法
深度学习
自然语言处理
-
Keywords
speech synthesis
lightweight convolution
prosodic synthesis
Mel spectrum generation
non-autoregressive methods
deep learning
natural language processing
-
分类号
TP912.33
[自动化与计算机技术]
-
-
题名线性预测系数压缩的研究
被引量:1
- 2
-
-
作者
武凤翔
廉东方
-
机构
华北水利水电学院水利职业学院
-
出处
《河南城建学院学报》
CAS
2011年第2期52-54,共3页
-
文摘
指出了语音识别、说话人识别在利用广泛应用的线性预测技术时,压缩LPC系数的重要意义。在最小均方误差准则下,探讨了将p个LPC系数压缩到q(1<q<p)个系数的原理和方法。最后给出了该方法的计算流程并举例说明。
-
关键词
线性预测
模型
LPC系数
语音识别
-
Keywords
line prediction
model
LPC coefficients
speech verification
-
分类号
TP912.33
[自动化与计算机技术]
-
-
题名基于DM642语音处理系统研究与实现
被引量:3
- 3
-
-
作者
崔丽珍
马勇
王慧琴
-
机构
内蒙古科技大学信息工程学院
-
出处
《通信技术》
2010年第11期67-68,71,共3页
-
文摘
设计了基于DSP的实时语音处理系统,介绍了TMS320DM642与扩展语音编码解码芯片TLV320AIC23B的基本特点,设计了该芯片与TMS320DM642的McASP的连接方式,研究了利用TI的codec驱动程序和数字回声处理算法来实现语音数据的处理,通过不同参数选择实现了语音处理系统,该系统有良好的通用性,能应用于多种音频处理。
-
关键词
DM642芯片
编解码
TLV320AIC23B芯片
实时操作系统
-
Keywords
DM642
CODEC
TLV320AIC23B
DSP/BIOS
-
分类号
TP912.33
[自动化与计算机技术]
-