期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
结合轻量卷积的非自回归语音合成方法
1
作者 钟巧霞 曾碧 +1 位作者 林镇涛 林伟 《计算机工程与设计》 北大核心 2024年第4期1166-1172,共7页
对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律... 对如何有效捕捉音素之间的关联及如何合成韵律丰富的音频进行研究,提出一种结合轻量卷积的非自回归语音合成模型LCTTS。引入轻量卷积建立起音素之间的联系,解决发音出错问题。通过添加音高和能量预测器预测生成语音的韵律,解决音频韵律缺乏问题。训练模型获取梅尔频谱,结合预先训练好的声码器转化为音频。实验结果表明,提出的LCTTS模型优于先前提出的SpeedySpeech模型,在Emotional Speech Database数据集上平均意见得分获得2.8%的提升,梅尔倒谱失真测度下降0.15。 展开更多
关键词 语音合成 轻量级卷积 韵律合成 梅尔频谱生成 非自回归方法 深度学习 自然语言处理
下载PDF
线性预测系数压缩的研究 被引量:1
2
作者 武凤翔 廉东方 《河南城建学院学报》 CAS 2011年第2期52-54,共3页
指出了语音识别、说话人识别在利用广泛应用的线性预测技术时,压缩LPC系数的重要意义。在最小均方误差准则下,探讨了将p个LPC系数压缩到q(1<q<p)个系数的原理和方法。最后给出了该方法的计算流程并举例说明。
关键词 线性预测 模型 LPC系数 语音识别
下载PDF
基于DM642语音处理系统研究与实现 被引量:3
3
作者 崔丽珍 马勇 王慧琴 《通信技术》 2010年第11期67-68,71,共3页
设计了基于DSP的实时语音处理系统,介绍了TMS320DM642与扩展语音编码解码芯片TLV320AIC23B的基本特点,设计了该芯片与TMS320DM642的McASP的连接方式,研究了利用TI的codec驱动程序和数字回声处理算法来实现语音数据的处理,通过不同参数... 设计了基于DSP的实时语音处理系统,介绍了TMS320DM642与扩展语音编码解码芯片TLV320AIC23B的基本特点,设计了该芯片与TMS320DM642的McASP的连接方式,研究了利用TI的codec驱动程序和数字回声处理算法来实现语音数据的处理,通过不同参数选择实现了语音处理系统,该系统有良好的通用性,能应用于多种音频处理。 展开更多
关键词 DM642芯片 编解码 TLV320AIC23B芯片 实时操作系统
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部