期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于动态基元选取的真实感可视语音合成系统
1
作者 周密 穆凯辉 陶建华 《系统仿真学报》 CAS CSCD 北大核心 2008年第S1期420-422,426,共4页
伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前... 伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。 展开更多
关键词 可视语音 动态基元拼接 可视韵律 MPEG-4
下载PDF
混合单元选择语音合成系统的目标代价构建 被引量:1
2
作者 蔡文彬 魏云龙 +1 位作者 徐海华 潘林 《计算机工程与应用》 CSCD 北大核心 2018年第24期20-25,共6页
合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对... 合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对目标代价构建进行了探究。实验结果表明,经过相似语料训练后微调的深度声学网络模型,预测的瓶颈特征更能表征拼接基元特性,从而指导目标代价筛选理想候选单元,提高合成语音的质量。 展开更多
关键词 语音合成 目标代价 声学特征 声学模型 拼接基元
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部