-
题名基于动态基元选取的真实感可视语音合成系统
- 1
-
-
作者
周密
穆凯辉
陶建华
-
机构
中科院自动化所模式识别国家重点实验室
-
出处
《系统仿真学报》
CAS
CSCD
北大核心
2008年第S1期420-422,426,共4页
-
基金
自然科学基金具有表现力的可视语音合成的研究(60575032)
-
文摘
伴有说话者面部表情及唇动的文本-可视语音转换系统(TTVS)能够大大增强人机交互的生动性和真实感。结合当前主要的两类TTVS技术,利用数据驱动法中的动态基元拼接获得参数序列,驱动MPEG-4人脸动画模型,在保留灵活性和可移植性等优点的前提下,以较小的数据量,获得了较为生动的效果,形成了具有较高真实感的中文可视语音合成系统。
-
关键词
可视语音
动态基元拼接
可视韵律
MPEG-4
-
Keywords
visual-speech synthesize
dynamic unit mapping
visual prosody
MPEG-4
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名混合单元选择语音合成系统的目标代价构建
被引量:1
- 2
-
-
作者
蔡文彬
魏云龙
徐海华
潘林
-
机构
福州大学物理与信息工程学院
南洋理工大学Temasek实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2018年第24期20-25,共6页
-
基金
福建省科技重大项目(No.2017H6009)
-
文摘
合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对目标代价构建进行了探究。实验结果表明,经过相似语料训练后微调的深度声学网络模型,预测的瓶颈特征更能表征拼接基元特性,从而指导目标代价筛选理想候选单元,提高合成语音的质量。
-
关键词
语音合成
目标代价
声学特征
声学模型
拼接基元
-
Keywords
speech synthesis
target cost
acoustic features
acoustic models
concatenate unit
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-