-
题名基于统计声学模型的单元挑选语音合成算法
被引量:8
- 1
-
-
作者
凌震华
王仁华
-
机构
中国科学技术大学电子工程与信息科学系讯飞语音实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第3期280-284,共5页
-
基金
国家自然科学基金项目(No.60475015)
国家863计划项目(No.AA2100060005)资助
-
文摘
提出一种基于统计声学模型的单元挑选语音合成算法.在模型训练阶段,首先提取语料库中语音数据的频谱、基频等声学参数,结合语料库中的音段和韵律标注来估计各上下文相关音素对应的统计声学模型,使用的模型结构为隐马尔柯夫模型.在合成阶段,以使目标合成句对应的声学模型具有最大的似然值输出为准则,来进行最佳合成单元的挑选,最后通过平滑连接各备选单元波形来生成合成语音.以此算法为基础,构建一个以声韵母为基本拼接单元的中文语音合成系统,并通过测听实验证明此算法相对传统算法在提高合成语音自然度上的有效性.
-
关键词
语音合成
单元挑选
统计声学模型
隐马尔柯夫模型(HMM)
最大似然准则
-
Keywords
Speech Synthesis, Unit Selection, Statistical Acoustic Model, Hidden Markov Model (HMM) , Maximum Likelihood Criterion
-
分类号
TN912.33
[电子电信—通信与信息系统]
-
-
题名藏语语音合成系统的关键技术研究
- 2
-
-
作者
刘芳
-
机构
西藏大学藏文信息技术研究中心
-
出处
《西藏大学学报(社会科学版)》
CSSCI
2016年第5期87-91,共5页
-
基金
2015年度西藏自治区自然科学基金项目"基于统计声学建模的藏语语音合成技术研究"阶段性成果
项目号:2015ZR-14-12
-
文摘
文章根据藏语的语音规律和特点,以统计声学模型为基础,对藏语语音合成系统中的语料库设计与建设、韵律信息及标注、模型设计与训练及语音合成等关键技术进行了分析,对藏语语音合成系统的实现具有一定的参考价值。
-
关键词
藏语
语音合成
统计声学模型
-
Keywords
Tibetan
speech Synthesis
statistical acoustic model
-
分类号
TN912.33
[电子电信—通信与信息系统]
-