摘要
基于隐马尔可夫模型(HMM)的藏语语音合成系统中,语料数据的标注是训练声学模型的基础和关键。文章结合藏语独有的语音特点对语料数据设计套标注规则,并以Praat为标注环境实现语料的标注。
Annotation of corpus data is the baseline and key for the training acoustic model in HMM based synthesis system of Tibetan speech. In the present paper, a rule of annotation for corpus data designed by using Praat as annotation condition combining with the characteristics of Tibetan speech.
基金
2011年度国家自然科学基金项目"藏语依存树库的构建"(项目号:61163043)
2011年度西藏自治区一般科技计划项目"基于语料库的藏语词汇计量研究"阶段性成果
关键词
藏语语音合成
语料数据
标注规则
Tibetan speech synthesis
Corpus data
Annotation rule