摘要
为了更准确地估计状态聚类前有调三音子的模型参数,从而提高聚类后捆绑状态的精度及系统的识别性能,针对汉语连续语音识别中,有些有调三音子的训练样本数非常少,而其对应的无调三音子的训练样本数相对较多的情况,提出用其对应的无调三音子的模型参数进行初始化,并用最大后验概率准则训练模型。汉语大词汇量连续语音识别实验表明,该方法可以提高训练语料中稀疏三音子聚类前的模型精度,从而提高系统的识别性能。
In order to estimate toned triphone' s model parameters accurately before state clustering and increase recognition rate, this paper used the corresponding toneless triphone model parameters for the initialization of toned triphones, and applied the maximum a posteriori criterion for model estimation. In the experiment of mandarin large vocabulary continuous speech recognition, this method can improve the accuracy of sparse triphone' s model in the training corpus before clustering and a- chieve certain increase of recognition rate.
出处
《计算机应用研究》
CSCD
北大核心
2013年第10期2920-2922,共3页
Application Research of Computers
基金
国家自然科学基金资助项目(10925419,90920302,61072124,1107427511161140319,91120001,61271426)
中国科学院战略性先导科技专项资助项目(XDA06030100,XDA06030500)
国家“863”计划资助项目(2012AA012503)
中国科学院重点部署项目(KGZD-EW-103-2)
关键词
决策树聚类
三音子模型
声韵母
最大后验概率
decision tree-based clustering
triphone model
initials and finals
maximum a posteriori(MAP)