摘要
在语音识别系统中,语言模型是其中不可或缺的,以先验概率的形式发挥重要作用.而在大词汇量非特定人的连续语音识别中,又以基于统计的语言模型应用最为广泛.研究首先讨论基于词的语言模型和基于词类的语言模型的统计计算方法,然后针对互联网上的新闻、科技、小说等题材的语料使用HTK语言模型工具采用以上两种方法构建一个面向语音识别的语言模型.实验结果表明,该语言模型比单独的基于词的和基于词类的语言模型有更高的性能.
出处
《昆明理工大学学报(理工版)》
2005年第z1期401-404,共4页
Journal of Kunming University of Science and Technology(Natural Science Edition)