摘要
基于词片网格的语音文档主题分类,为了从网格(lattice)多候选中得到语音文档主题分类召回率更高,提出了在lattice音节网格上直接提取词片,并且在处理语音词片的同时,将非负矩阵分解方法引入语音文档主题的分类。该方法避免了语音识别率低所导致的语音文档主题分类准确性的降低。实验结果表明:当N-best的召回率为91.66%时,基于混淆网络的关键词检出系统的召回率为96.67%,当SVD的F1值为83.38%,NMF的F1值为96.944%。
出处
《大众科技》
2010年第1期55-56,共2页
Popular Science & Technology