-
题名基于音素混淆网络的蒙古语语音关键词检测方法的研究
- 1
-
-
作者
飞龙
高光来
鲍玉来
-
机构
内蒙古大学计算机学院
内蒙古大学图书馆
-
出处
《中文信息学报》
CSCD
北大核心
2015年第1期178-182,共5页
-
基金
国家自然科学基金(61263037
71163029)
+1 种基金
内蒙古自然科学基金(2014BS0604)
内蒙古大学高层次人才引进科研项目
-
文摘
蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多。为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法。实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题。蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升。
-
关键词
蒙古语
关键词检测
集外词
混淆网络
音素混淆矩阵
-
Keywords
Mongolian
spoken term detection
Out-o{-Vocabulary word
confusion network
phoneme confusion matrix
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名新疆非母语汉语语音识别中的字典自适应技术
- 2
-
-
作者
李兵虎
黄浩
-
机构
新疆大学信息科学与工程学院多语种信息实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第21期141-144,216,共5页
-
基金
国家自然科学基金No.60965002
新疆高校科研计划培育基金(No.XJEDU2008S15)
新疆大学博士科研启动基金(No.BS090143)~~
-
文摘
将标准普通话语音数据训练得到的声学模型应用于新疆维吾尔族说话人非母语汉语语音识别时,由于说话人的普通话发音存在较大偏误,将导致识别率急剧下降。针对这一问题,将多发音字典技术应用于新疆维吾尔族说话人汉语语音识别中,通过统计分析识别器的识别错误,建立音素混淆矩阵,获取音素的发音候选项。利用剪枝策略对发音候选项进行剪枝整合,扩展出符合维吾尔族说话人汉语发音规律的替代字典。对三种剪枝方法产生的发音字典的识别结果进行了对比。实验结果表明,使用相对最大剪枝策略产生的发音字典可以显著提高系统识别率。
-
关键词
发音字典
音素混淆矩阵
剪枝策略
新疆维吾尔族说话人
非母语汉语语音识别
-
Keywords
pronunciation dictionary
phoneme confusion matrix
pruning strategy
Uighur speakers in Xinjiang
non-native Mandarin speech recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-