-
题名维吾尔语三音素决策树的欠拟合调优
- 1
-
-
作者
阿依先木.卡得尔
邱自成
-
机构
塔里木大学人文学院
塔里木大学信息工程学院
-
出处
《塔里木大学学报》
2018年第2期98-108,共11页
-
基金
塔里木大学校长基金博士项目(TDZKJC201604)
-
文摘
三音素决策树为声学模型生成上下文相关的识别单元,是影响声学模型性能的关键技术。为了有效降低维吾尔语语音识别的词错误率,分别从基线系统的总体结构、三音素决策树模型的构建和训练流程、以及决策树构建算法本身三个不同的层次和视角,结合维吾尔语语音识别在发音音素标注集、根节点文件配置等方面的特点,拟定三音素决策树相关参数的调优方案。增加最大叶子数使决策树的分裂更充分,增大总高斯数,使每个叶子节点所对应的高斯混合模型精度更高,从而提升声学模型的性能。实验结果表明,通过提高最大叶子数和总高斯数,在基线系统的典型配置条件下,使词错误率下降13.1%。
-
关键词
维吾尔语
三音素
决策树
语音识别
-
Keywords
Uyghur
triphone
decision tree
automatic speech recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-