-
题名发音错误检测中基于多数据流的Tandem特征方法
被引量:1
- 1
-
-
作者
袁桦
蔡猛
赵军红
张卫强
刘加
-
机构
清华大学电子工程系
清华信息科学与技术国家实验室(清华大学)
中国科学院电子学研究所
传感技术国家重点实验室(中国科学院)
中国科学院大学
-
出处
《计算机应用》
CSCD
北大核心
2014年第6期1694-1698,共5页
-
基金
国家自然科学基金资助项目(61370034
61273268
+1 种基金
61005019
61105017)
-
文摘
针对发音错误检测中标注的发音数据资源有限的情况,提出在Tandem系统框架下利用其他数据来提高特征的区分性。以中国人的英语发音为研究对象,选取了相对容易获取的无校正发音数据、母语普通话和母语英语作为辅助数据,实验结果表明,这几种数据都能够有效地提高系统性能,其中无校正数据表现出最好的性能。同时,比较了不同的扩展帧长,以多层神经感知(MLP)和深度神经网络(DNN)作为典型的浅层和深层神经网络,以及Tandem特征的不同结构对系统性能的影响。最后,多数据流融合的策略用于进一步提高系统性能,基于DNN的无校正发音数据流和母语英语数据流合并的Tandem特征取得了最好的性能,与基线系统相比,识别正确率提高了7.96%,错误类型诊断正确率提高了14.71%。
-
关键词
发音错误检测
Tandem特征
发音规则
深度神经网络(DNN)
多层神经感知(MLP)
-
Keywords
mispronunciation detection
Tandem feature
phonological rule
Deep Neural Network (DNN)
Multi-Layer Perception (MLP)
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-