-
题名基于声学音素向量和孪生网络的二语者发音偏误确认
被引量:3
- 1
-
-
作者
王振宇
解焱陆
张劲松
-
机构
北京语言大学语言资源高精尖创新中心
-
出处
《中文信息学报》
CSCD
北大核心
2019年第4期127-134,共8页
-
基金
国家社会科学基金(18BYY124)
语言资源高精尖创新中心项目(KYR17005)
+2 种基金
国家语委科研项目(ZDI135-51)
北京语言大学梧桐创新平台项目(中央高校基本科研业务费专项资金)(16PT05)(18YJ030004)
北京语言大学研究生创新基金(17YCX139)
-
文摘
随着自动大规模语音识别的不断发展,以自动语音识别为基础的计算机辅助发音教学也随之进步,作为传统教学方法的补充,它极大地弥补了传统教育资源不足以及传统教育方法无法及时给学习者反馈的缺陷。二语学习者的发音偏误确认和评价在计算机辅助发音训练中是较为重要的研究课题之一。针对二语者发音偏误的确认任务中缺少二语偏误发音标注问题,该文提出了一种基于声学音素向量和孪生网络的方法,将带有配对信息的成对的语音特征作为系统输入,通过神经网络将语音特征映射到高层表示,期望将不同的音素区分开。训练过程引入了孪生网络,依照输出的两个音素向量是否来自于同一类音素来调整和优化输出向量之间的距离,并通过相应的损失函数实现优化过程。结果表明使用基于余弦最大间隔距离损失函数的孪生网络获得了89.93%的准确率,优于实验中其它方法。此方法应用在发音偏误确认任务时,不使用标注的二语发音偏误数据训练的情况下,也获得了89.19%的诊断正确率。
-
关键词
发音偏误确认
音素向量
孪生网络
-
Keywords
mispronunciations verification
phone embedding
Siamese networks
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-