期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于CNN-GRU-CTC的藏族学生普通话发音偏误检测 被引量:1
1
作者 梁青青 周小燕 赵春艳 《兰州文理学院学报(自然科学版)》 2023年第5期47-51,共5页
为了提高藏族学生学习普通话的发音水平,根据普通话和藏语发音特点设计并录制了一个偏误语音语料库,并结合卷积神经网络(Convolutional Neural Network,CNN)、门控循环单元(Gated Recurrent Unit,GRU)技术和连接时序分类技术(Connection... 为了提高藏族学生学习普通话的发音水平,根据普通话和藏语发音特点设计并录制了一个偏误语音语料库,并结合卷积神经网络(Convolutional Neural Network,CNN)、门控循环单元(Gated Recurrent Unit,GRU)技术和连接时序分类技术(Connectionist Temporal Classification,CTC)搭建CNN-GRU-CTC声学模型,提出了一种发音偏误检测的方法.该方法将语音转换为一张图像作为输入,对完整的语谱图进行数据提取,利用深度全序列卷积神经网络进行建模,使用自动语音识别框架来进行发音偏误检测.实验结果表明:在该模型下,系统检测准确率为88.55%,错误拒绝率为7.16%,联合错误率为14.94%.该方法可以有效检测出错误发音,性能优于其他模型,可以用于检测和纠正藏族学生学习普通话时的错误发音,提高藏族学生的普通话发音水平. 展开更多
关键词 发音偏误检测 卷积神经网络 门控循环单元 连接时序分类
下载PDF
基于DFCNN-CTC端到端的藏族学生普通话发音偏误检测 被引量:8
2
作者 甘振业 周世华 +1 位作者 曾浩 杨鸿武 《西北师范大学学报(自然科学版)》 CAS 北大核心 2020年第5期49-53,108,共6页
计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist tem... 计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist temporal classification,CTC)技术,建立了一种用于发音偏误检测和诊断任务的端到端语音识别方法.该方法不需要音位信息,也不需要强制对齐,以扩展声韵母为偏误基元,设计了64种偏误类型.实验结果表明,该方法能够有效地检测出错误发音,检测正确率为87.07%,错误拒绝率为7.83%,错误接收率为25.97%. 展开更多
关键词 发音偏误检测 卷积神经网络 链接时序分类 端到端
下载PDF
发音属性优化建模及其在偏误检测中的应用
3
作者 郭铭昊 解焱陆 《中文信息学报》 CSCD 北大核心 2022年第1期163-172,共10页
近年来,发音属性常常被用于计算机辅助发音训练系统(CAPT)中。该文针对使用发音属性的一些难点,提出了一种建模细颗粒度发音属性(FSA)的方法,并在跨语言属性识别、发音偏误检测中进行测试。最终,得到了最优平均识别准确率约为95%的属性... 近年来,发音属性常常被用于计算机辅助发音训练系统(CAPT)中。该文针对使用发音属性的一些难点,提出了一种建模细颗粒度发音属性(FSA)的方法,并在跨语言属性识别、发音偏误检测中进行测试。最终,得到了最优平均识别准确率约为95%的属性检测器组;在两个二语测试集上的偏误检测表明,相比基线,基于FSA的方法均获得了超过1%的性能提升。此外,还根据发音属性的跨语言特性设置了对照实验,并在上述任务中测试和分析。 展开更多
关键词 发音属性 偏误检测 属性识别
下载PDF
基于DNN的发音偏误趋势检测 被引量:7
4
作者 张劲松 高迎明 解焱陆 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第11期1220-1225,共6页
正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)... 正音反馈的计算机辅助对外汉语发音训练系统已有发音偏误趋势的标注体系和基于HMM的偏误趋势检测系统。为了进一步提高系统的性能,该文应用深度神经网络进行声学建模,比较Mel频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)、感知线性预测分析系数(perceptual linear predictive analysis,PLP)和Mel滤波器组系数(Mel filter bank,FBank)3种声学特征参数,并利用网格联合技术整合3种声学特征所得的候选网格。实验结果表明:DNN-HMM模型比GMM-HMM实现了更高检测正确率。针对不同发音偏误趋势,3种声学特征有不同表现,联合系统取得最高性能,最终性能为:错误拒绝率5.5%,错误接受率35.6%,检测正确率88.6%。 展开更多
关键词 计算机辅助发音训练 发音偏误检测 深度神经网络
原文传递
Randomly Weighted LAD-Estimation for Partially Linear Errors-in-Variables Models
5
作者 Xiaohan YANG Rong JIANG Weimin QIAN 《Chinese Annals of Mathematics,Series B》 SCIE CSCD 2015年第4期561-578,共18页
The authors consider the partially linear model relating a response Y to predictors (x, T) with a mean function x^Tβ0 + g(T) when the x's are measured with an additive error. The estimators of parameter β0 are... The authors consider the partially linear model relating a response Y to predictors (x, T) with a mean function x^Tβ0 + g(T) when the x's are measured with an additive error. The estimators of parameter β0 are derived by using the nearest neighbor-generalized randomly weighted least absolute deviation (LAD for short) method. The resulting estimator of the unknown vector 30 is shown to be consistent and asymptotically normal. In addition, the results facilitate the construction of confidence regions and the hypothesis testing for the unknown parameters. Extensive simulations are reported, showing that the proposed method works well in practical settings. The proposed methods are also applied to a data set from the study of an AIDS clinical trial group. 展开更多
关键词 Partially linear errors-in-variables LAD-estimation Randomly weighted method Linear hypothesis Randomly weighted LAD-test
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部