普通话发音评估性能改进被引量：2

Improvements on Mandarin Pronunciation Evaluation

下载PDF

导出

摘要为减少噪声环境对评估性能的影响,该文将PNCC参数引入普通话发音评估。结果表明,其评分相关性在普通话测试实录音数据库上较传统MFCC参数提高了6.6%。在此基础上,对汉语声学模型拆分方法进行了研究,提出将声母介音+韵母模型拆分方法应用到发音评估中。使用这种拆分方式的评估系统总错误率降低5.6%,专家打分相关性则提高了0.056。该文还对模型最佳状态数的选取进行讨论,并提出模型状态数混合和不同配置综合评分两种混合评分方案,在相关性上较同等条件下3状态模型分别提高了0.021和0.017。 In this paper, PNCC（Power-Normalized Cepstral Coefficients） is introduced into Mandarin pronunciation evaluation system for reducing the impact of background noise. The result shows that the score correlation based on PNCC has been increased by 6.6% compared with classical MFCC. Then, different initial-final acoustic model structures for Chinese syllables are investigated on Mandarin pronunciation evaluation. An initial-medial and final （IMF） modeling is applied, resulting 5.6% reduction of the error rate and an increase of 0. 056 score correlation. Finally, the number of states in HMM model is discussed for pronunciation scoring, and some mixed score compu- ting schemes based on either models or scores are proposed. Test results show the score correlation with the experts has been increased by 0. 021 and 0. 017 respectively.

作者齐欣肖云鹏叶卫平

机构地区北京师范大学信息科学与技术学院武汉烽火通信科技股份有限公司

出处《中文信息学报》 CSCD 北大核心 2013年第3期48-55,共8页 Journal of Chinese Information Processing

基金 2010年北京师范大学自主科研基金项目资助 2010年北京师范大学教学建设与改革项目资助

关键词发音评估 PNCC 模型拆分 HMM状态数 mandarin pronunciation evaluation PNCC~ initial-medial and final HMM states

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1S M Witt. Use of Speech Recognition in Computer as- sisted Language Learning[D]. PhD Thesis, the Uni-.versity of Cambridge, Nov. 1999.
2H Strik, K Truong, et al. Comparing different ap- proaches for automatic pronunciation error detection [J]. Speech Communication, 2009, 51(10): 845-852.
3K Truong, A Neri, C Cucchiarini, et al. Automatic pronunciation error detection: an acoustic-phonetic ap- proach[C]//Proceedings of the InSTIL/ICALL Sym posium 2004. Venice, Italy: 2004: 135-138.
4A Neri, C Cucchiarini, W Strik. Automatic speech recognition for second language learning how and why it actually works[C]//Proceedings of the 15th Interna- tional Congresses of Phonetic Sciences. Barcelona, Spanish: 2003: 1157-1160.
5刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
6葛凤培,潘复平,董滨,颜永红.汉语发音质量评估的实验研究[J].声学学报,2010,35(2):261-266. 被引量：12
7张峰,黄超,戴礼荣.普通话发音错误自动检测技术[J].中文信息学报,2010,24(2):110-115. 被引量：3
8Kim Chanwoo. Robust Speech Recognition Motivated by Auditory and Binaural Observations[D]. Depart- ment of Language Technologies Institute, Carnegie Mellon University, Ph D. thesis, July 2009.
9H I. Wang, J Q Han, T R Zheng. Quality evaluation and optimization of confusion network for LVCSR[J].中国科学院电子学报合集,1994-2007.
10L Mangu, E Brill, A Stolcke. Finding consensus in speech recognition., word error minimization and oth- er applications of confusion networks[J]. In Comput- er, Speech and Language, 2000,14(4): 373-400.

二级参考文献60

1栗治国.伊盟方言的“分音词”[J].方言,1991(3):206-210. 被引量：24
2梁玉璋.福州方言的“切脚词”[J].方言,1982,4(1):37-46. 被引量：30
3梁维谦,王国梁,刘加,刘润生.基于音素的发音质量评价算法[J].清华大学学报（自然科学版）,2005,45(1):5-8. 被引量：12
4邢向东.神木方言的代词[J].方言,2001,23(4):355-364. 被引量：21
5徐秉铮,邱伟.汉语普通话声母的分类与识别[J].中文信息学报,1993,7(1):33-39. 被引量：5
6魏思,刘庆升,胡郁,王仁华.普通话水平测试电子化系统[J].中文信息学报,2006,20(6):89-96. 被引量：23
7董滨,赵庆卫,颜永红.基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究[J].声学学报,2007,32(2):122-128. 被引量：16
8Bernstein Jared, Najmi Ami, Ehsani Farzad. Subrashii: Encounters in Japanese Spoken Language Education. CALICO Journal, 1999; 16(3): 361-384.
9Kawai Goh, Hirose Keikichi. A call system using speech recognition to train the pronunciation of Japanese long vowels, the mora nasal and mora obstruents. EUROSPEECH. 1997:657-660.
10Kazunori Imoto, Yasushi Tsubota et al. Modeling and automatic detection of English sentence stress for computer- assisted English prosody learning system. ICSLP, 2002: 749-752.

共引文献58

1贾珈,蔡莲红,李明,张帅.汉语普通话与沈阳方言转换的研究[J].清华大学学报（自然科学版）,2009(S1):1309-1315. 被引量：7
2严可,胡国平,魏思,戴礼荣,李萌涛,杨晓果,冯国栋.面向大规模英语口语机考的复述题自动评分技术[J].清华大学学报（自然科学版）,2009(S1):1356-1362. 被引量：18
3张辉,杜利民.汉语连续语音识别中不同基元声学模型的复合[J].电子与信息学报,2006,28(11):2045-2049. 被引量：7
4潘玉春,徐明星,贾培发.面向情感语音识别的建模方法研究[J].计算机科学,2007,34(1):163-165. 被引量：1
5方贵明.汉语拼音的短韵母编码与汉字输入[J].中文信息学报,2007,21(1):74-78.
6何珏,刘加.基于汉语语音音位的HMM建模方法[J].清华大学学报（自然科学版）,2007,47(4):518-521. 被引量：1
7吴彬.介音的归属[J].科教文汇,2008(2):175-175.
8崔文迪,黄关维.语音识别综述[J].福建电脑,2008,24(1):28-29. 被引量：7
9鄢志杰,胡郁,王仁华.一种基于区分性准则的模型结构优化方法[J].中文信息学报,2008,22(2):99-105. 被引量：1
10孙成立,刘刚,郭军.中文语音确认中子词置信度性能的研究[J].中文信息学报,2008,22(2):106-109. 被引量：2

同被引文献32

1艾伦,王陆,张鸽.汉语标准普通话水平训练和自动测试系统[J].中国电化教育,2004(7):78-80. 被引量：3
2孙景涛.介音在音节中的地位[J].语言科学,2006,5(2):44-52. 被引量：13
3何珏,刘加.汉语连续语音中HMM模型状态数优化方法研究[J].中文信息学报,2006,20(6):83-88. 被引量：7
4顾明亮,马勇.基于高斯混合模型的汉语方言辨识系统[J].计算机工程与应用,2007,43(3):204-206. 被引量：9
5李净,徐明星.汉语连续语音识别中声学模型基元比较:音节、音素、声韵母[C].第六届全国人机语音通信会议,20014:267-280.
6Maxine Eskenazi. An overview o{ spoken language technology for education [J]. M Eskenazi Speech Communication, 2009, 51(4):832.
7何怡.错音检测技术在计算机辅助普通话发音教学系统中的应用研究[D].北京:北京师范大学,2013.
8Hinton G, Li Deng, Dong Yu. Deep neural networks for acoustic modeling in speech recognition the shared views of four research groups[J]. Proc IEEE, 2012,29(6).84.
9Chen Mingming,Yang Zhanlei , Liu Wenju. Deep natural network for madarin tone recognition[J]. Proc IJCNN, 2014,6889515 : 1154.
10Lawrence Rabiner, Biing Hwang Juang. Fundamentals ofspeech recognition[M]. America. Prentice Hall, 1993:22.

引证文献2

1董丽娜,何怡,叶卫平.基于小波分析的梅尔频率倒谱参数[J].北京师范大学学报（自然科学版）,2015,51(5):469-474. 被引量：2
2廖俐.复杂环境下的计算机辅助普通话测试系统设计[J].现代电子技术,2021,44(1):149-152. 被引量：3

二级引证文献5

1邓勇,于晨松,文浩.基于倒谱和决策树的模拟电路故障诊断[J].电子测量与仪器学报,2017,31(3):430-435. 被引量：10
2刘国华,周文斌.基于卷积神经网络的脉搏波时频域特征混叠分类[J].吉林大学学报（工学版）,2020,50(5):1818-1825. 被引量：5
3黄悦.基于MCGS的计算机控制系统应用与研究[J].现代工业经济和信息化,2021,11(4):107-108. 被引量：1
4王晨霞.普通话计算机智能测试替代人工测试的思考[J].电子技术与软件工程,2021(13):144-145. 被引量：1
5文丽萍.噪声环境下基于小波变换的普通话智能测试系统设计[J].自动化与仪器仪表,2023(5):153-157.

1章伟,蔡亚楠,杨为民.基于任务规划的家庭仿真服务机器人的研究[J].电脑知识与技术（过刊）,2016,22(6X):188-191. 被引量：1
2杜少杰.基于双表式存储的Excel操作题自动评分方案及其实现[J].滨州职业学院学报,2007,0(4):73-76.
3万济萍,肖云鹏,叶卫平.错音检测及其在语音教学中的应用综述[J].中文信息学报,2009,23(4):95-102. 被引量：4
4曾帅,王中莹.关于《通信软件基础》课程评分方案的思考与设计[J].现代计算机,2016,22(13):9-11.
5董滨,丁铭,王磊,颜永红.面向双语教学的维吾尔语发音质量自动评估[J].中国科学：信息科学,2015,45(10):1328-1340.
6<PSC现代化管理及信息库建设>课题组.B/S模式的PSC现代化管理系统的构建[J].吉林工程技术师范学院学报,2005,21(3):46-48.
7王士进,李宏言,柯登峰,李鹏,高鹏,徐波.面向第二语言学习的口语大规模智能评估技术研究[J].中文信息学报,2011,25(6):142-148. 被引量：7
8王孟杰,孟子厚.基于区别特征检测的汉语韵母分类[J].电声技术,2011,35(9):38-41.
9文必龙,姚俊名,刘红林.基于UML的石化MES业务模型[J].科学技术与工程,2011,11(13):3078-3081. 被引量：1
10乃力,胡万荣.巧学五笔字型输入法[J].家长,1997,0(2):30-31.

中文信息学报

2013年第3期

浏览历史

内容加载中请稍等...

普通话发音评估性能改进被引量：2

参考文献20

二级参考文献60

共引文献58

同被引文献32

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

普通话发音评估性能改进 被引量：2

参考文献20

二级参考文献60

共引文献58

同被引文献32

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

普通话发音评估性能改进被引量：2