基于UBM的发音质量评价算法被引量：2

Pronunciation Quality Scoring Algorithm Based on Universal Background Model

下载PDF

导出

摘要将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整旬发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算法。 This paper presents a new algorithm which can assess the pronunciation quality of the English spoken by Chinese students. The new algorithm uses Gaussian Mixture Model（GMM） and Universal Background Model（UBM）, which is successfully used in speaker verification. It calculates the duration normalized log-likelihood ratio of each phone as phonemic pronunciation scores. It combines each phonemic score to obtain the overall pronunciation quality. The algorithm is evaluated by using a corpus of non-native speech. Experimental results show that the approach outperforms other assessment algorithms on correlations with expert scores at the sentence level. In the test database, this method obtaitns high correlation（0.700）.

作者李婧黄双张波

机构地区天津理工大学计算机科学与技术学院南开大学软件学院

出处《计算机工程》 CAS CSCD 北大核心 2008年第22期207-209,共3页 Computer Engineering

关键词全局背景模型对数似然比高斯混合模型发音质量评价 Universal Background Model（UBM） log-likelihood ratio Gaussian Mixture ModeI（GMM） pronunciation quality scoring

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Neumeyer L, Franco H, Digalakis V. Automatic Scoring of Pronunciation Quality[J]. Speech Communication, 2000, 30(2): 83-93.
2Franco H, Neumeyer L, Digalakis V. Combination of Machine Scores for Automatic Grading of Pronunciation Quality[J]. Speech Communication, 2000, 30(2): 121-130.
3Witt S M, Young S J. Phone-level Pronunciation Scoring and Assessment for Interactive Language Learning[J]. Speech Communication, 2000, 30(2): 95-108.
4梁维谦,王国梁,刘加,刘润生.基于音素的发音质量评价算法[J].清华大学学报（自然科学版）,2005,45(1):5-8. 被引量：12
5刘振安,王晋军,孙捷.基于数字串内容识别的用户验证方法研究[J].测控技术,2005,24(9):7-8. 被引量：2
6Reynolds D A, Quatieri T F, Dunn R B. Speaker Verification Using Adapted Gaussian Mixture Models[J]. Digital Signal Processing, 2000, 10(1-3): 19-41.
7Steve Y, Evermann G; Kershaw D. The HTK Book(for HTK Version 3.2)[D]. Cambridge: Engineering Department of Cambridge University, 2002:134-143.

二级参考文献8

1Witt S M.Use of Speech Recognition in Computer—Assisted Language Learning[D].Cambridge:The University of Cambridge,1999.
2Franco H,Neumeyer L,Digalakis V,et al.Combination of machine scores for automatic grading of pronunciation quality[J].Speech Communication,2000,(2—3):121—130.
3Kawai G,Hirose K. A method for measuring the intelligibility and nonnativeness of phone quality in foreign language pronunciation training I-A]. Proceedings of ICSLP[C]. Sydney: IEEE, 1998. 1823- 1826.
4Tomokiyo M L. Recognizing Nonnative Speech :Characterizing and Adapting to Non-native Usage in Speech Recognition [D]. Pittsburgh: Carnegie Mellon University,2001.
5Young S, Evermann G, Kershaw D, et al. The HTK Book(for HTK Version 3.2) [EB/OL]. http: //htk. eng. cam.ae. uk/, 2002.
6Weide R L. The CMU Pronouncing Dictionary [EB/OL].http: //www. speech, cs. cmu. edu/cgi-bin/cmudict, 1998.
7Li Qi, Juang Biing-Hwang, et al. Automatic verbal information verification for user authentication [ J ]. IEEE Trans. on Speech and Audio Processing, 2000,8 (5).
8张玲华,杨震,郑宝玉.基于HMM的说话人辨认系统及其改进[J].电讯技术,2003,43(6):86-89. 被引量：3

共引文献12

1黄骁勇,虞维平.语音识别技术在外语口语学习中的应用[J].计算机系统应用,2006,15(6):18-21. 被引量：6
2刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
3刘庆升,魏思,胡郁,王仁华.基于KLD差的统计错误模式生成算法[J].数据采集与处理,2009,24(1):32-37. 被引量：1
4颜永红.语言声学进展及其应用[J].应用声学,2009,28(2):81-89.
5颜永红.语言声学的最新应用[J].声学学报,2010,35(2):241-247. 被引量：4
6宋寅,梁维谦.区分性模型在英语自动发音评测中的应用[J].清华大学学报（自然科学版）,2010,50(4):503-506.
7黄双,李婧,王洪莹,杨军,张波.基于发音易混淆模型的发音质量评价算法[J].计算机应用,2006,26(S2):287-289.
8杨烁.家校互动英语学习网络平台的建设与应用[J].北京教育学院学报,2012,26(A01):52-56. 被引量：1
9张茹,韩纪庆.一种基于音素模型感知度的发音质量评价方法[J].声学学报,2013,38(2):201-207. 被引量：4
10王玉林,郭帆,余敏.英语口语自动评分系统中发音错误的研究[J].计算机应用与软件,2013,30(6):214-217.

同被引文献20

1赵博,檀晓红.基于语音识别技术的英语口语教学系统[J].计算机应用,2009,29(3):761-763. 被引量：11
2付跃文,杜利民.语音识别错误的分类分析[J].计算机应用,2005,25(2):291-293. 被引量：1
3梁维谦,王国梁,刘加,刘润生.基于音素的发音质量评价算法[J].清华大学学报（自然科学版）,2005,45(1):5-8. 被引量：12
4魏思,刘庆升,胡郁,王仁华.普通话水平测试电子化系统[J].中文信息学报,2006,20(6):89-96. 被引量：24
5刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
6Wang Renhua,Liu Qingfeng,Wei Si. Putonghua proficiency test and e-valuation [ J ] . Advances in Chinese Spoken Language Processing,2006:407-419.
7Akinor Ito, Tomoak Konno,Masashi Ito. Evaluation of English Intona-tion based on Combination of Multiple Evaluation Scores [ C]//INTER-SPEECH, 2009 BRIGHTON :596-599.
8Dr R R. Prentice Hall-Spoken Language Processing, Comegie MellonUniversity[M]. 2001:375 —412.
9Willie Walker, Paul Lamere, Phili Pkwok. A Flexible Open Source Frame-work for Speech Recognition!; R]. SUN MICROSYSTEMS INC ,2001.
10Franco H, Neumeyer L,Digalakis V. Combination of Machine Scoresfor Automatic Grading of Pronunciation Quality [J]. Speech Communi-cation ,2000,30(2).

引证文献2

1王玉林,郭帆,余敏.英语口语自动评分系统中发音错误的研究[J].计算机应用与软件,2013,30(6):214-217.
2刘海清.多参量英语发音质量评价回归模型设计[J].海外英语,2021(20):12-14.

1陈彩华.普通话发音质量评价算法改进研究[J].贵州师范大学学报（自然科学版）,2013,31(6):95-99.
2汤小飞,曾毓敏,李晓伟.基于全局背景模型和辅助模型的说话人确认系统的研究[J].信息化研究,2010,36(2):19-23.
3青山散步.你写我读，助你轻松办公[J].电脑迷,2006,0(3):69-69.
4Kenzo,H 晨阳.未来组装技术中的焊垫／UBM形成技术动向[J].电子计算机,2000(1):59-63.
5梁维谦,赵坤,刘润生.适于嵌入式英语发音评价系统的英美音融合方法[J].清华大学学报（自然科学版）,2009(S1):1344-1348.
6严可,魏思,戴礼荣,刘庆峰.基于音素相关后验概率变换的发音质量评价[J].清华大学学报（自然科学版）,2011,51(9):1205-1208. 被引量：3
7张珑,李海峰,马琳.融合语言学统计特征的韵律发音质量自动评测方法[J].智能计算机与应用,2014,4(5):19-21.
8朱维彬,吕士楠.基于语义的语音合成——语音合成技术的现状及展望[J].北京理工大学学报,2007,27(5):408-412. 被引量：8
9陈楷,吴方劫,李奎,张承学,刘佳,黎洪民.电力物资招投标管理软件系统的设计与开发[J].电力系统装备,2005(6):100-102.
10管宁.来自Ecobuild展会的信息[J].国际木业,2012(6):61-61.

计算机工程

2008年第22期

浏览历史

内容加载中请稍等...

基于UBM的发音质量评价算法被引量：2

参考文献7

二级参考文献8

共引文献12

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于UBM的发音质量评价算法 被引量：2

参考文献7

二级参考文献8

共引文献12

同被引文献20

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于UBM的发音质量评价算法被引量：2