自由表述口语语音评测后验概率估计改进方法被引量：4

Improved Posterior Probability Estimation Methods for the Freely-Spoken Speech Evaluation

下载PDF

导出

摘要该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法。实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5%和1.0%,两种方法融合后相关度绝对提升4.9%;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2%。 Two methods under the deep neural network acoustic modeling framework are proposed to improve the es- timation of posterior probability for evaluation of pronunciation of freely-spoken speech： 1） the posterior probability is re-estimated with more accurate recognition results by employing RNN language model to re-score the N-best candidates produced from the first decoding process; 2） the influence of dialect to posterior probability is taken into account by involving likelihood scores produced by dialect clustered nodes added to deep neural network acoustic model which is re-trained as a multi-lingual style. Experimental results show that these methods increase the correlation （between posterior probabilities and human scores） for 3.5 % and 1.0 % respectively, and the combination of these two methods achieves 4.9% increase. In a real evaluation task, a 2.2% absolute improvement is observed in eorre lation between machine scores and human scores.

作者许苏魁戴礼荣魏思刘庆峰高前勇

机构地区中国科学技术大学语音及语言信息处理国家工程实验室科大讯飞信息股份有限公司

出处《中文信息学报》 CSCD 北大核心 2017年第2期212-219,共8页 Journal of Chinese Information Processing

基金国家自然科学基金(61273264)

关键词自由表述口语语音评测后验概率深度神经网络 RNN语言模型 freely spoken speech pronunciation quality evaluation posterior probability deep neural network RNN language model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1严可,戴礼荣.基于音素评分模型的发音标准度评测研究[J].中文信息学报,2011,25(5):101-108. 被引量：3
2严可,魏思,戴礼荣.针对发音质量评测的声学模型优化算法[J].中文信息学报,2013,27(1):98-107. 被引量：4
3魏思,刘庆升,胡郁,王仁华.普通话水平测试电子化系统[J].中文信息学报,2006,20(6):89-96. 被引量：23
4严可,胡国平,魏思,戴礼荣,李萌涛,杨晓果,冯国栋.面向大规模英语口语机考的复述题自动评分技术[J].清华大学学报（自然科学版）,2009(S1):1356-1362. 被引量：18
5刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14

二级参考文献63

1梁维谦,王国梁,刘加,刘润生.基于音素的发音质量评价算法[J].清华大学学报（自然科学版）,2005,45(1):5-8. 被引量：12
2魏思,刘庆升,胡郁,王仁华.普通话水平测试电子化系统[J].中文信息学报,2006,20(6):89-96. 被引量：23
3刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
4H. L Franco, L. Neumeyer, Y. Kim, O. Ronen. Automatic pronunciation scoring for language instruction [C]//ICASSP 1997: 1465-1468.
5L. Neumeyer, H. Franeo, V. Digalakis, M. Wein- traub. Automatic scoring of pronunciation quality[J]. Speech Communication 30, 2000: 83-93.
6C. Cucchiarini, F. D. Wet, H. Strik, L. Boves. Automatic evaluation of Dutch pronunciation by using speech recognition technology[J]. ICSLP. 1998, 5 : 1739-1742.
7S. M Witt. Use of speech recognition in computer assisted language learning[D]. Doctor's dissertation of Cambridge, Nov. 1999.
8S. M Witt, S,J. Young. Phone-level pronunciation scoring and assessment for interactive language learning [J]. Speech Communication 30, 2000, 95-108.
9C. Cucchiarini, H. Strik, L Boves. Quantitative assessment of second language learners' fluency by means of automatic speech recognition technology[J]. Acoustical Society of America, Feb. 2000, 989-999.
10Qingsheng Liu, Si Wei, et al. The application of phone weight in Putonghua pronunciation quality assessment[J]. ISCSLP 2006.

共引文献42

1万济萍,刘子菡,王玥,刘婉姬,张清涛,辛杰.基于语音识别技术口语自动评测的专利分析[J].电声技术,2012,36(S1):53-56. 被引量：1
2严可,胡国平,魏思,戴礼荣,李萌涛,杨晓果,冯国栋.面向大规模英语口语机考的复述题自动评分技术[J].清华大学学报（自然科学版）,2009(S1):1356-1362. 被引量：18
3吴健.普通话调位调域变体在机辅测试中的处理探讨[J].华中师范大学学报（人文社会科学版）,2013,52(S5):108-113.
4刘庆升,魏思,胡郁,郭武,王仁华.基于语言学知识的发音质量评价算法改进[J].中文信息学报,2007,21(4):92-96. 被引量：14
5汤霖,尹俊勋.普通话声调的客观评测[J].中文信息学报,2007,21(6):116-124. 被引量：4
6潘逸倩,魏思,王仁华.基于韵律信息的连续语流调型评测研究[J].中文信息学报,2008,22(4):88-93. 被引量：4
7陈思宝,胡郁,王仁华.一种结构受限的异方差线性判别分析[J].中文信息学报,2008,22(4):94-99.
8刘庆升,魏思,胡郁,王仁华.基于KLD差的统计错误模式生成算法[J].数据采集与处理,2009,24(1):32-37. 被引量：1
9万济萍,肖云鹏,叶卫平.错音检测及其在语音教学中的应用综述[J].中文信息学报,2009,23(4):95-102. 被引量：4
10张峰,黄超,戴礼荣.普通话发音错误自动检测技术[J].中文信息学报,2010,24(2):110-115. 被引量：3

同被引文献30

1严可,胡国平,魏思,戴礼荣,李萌涛,杨晓果,冯国栋.面向大规模英语口语机考的复述题自动评分技术[J].清华大学学报（自然科学版）,2009(S1):1356-1362. 被引量：18
2操龙升.基于C++与Wiodows设计的计算机辅助英语教学[J].自动化与仪器仪表,2016(5):206-207. 被引量：3
3张亮,尹存燕,陈家骏.基于语义树的中文词语相似度计算与分析[J].中文信息学报,2010,24(6):23-30. 被引量：36
4李艳玲,颜永红.多特征融合的英语口语考试自动评分系统的研究[J].电子与信息学报,2012,34(9):2097-2102. 被引量：10
5罗凯洲,韩宝成.Ordinate与SpeechRater口语自动评分系统评述与启示[J].外语电化教学,2014(4):27-32. 被引量：14
6徐海铭,金燕,王磊.口译水平测评中的语言指标效度研究——以英语专业八级考试中的口译样本为例[J].外语测试与教学,2016(1):1-12. 被引量：3
7戚焱,夏珺.背诵词块对英语写作和口语水平的影响[J].解放军外国语学院学报,2016,39(1):96-103. 被引量：35
8郑通涛,曾小燕.大数据时代的汉语中介语语料库建设[J].厦门大学学报（哲学社会科学版）,2016,66(2):53-63. 被引量：15
9吴诗玉,杨枫.二语词汇语义加工中的“跨词干扰效应”研究[J].外语教学,2016,37(3):45-50. 被引量：4
10范正光,屈丹,闫红刚,张文林.借助音频数据的发音字典新词学习方法[J].西安交通大学学报,2016,50(6):75-82. 被引量：1

引证文献4

1李艺静.人工智能在小学教学中的应用[J].新课程教学（电子版）,2020(9):130-131. 被引量：2
2呼媛玲,寇媛媛.基于音素的英文发音自动评测系统设计[J].自动化与仪器仪表,2018,0(11):160-163.
3李心广,陈帅,龙晓岚.一种面向句子的汉英口语翻译自动评分方法[J].中文信息学报,2021,35(7):54-62. 被引量：2
4许苏魁,万家山,潘敬敏,胡婷婷.基于FullSubNet的单通道实时语音增强算法[J].科学技术创新,2024(9):95-98.

二级引证文献4

1朱正.人工智能在小学科学教学中的应用[J].中小学电教（下）,2021(12):29-30. 被引量：2
2王巍巍,王轲,张昱琪.基于CSE口译量表的口译自动评分路径探索[J].外语界,2022(2):80-87. 被引量：2
3王永东.提高教学效果人工智能走进课堂[J].小学科学,2023(11):28-30.
4肖国亮,马磊,袁峰,郭成锋,邢金宝.智能评分技术应用效果的评价研究[J].中国考试,2023(10):17-27.

1宋阳,王岚.一种自发性口语评测文本语义相似度评分特征提取方法[J].集成技术,2013,2(1):29-34.
2张婷,曾庆鹏,高胜保,肖异瑶.基于时域背离特征分析的托攻击检测算法[J].南昌大学学报（工科版）,2017,39(1):82-87.
3孙德保,高超.一种实用的克服局部极小的BP算法研究[J].信息与控制,1995,24(5):283-287. 被引量：18
4彭敏,席俊杰,代心媛,何炎祥.基于情感分析和LDA主题模型的协同过滤推荐算法[J].中文信息学报,2017,31(2):194-203. 被引量：24
5杨士.CGTN移动新闻网打造数字传播新渠道[J].新疆新闻出版广电,2017,0(1):13-13.
6严可,胡国平,魏思,李萌涛,杨晓果,冯国栋.计算机用于英语背诵题的自动评分技术初探[J].计算机应用与软件,2010,27(7):164-168. 被引量：4
7朴明姬,崔荣一.多语种文本图像中的文字语种辨识方法的研究[J].中文信息学报,2017,31(2):220-225. 被引量：3
8蒙泳行.分布部署系统的文件一致性问题及处理方法[J].电子技术与软件工程,2017(11):174-174. 被引量：1
9胡振涛,张谨,胡玉梅,金勇.基于Metropolis-Hastings采样的多传感器集合卡尔曼滤波算法[J].电子学报,2017,45(4):868-873.
10宋俊芳,宋翔宇,郭晓军,王卫星.构建多部件关系概率模型的车辆检测方法[J].西安电子科技大学学报,2017,44(3):89-95. 被引量：1

中文信息学报

2017年第2期

浏览历史

内容加载中请稍等...

自由表述口语语音评测后验概率估计改进方法被引量：4

参考文献5

二级参考文献63

共引文献42

同被引文献30

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

自由表述口语语音评测后验概率估计改进方法 被引量：4

参考文献5

二级参考文献63

共引文献42

同被引文献30

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

自由表述口语语音评测后验概率估计改进方法被引量：4