一种基于模式发现的语种识别方法

Language Recognition Based on Pattern Discovery

下载PDF

导出

摘要针对不同语种中"语音模式"搭配关系不同的特点,提出一种基于"语音模式"发现的语种识别方法。首先采用无标注语音数据训练GMM模型,实现"语音模式"发现,获得每一帧语音在各"语音模式"下的后验概率,确定"语音模式"的边界;然后采用n-gram的方法统计每段语音中"语音模式"的搭配关系,并以"语音模式"的联合概率描述搭配关系;最后以SVM为分类器实现语种识别。实验的测试语料为NIST2003和NIST2007,针对英语、日语、汉语3个语种进行实验,结果表明在语音时长分别为3 s、10 s、30 s时的等错误率分别可达到0.14%、0.14%、0.49%。 In this paper a language recognition method based on speech pattern discovery is pro- posed, aiming to use the context information of speech patterns. Firstly, a Gaussian mixture model （GMM） is trained using unlabeled data to find the speech patterns. Then the posterior probability of each speech pattern is obtained and used to determine the segment. Secondly, the method of u-gram is used to get speech patterns＇ matching relations of each speech pattern and the joint posterior prob- ability is used to describe the relations. Finally, language recognition is done with a support vector machine （SVM）. The method is tested on NIST2003 and NIST2007 in English, Japanese and Mandarin three languages. Experiments show that the equal error rate reaches 0.14% ,0.14% ,0.49% in 3 s,10 s, 30 s.

作者关娜娜张连海 GUAN Nana, ZHANG Lianhai(Information Engineering University, Zhengzhou 450001 , China)

机构地区信息工程大学

出处《信息工程大学学报》 2018年第1期52-56,共5页 Journal of Information Engineering University

基金中电54所项目

关键词语种识别无监督模式发现 n-grm language recognition unsupervised pattern discovery n-gram

分类号 TP317.4 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1屈丹,王炳锡,藏传辉.基于GMM区分性训练方法的语言辨识系统[J].计算机工程与应用,2004,40(6):108-110. 被引量：4

二级参考文献6

1[1]Y K Muthusamy,E Barnard,R A Cole. Reviewing Automatic Language Identification[J].IEEE Signal Processing Magazine,1994-10
2[2]M A Zissman. Comparison of four approaches to automatic language identification of telephone speech[J].IEEE Trans Speech Audio Processing, 1996 ;4: 31～44
3[3]D A Reynolds,R C Rose. Rosust text-independence speaker identification using Gaussian mixture speaker models[J].IEEE Trans Speech Audio Processing, 1995 ;3( 1 ) :72～83
4[4]W H Tsai,W W Chang. Discriminative training of Gaussian mixture bigram models with applications to Chinese dialect identification[J].Speech Communication, 2002; 36: 317～326
5[5]B H Juang,W Chou,C H Lee. Minimum classification error rate methods for speech recognition[J].IEEE Trans Speech Audio Processing,1997; 5: 257～265
6[6]Y K Muthusamy,R A Cole,B T Oshika. The OGI Multi-language telephone speech corpus[R].Technical report,Center for Spoken Language Understanding Oregon Graduate Institute of Science and Technology, Portland, 1993

共引文献3

1顾明亮,马勇.基于高斯混合模型的汉语方言辨识系统[J].计算机工程与应用,2007,43(3):204-206. 被引量：9
2张文林,李弼程,屈丹.基于SVM-UBM的语言辨识系统[J].计算机工程与应用,2007,43(10):41-43.
3张文林,屈丹,李弼程,王波,王炳锡.一种基于段级特征和自动标识的语言辨识算法[J].信号处理,2008,24(4):655-658.

1肖思男,吕震宙,王薇.不确定性结构全局灵敏度分析方法概述[J].中国科学：物理学、力学、天文学,2018,48(1):4-21. 被引量：19
2张新生.语言形式的全应效果——读狄伦·托马斯名篇Do Not Go Gentle Into That Good Night[J].山东外语教学,1986,7(3):10-14.
3王玮,李启祥,尹合坤.枯草杆菌二联活菌颗粒辅助治疗对功能性便秘患者的疗效[J].深圳中西医结合杂志,2018,28(8):97-98. 被引量：2
4王禹,毛坤云,陈嘉佳,郝兴龙,贾润.无比对样本的STR混合分型分析策略[J].中国法医学杂志,2017,32(6):645-648. 被引量：1
5石玉凤,吴进辉,荣亚飞.高危行业人因违章风险的概率描述改进[J].曲阜师范大学学报（自然科学版）,2018,44(2):39-44.
6古丽江·艾力江,古力努尔·艾尔肯,地里木拉提·吐尔逊,艾斯卡尔·艾木都拉.哈萨克族大学生汉语普通话单元音声学研究[J].电脑知识与技术,2018,14(4):212-214.
7王荣,王英.基于系统GMM分析的我国外汇储备与城乡CPI指数的动态关系研究[J].管理现代化,2018,38(3):19-22.
8胡京晶,刘雅静,张晓玲.人性化管理模式在小儿内科病房护理管理中的应用价值分析[J].中国卫生产业,2018,15(10):89-90. 被引量：14
9党现强.《石门铭》技法探微(十九)[J].老年教育（书画艺术）,2018,0(7):26-27.
10吴杭菊.舒适护理对骨折术后患者不良情绪、疼痛及护理满意度的影响[J].健康之路,2018,0(3):161-161. 被引量：1

信息工程大学学报

2018年第1期

浏览历史

内容加载中请稍等...

一种基于模式发现的语种识别方法

参考文献1

二级参考文献6

共引文献3

相关作者

相关机构

相关主题

浏览历史