基于SVM的藏语说话人性别识别被引量：2

Tibetan Speaker Gender Recognition Based on SVM

下载PDF

导出

摘要说话人性别识别是语音识别研究中的一个重要分支.通过说话人的语音识别作为说话人性别识别的预分类技术可以降低研究问题的复杂度,提高系统的准确率.文中首先从建立的藏语语音性别库入手,提取语音的特征参数MFCC,进而利用SVM进行训练和识别.实验结果表明:用于说话人识别的MFCC特征能有效地用于藏语说话人性别识别,且与SVM联合可以得到比较好的效果,SVM的藏语说话人性别识别准确率达到了80%以上. The Research on speaker gender recognition is an important branch of speech recognition,thus we can recognize speaker＇s gender by speaker＇s voice.Gender identification as a pre-classification of speaker recognition technology can lower the complexity of the problem and improve the system＇s accuracy.In this paper,firstly,we establish Tibetan speech gender library,extracting speech feature parameters MFCC,then we use SVM for training and recognition.The results show that：MFCC for speaker recognition features can be effectively used in Tibetan speaker gender identification,and with the combine of SVM can get better results,Tibetan speaker gender recognition accuracy rate achieved more than 80% by using SVM.

作者马宁于洪志武光利何向真

机构地区西北民族大学中国民族信息技术研究院甘肃政法学院计算机科学学院

出处《西北民族大学学报（自然科学版）》 2011年第4期35-39,共5页 Journal of Northwest Minzu University(Natural Science)

基金国家自然科学基金项目(60773052)

关键词说话人识别 MFCC SVM 性别识别 Speaker recognition MFCC SVM Gender recognition

分类号 TP301.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1肖汉光,何为.基于MFCC和SVM的说话人性别识别[J].重庆大学学报（自然科学版）,2009,32(7):770-774. 被引量：4
2江星华,李应.一种基于MFCC的音频数据检索方法[J].计算机与数字工程,2008,36(9):19-21. 被引量：7
3张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量：4
4Campbell W M,Campbell J P,Reynolds D A,Singer E,Torres-Carrasquillo P A.Support vector machines for speaker andlanguage recognition. Computer Speech&Language . 2006

二级参考文献28

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004,40(15):74-75. 被引量：8
3陈雁翔,戴蓓蒨,周曦,刘鸣.一种适于非特定人语音识别的并行隐马尔可夫模型[J].电子与信息学报,2004,26(10):1601-1606. 被引量：1
4肖述才,欧智坚,王作英.语音识别中的一种说话人聚类算法[J].中文信息学报,2005,19(4):84-88. 被引量：4
5郭春霞,裘雪红.基于MFCC的说话人识别系统[J].电子科技,2005,18(11):53-56. 被引量：19
6李娟娟,俞一彪,薛广荣.说话人性别识别系统的DSP实现[J].现代电子技术,2005,28(24):37-39. 被引量：1
7刘长明,任一峰.语音识别中DTW特征匹配的改进算法研究[J].中北大学学报（自然科学版）,2006,27(1):37-40. 被引量：17
8肖汉光,蔡从中,廖克俊.利用声波和地震波识别军事车辆类型[J].系统工程理论与实践,2006,26(4):108-113. 被引量：7
9蔡从中,袁前飞,肖汉光,刘兴华,孔春阳.中药组方的计算机辅助分类与识别[J].重庆大学学报（自然科学版）,2006,29(10):42-46. 被引量：6
10张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量：4

共引文献12

1肖汉光,何为.基于MFCC和SVM的说话人性别识别[J].重庆大学学报（自然科学版）,2009,32(7):770-774. 被引量：4
2陈勇,屈志毅,刘莹,酒康,郭爱平,杨志国.语音特征参数MFCC的提取及其应用[J].湖南农业大学学报（自然科学版）,2009,35(10X):106-107. 被引量：11
3魏丹芳,李应.一种环境音频数据分类方法[J].计算机与数字工程,2009,37(11):7-9. 被引量：1
4袁正午,肖旺辉.改进的混合MFCC语音识别算法研究[J].计算机工程与应用,2009,45(33):108-110. 被引量：18
5刘伶俐,王朝立,于震.CHMM语音识别初值选择方法的研究[J].上海理工大学学报,2012,34(4):323-326. 被引量：4
6姜愉.基于BP和ARM的发动机声音识别系统[J].黑龙江科技学院学报,2012,22(5):533-536. 被引量：3
7李一芳.基于Mel频率倒谱系数的光缆声音信号特征提取方法研究[J].计量技术,2013(7):3-5.
8魏明哲.基于分类识别的隐马尔可夫模型语音识别技术[J].山西师范大学学报（自然科学版）,2014,28(3):26-29. 被引量：2
9郭春霞.基于VQ的说话人识别系统实现[J].电脑知识与技术（过刊）,2009,15(10X):8256-8257.
10秦志英,齐康花,董桂西,赵月静,刘尧.基于声音信号的钢材材质检测及试验研究[J].河北科技大学学报,2016,37(3):275-282. 被引量：3

同被引文献19

1杨昌盛.贵州三都苗语语音系统及其与苗语中部方言标准音的对应规律[J].西南民族大学学报（人文社会科学版）,1999,20(5):33-37. 被引量：1
2姬安龙.摆省苗语音系及其语音特点[J].贵州民族研究,1997,17(4):149-152. 被引量：2
3邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004,40(15):74-75. 被引量：8
4石德富.排烧苗语的语音特点[J].贵州民族学院学报（哲学社会科学版）,2005(6):39-43. 被引量：2
5张建明,杨忠,李巍.改进KNN-SVM的性别识别[J].计算机工程与应用,2009,45(4):177-179. 被引量：7
6姚徐,李永宏,单广荣,于洪志.藏语孤立词语音识别系统研究[J].西北民族大学学报（自然科学版）,2009,30(1):29-36. 被引量：10
7李永宏,于洪志,孔江平.藏语连续语音语料库设计与实现[J].计算机工程与应用,2010,46(13):233-235. 被引量：10
8顿珠次仁.藏语语音信号降噪算法研究[J].西藏大学学报（社会科学版）,2010,25(5):61-65. 被引量：5
9吴正彪,李永皇.试论语言接触对黔东方言苗语土语语音变化的影响[J].贵州民族研究,2011,31(6):175-180. 被引量：4
10李云兵.苗瑶语语音的基本理论和现实研究[J].贵州民族研究,2000,20(1):142-152. 被引量：4

引证文献2

1夏吾吉,华却才让,色差甲,贡保才让,扎西吉.融合藏族人名音节特征的性别自动识别[J].西北民族大学学报（自然科学版）,2017,38(3):1-5. 被引量：2
2袁子林,张瑞,张彩霞,魏欢,巩海平.民族语言的语音识别研究[J].计算机应用文摘,2024,40(1):81-83.

二级引证文献2

1却措卓玛,华却才让,才让当知,夏吾吉.基于混合策略的藏文句子边界识别[J].内蒙古师范大学学报（自然科学汉文版）,2019,48(5):400-405. 被引量：4
2才让当知,华却才让,却措卓玛,夏吾吉.基于混合模式的藏文音节切分[J].内蒙古师范大学学报（自然科学汉文版）,2019,48(5):406-412.

1王辉,赵悦,刘晓凤,徐晓娜,周楠,许彦敏.基于深度特征学习的藏语语音识别[J].东北师大学报（自然科学版）,2015,47(4):69-73. 被引量：8
2付俊辉,杨献峰.基于人脸图像的性别识别建模与仿真研究[J].计算机仿真,2012,29(5):299-302. 被引量：2
3余彧,陆亨立,陆小峰,李莹娇.Android平台实时人脸检测和性别识别的研究与实现[J].电视技术,2014,38(13):186-190. 被引量：1
4张天刚,张景安,康苏明.基于模糊隶属度的人脸图像性别识别[J].软件,2012,33(8):28-31. 被引量：4
5冯炎,安宝坤.带噪藏语语音增强算法研究[J].重庆科技学院学报（自然科学版）,2013,15(6):136-139. 被引量：1
6周文军,徐彭,韩亮亮,曹淑斌,苗春静.基于ICA的多人脚步声信号分离和识别[J].中国科技博览,2012(33):403-403.
7赵颖.基于HMM的藏语TTS语调韵律预测[J].西南民族大学学报（自然科学版）,2010,36(6):1060-1062.
8张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量：4
9邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004,40(15):74-75. 被引量：8
10韩一,王国胤,杨勇.基于MFCC的语音情感识别[J].重庆邮电大学学报（自然科学版）,2008,20(5):597-602. 被引量：23

西北民族大学学报（自然科学版）

2011年第4期

浏览历史

内容加载中请稍等...

基于SVM的藏语说话人性别识别被引量：2

参考文献4

二级参考文献28

共引文献12

同被引文献19

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于SVM的藏语说话人性别识别 被引量：2

参考文献4

二级参考文献28

共引文献12

同被引文献19

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于SVM的藏语说话人性别识别被引量：2