基于MFCC和SVM的说话人性别识别被引量：4

Gender recognition of speakers based on MFCC and SVM

下载PDF

导出

摘要建立了普通话语音性别数据库,提出联合梅尔频率频谱系数(Mel-frequency CepstrumCoefficients,MFCC)的特征提取方法和支持向量机(Support Vector Machine,SVM)的分类方法进行说话人性别识别,并与其它分类方法进行比较,实验结果表明该方法的说话人性别识别准确率达到98.7%,明显优于其它分类器。 A Chinese speech （mandarin） database was established for speakers gender recognition. A combination method is proposed for gender recognition of speakers based on support vector machine and Mel-frequency cepstrum coefficients （MFCC） for classification and feature extraction respectively. The comparative result shows that the accuracy of SVM is 98.7%, which is better than other methods.

作者肖汉光何为

机构地区重庆大学输配电装备及系统安全与新技术国家重点实验室重庆工学院数理学院

出处《重庆大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第7期770-774,共5页 Journal of Chongqing University

基金国家自然科学基金资助项目(50877082) 重庆工学院青年教师科研基金资助项目(20062D39)

关键词模式识别分类器性别识别支持向量机梅尔频率频谱系数 pattern recognition classifiers gender recognition mel-frequency cepstrum coefficients support vector machine

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量：4
2李娟娟,俞一彪,薛广荣.说话人性别识别系统的DSP实现[J].现代电子技术,2005,28(24):37-39. 被引量：1
3邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004,40(15):74-75. 被引量：8
4王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
5VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
6张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2256
7肖汉光,蔡从中,廖克俊.利用声波和地震波识别军事车辆类型[J].系统工程理论与实践,2006,26(4):108-113. 被引量：7
8CAI C Z,HAN L Y,JI Z L,et al.SVM2Prot:Web2based support vector machine software for functional classification of a protein from its primary sequence[J].Nucleic Acids Research,2003,31(13):3692-3697.
9CAI C Z,HAN L Y,JI Z L,et al.Enzyme family classification by support vector machines[J].Proteins,2004,55(1):66-76.
10蔡从中,袁前飞,肖汉光,刘兴华,孔春阳.中药组方的计算机辅助分类与识别[J].重庆大学学报（自然科学版）,2006,29(10):42-46. 被引量：6

二级参考文献74

1苏薇薇,吴忠,梁仁.计算机模式分类技术──中药质量与中药组方研究的新方法[J].世界科学技术-中医药现代化,1999,4(3):33-37. 被引量：8
2邓英,欧贵文.基于HMM的性别识别[J].计算机工程与应用,2004,40(15):74-75. 被引量：8
3陈雁翔,戴蓓蒨,周曦,刘鸣.一种适于非特定人语音识别的并行隐马尔可夫模型[J].电子与信息学报,2004,26(10):1601-1606. 被引量：1
4王吉林.基于VQ的说话人识别系统的实现[J].天津职业大学学报,2004,13(6):39-42. 被引量：3
5赵姝彦,张雪英,焦志平.基于ZCPA和DHMM的孤立词语音识别系统[J].太原理工大学学报,2005,36(3):246-249. 被引量：4
6肖述才,欧智坚,王作英.语音识别中的一种说话人聚类算法[J].中文信息学报,2005,19(4):84-88. 被引量：4
7[2]ALBERT BOGGESS.小波与傅立叶分析基础[M].芮国胜,康健,译.北京:电子工业出版社,2004.
8[1]Tomas F.Quatieri Discrete-Time Speech Signal Processing:Principles and Practice[M].北京:电子工业出版社,2004.
9TMS320C54x DSP Reference Set Volume 1:CPU and Peripherals,TI,SPRU131G,March 2001.
10TMS320C54x DSP Reference Set Volume 2:Mnemonic Instruction Set,TI,SPRU172C,March 2001.

共引文献2313

1白岗岗,侯精明,史玉品,韩浩,郭凯华,李丙尧,付德宇.基于支持向量机的葫芦河流域径流变化的多因素贡献率分析[J].水土保持研究,2020,27(2):112-117. 被引量：2
2曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59. 被引量：8
3乔丹,刘刚,杨执钧,钟韬,白雪.基于迁移学习的船舶目标识别[J].计算机应用研究,2020,37(S01):324-325. 被引量：1
4孟琮棠,赵银娣,向阳.基于卷积神经网络的遥感图像变化检测[J].现代测绘,2019,0(5):1-5. 被引量：3
5田海军,门洪,郎世伟.基于LS-SVM的电厂过热汽温仿真研究[J].微计算机信息,2007,23(10):270-272. 被引量：2
6张磊,夏士雄,牛强.基于SVM二叉决策树方法的矿井提升机故障诊断[J].微计算机信息,2008,24(10):198-199. 被引量：4
7瞿伟廉,谭冬梅.基于小波分析和支持向量机的结构损伤识别[J].武汉理工大学学报,2008,30(2):80-82. 被引量：3
8郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.
9殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报（自然科学与医学版）,2006,27(3):363-367. 被引量：4
10王宇,丁萍,吴峻.基于SVM的光纤陀螺标度因数建模研究[J].舰船电子工程,2008,28(5):78-80. 被引量：1

同被引文献34

1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量：30
2庞程,李晓飞,刘宏.基于MFCC与基频特征贡献度识别说话人性别[J].华中科技大学学报（自然科学版）,2013,41(S1):108-111. 被引量：8
3韩雁,陈利华.说话人计算机识别系统的设计与实现[J].浙江大学学报（工学版）,2001,35(2):165-169. 被引量：3
4汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
5刘羽.语音端点检测及其在Matlab中的实现[J].计算机时代,2005(8):25-26. 被引量：11
6陈立万.基于语音识别系统中DTW算法改进技术研究[J].微计算机信息,2006,22(02Z):267-269. 被引量：28
7刘长明,任一峰.语音识别中DTW特征匹配的改进算法研究[J].中北大学学报（自然科学版）,2006,27(1):37-40. 被引量：17
8陈若珠,李战明,王贞.基于组合神经网络的与文本无关的说话人识别[J].兰州理工大学学报,2006,32(3):78-81. 被引量：2
9郭利刚,赵凡.声音匹配识别算法的研究与实践[J].中国传媒大学学报（自然科学版）,2007,14(1):20-25. 被引量：9
10张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量：4

引证文献4

1马宁,于洪志,武光利,何向真.基于SVM的藏语说话人性别识别[J].西北民族大学学报（自然科学版）,2011,32(4):35-39. 被引量：2
2郭春霞.基于VQ的说话人识别系统实现[J].电脑知识与技术（过刊）,2009,15(10X):8256-8257.
3秦志英,齐康花,董桂西,赵月静,刘尧.基于声音信号的钢材材质检测及试验研究[J].河北科技大学学报,2016,37(3):275-282. 被引量：3
4邱晨,孙成楠,张琪,葛煦.基于语音特征的说话人性别智能识别方法研究[J].自动化与仪器仪表,2021(8):235-238. 被引量：1

二级引证文献6

1夏吾吉,华却才让,色差甲,贡保才让,扎西吉.融合藏族人名音节特征的性别自动识别[J].西北民族大学学报（自然科学版）,2017,38(3):1-5. 被引量：2
2郝孟娟,刘晓鹏,齐康花,秦志英,赵月静.基于声音-压力的多通道角钢材质检测系统硬件设计[J].河北工业科技,2018,35(4):268-272.
3李伟,李硕.理解数字声音——基于一般音频/环境声的计算机听觉综述[J].复旦学报（自然科学版）,2019,58(3):269-313. 被引量：28
4赵月静,刘晓鹏,张睿,秦志英.改进阈值小波去噪方法在机床冲孔声音信号处理中的应用[J].机床与液压,2020,48(9):172-175. 被引量：7
5徐军莉.基于眼动和脑电的疲劳特征的性别差异[J].电脑知识与技术,2023,19(9):9-12.
6袁子林,张瑞,张彩霞,魏欢,巩海平.民族语言的语音识别研究[J].计算机应用文摘,2024,40(1):81-83.

1张书洋.普通话语音机房设计及建议[J].资治文摘,2016,0(1):122-122.
2蒋海华,胡斌.基于PCA和SVM的普通话语音情感识别[J].计算机科学,2015,42(11):270-273. 被引量：10
3人工智能[J].中国学术期刊文摘,2006,12(8):158-161.
4双十一疯抢iPhone6最佳搭档拥有缤特力蓝牙耳机高品质通话无线随行[J].数码精品世界,2014,0(11):119-119.
5谢旭荣,隋相,刘循英,王岚.深度神经网络建模方法用于数据缺乏的带口音普通话语音识别的研究（英文）[J].集成技术,2015,4(6):26-36.
6福建省仙游县第二届“新华杯”师生诵读大赛催人奋进[J].课外语文（下）,2013(7).
7谢波,陈岭,陈根才,陈纯.普通话语音情感识别的特征选择技术[J].浙江大学学报（工学版）,2007,41(11):1816-1822. 被引量：13
8宋乐,白静.说话人识别中改进特征提取算法的研究[J].计算机工程与设计,2014,35(5):1772-1775. 被引量：3
9陈孟元.基于改进型DTW算法和MFCC的语音识别[J].安徽工程大学学报,2014,29(1):53-57. 被引量：9
10庞贝.百度语音识别获重大突破:更快、更准、更平价[J].科技创新与品牌,2015(11):20-21. 被引量：1

重庆大学学报（自然科学版）

2009年第7期

浏览历史

内容加载中请稍等...

基于MFCC和SVM的说话人性别识别被引量：4

参考文献15

二级参考文献74

共引文献2313

同被引文献34

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于MFCC和SVM的说话人性别识别 被引量：4

参考文献15

二级参考文献74

共引文献2313

同被引文献34

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于MFCC和SVM的说话人性别识别被引量：4