基于过零率及频谱的语音音乐分类算法被引量：20

Speech music classification algorithm based on zero-crossing rate and spectrum

下载PDF

导出

摘要针对语音/音乐分类过程中由于特征参数提取过多造成的维数灾难及分类准确率有待提高等问题,提出了一种基于过零率及频谱的语音/音乐分类算法.该算法在对语音及音乐2类信号进行端点检测及分段预处理后,结合每一音频段的过零率和频谱幅值特性进行分类识别处理,最后通过计算被判别为语音或音乐的概率实现分类.实验结果表明,此算法在音频分类中较同样最多只提2个音频特征且未用分类器算法的准确率平均提高约7.9%,较提取多个音频特征且采用分类器算法的准确率平均提高约5.7%.证明了该算法不仅计算量小,且分类准确率也有所提高. Due to the problems of dimensionality disaster caused by excessive extraction of feature parameters and the need to improve the classification accuracy in speech/music classification process,this paper proposes a speech/music classification algorithm based on zero-crossing rate and spectrum.After endpoint detection and segmented preprocessing of speech and music signals,the algorithm classifies and recognizes each audio segment by combining the zero-crossing rate and spectral amplitude characteristics,and finally realizes the classification by calculating the probability of being identified as speech or music.Experimental results show that the accuracy of this algorithm in audio classification is about 7.9%higher on average than that of the same algorithms which only mention two audio features at most and do not use the classifier,and about 5.7%higher than that of the algorithms which extract multiple audio features and use the classifier.It proves that this algorithm not only has a small amount of calculation,but also improves the classification accuracy.

作者孙慧芳龙华邵玉斌杜庆治 SUN Hui-fang;LONG Hua;SHAO Yu-bin;DU Qing-zhi(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)

机构地区昆明理工大学信息工程与自动化学院

出处《云南大学学报（自然科学版）》 CAS CSCD 北大核心 2019年第5期925-931,共7页 Journal of Yunnan University(Natural Sciences Edition)

基金国家自然科学基金(61761025)

关键词音频分类音频特征端点检测过零率频谱幅值 audio classification audio features endpoint detection zero-crossing rate spectral amplitude

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献14

1陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
2张琳,周韬,杜庆治,邵玉斌,龙华.基于物理特征的音频相似度比对算法研究[J].电视技术,2017,41(11):110-114. 被引量：9
3杨松,于凤芹.基于样本熵的语音/音乐识别[J].计算机工程与应用,2012,48(23):125-127. 被引量：4
4陈戈珩,胡明辉,吴天华.基于支持向量机和HMM的音频信号分类算法[J].长春工业大学学报,2015,36(4):369-373. 被引量：5
5田旺兰.语音/音乐的深度置信网络高准确度识别方法[J].吉首大学学报（自然科学版）,2017,38(1):36-39. 被引量：3
6梅铁民,路瑞茜.一种音频分类算法[J].沈阳理工大学学报,2016,35(5):23-27. 被引量：1
7容宝华.基于最小距离的音频分类方法的研究[J].电声技术,2012,36(11):46-51. 被引量：3
8陈功,张雄伟.一种基于灰关联分析的语音/音乐分类方法[J].声学技术,2007,26(2):262-267. 被引量：8
9胡耀文,龙华,孙俊,周涛,邵玉斌.基于音频特征的乐器分类研究[J].软件导刊,2018,17(6):17-21. 被引量：3
10吴顺妹,许丽净,许洪光,张钦宇.一种基于音调的语音/音乐实时分类算法[J].电声技术,2010,34(2):66-68. 被引量：4

二级参考文献100

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2张奇,苏鸿根.基于支持向量机的乐器识别方法[J].计算机工程与应用,2004,40(18):99-101. 被引量：7
3关欣,何友,衣晓.基于灰关联分析的雷达辐射源识别方法研究[J].系统仿真学报,2004,16(11):2601-2603. 被引量：33
4姚青,赖凤香,傅强,张志涛,程登发.基于人工神经网络的昆虫鸣声识别[J].Entomotaxonomia,2005,27(1):19-22. 被引量：9
5白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
6许劲,杨秀平.P2P下的语音聊天软件实现[J].湖南城市学院学报（自然科学版）,2005,14(2):66-68. 被引量：4
7庚镇城,朱定良,孙耀来,蔡怀新,陈暨耀,诸长生.果蝇亚群中六个种的求爱歌的研究——对ipi作用的探究[J].Acta Genetica Sinica,1989,16(6):448-454. 被引量：7
8陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
9郭兴吉,范秉琪.基于特征的音频比对技术[J].河南师范大学学报（自然科学版）,2006,34(2):35-38. 被引量：15
10白冬梅,邱天爽,鲍海平.基于经验模式分解与样本熵的癫痫预测方法[J].中国生物医学工程学报,2006,25(5):527-531. 被引量：12

共引文献64

1林杨华.中学历史教学提问技巧谈[J].宁德师专学报（哲学社会科学版）,2005(3):102-104.
2白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
3陈功,张雄伟.灰关联分析与语音/音乐信号识别[J].电子技术应用,2005,31(10):21-23. 被引量：2
4白亮,老松杨,陈剑赟,吴玲达.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029-2034. 被引量：13
5陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
6朱君波,朱夏君,王守觉.PCA在语音检测中的应用研究[J].模式识别与人工智能,2006,19(5):629-633. 被引量：1
7张璞,张亚芬.一种基于VPRSM的音频分类方法[J].甘肃科技,2006,22(12):59-61.
8陈功,张雄伟.一种基于灰关联分析的语音/音乐分类方法[J].声学技术,2007,26(2):262-267. 被引量：8
9刘乔辉.基于神经网络的5种音频分类[J].中国西部科技,2008,7(9):16-17.
10徐翔俊,毕福昆,杨鉴.基于支持向量机的民族语口音识别[J].计算机工程与应用,2008,44(13):71-73. 被引量：5

同被引文献196

1张一彬,周杰,边肇祺,郭军.基于内容的音频与音乐分析综述[J].计算机学报,2007,30(5):712-728. 被引量：18
2史东承,韩玲艳,于明会.基于HMM/SVM的音频自动分类[J].长春工业大学学报,2008,29(2):178-182. 被引量：9
3朱俊敏,张潇,王旌阳,吴粤北.小波域音频信号降噪研究[J].计算机工程与应用,2009,45(6):149-154. 被引量：6
4孟永辉,蒋冬梅,付中华,谢磊.一种新颖的语言/音乐分割与分类方法[J].计算机工程与科学,2009,31(4):106-109. 被引量：6
5石宇加.电子音乐创作中效果器应用研究——以Digital performer为例[J].音乐时空,2011(10):56-58. 被引量：2
6颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):1419-1422. 被引量：4
7李丽娟,叶茂,赵欣.基于高斯混合模型流行音乐中歌唱部分的智能检测[J].小型微型计算机系统,2009,30(5):1017-1020. 被引量：3
8陈芳,李伟,李晓强.基于小波包最优基的音乐指纹提取算法[J].计算机工程,2009,35(9):236-237. 被引量：6
9吕卫强,黄荔.基于短时能量加过零率的实时语音端点检测方法[J].兵工自动化,2009,28(9):69-70. 被引量：15
10王娜,李霞.基于监督信息特性的主动半监督谱聚类算法[J].电子学报,2010,38(1):172-176. 被引量：34

引证文献20

1姚丽娜,鲁旭涛,孙运强,柴晋强.端点检测算法在增雨弹炸声定位技术中的研究[J].国外电子测量技术,2020,39(1):6-9. 被引量：2
2李海峰,戎晓汇,马琳,徐忠亮,薄洪健.基于启发式掩模EMD的音频突变成分检测方法[J].信号处理,2020,36(6):885-893. 被引量：2
3许晶晶.复杂噪声场景下的电子音乐信号智能检测算法设计[J].现代电子技术,2020,43(19):49-52. 被引量：1
4易伶.多特征融合和机器学习算法的电子音乐分类模型[J].微型电脑应用,2020,36(9):117-119. 被引量：1
5孟令红.复杂噪声环境中的音乐分类和检测模型[J].微型电脑应用,2020,36(10):107-109.
6冉茂霞,黄沁元,刘鑫,宋弘,吴浩.基于优化变分模态分解的磁瓦内部缺陷检测[J].浙江大学学报（工学版）,2020,54(11):2158-2168. 被引量：7
7杨文华.基于机器学习算法的电子音乐信号辨识模型[J].微型电脑应用,2021,37(1):80-82. 被引量：1
8杨贵安,邵玉斌,龙华,杜庆治.一种基于音频分割的音频分类算法[J].通信技术,2021,54(2):317-322. 被引量：1
9赵婕.改进神经网络的电子音乐辨识研究[J].微型电脑应用,2021,37(6):129-131. 被引量：1
10张子丞,谭志苇,张晨瑞,王旋,刘晓璇,俞一彪.基于高低频带对数能量谱比贝叶斯决策的语音端点检测[J].计算机科学,2021,48(S01):33-37. 被引量：4

二级引证文献42

1钟贤硕,牛泽,白文斌,李凯.射孔起爆的振动特征监测系统[J].国外电子测量技术,2021,40(2):16-20.
2刘鑫,黄沁元,李强,冉茂霞,周颖,杨天.基于卷积神经网络和声振图像的磁瓦内部缺陷检测[J].计算机科学,2021,48(S02):648-654.
3王晓甜,毛永毅.人工增雨火箭弹爆炸声程差采集系统设计[J].电子设计工程,2022,30(2):16-19. 被引量：1
4刘晶,邵玉斌,龙华,李一民.基于GFCC和能量算子倒谱的语种识别[J].云南大学学报（自然科学版）,2022,44(2):254-261. 被引量：4
5王瑞,李珊,齐建立.应用人工神经网络的音乐多参数识别方法设计[J].常州工学院学报,2022,35(3):34-38.
6王燕飞.贝叶斯统计中“后验分布”的教学设计[J].吉林化工学院学报,2022,39(6):37-42.
7陈琳.面向语音特征提取的英语机器人识别方法构建[J].自动化与仪器仪表,2022(8):234-239.
8刘彦.基于压缩域特征的多媒体数字音频检索方法[J].信息记录材料,2022,23(8):229-231.
9刘忠,潘宜桦,邹淑云,陈星宇,李志鹏.基于优化VMD组合降噪和LMD的水轮机空化声发射信号特征提取[J].排灌机械工程学报,2022,40(10):1007-1013. 被引量：6
10刘艳辉.改进型多特征语音端点检测方法[J].河南工程学院学报（自然科学版）,2022,34(4):69-73. 被引量：1

1白燕燕,胡晓霞.基于MATLAB语谱图的声乐研究[J].软件工程,2019,22(9):1-4. 被引量：6
2肖娜,关喜峰,孔祥伟.基于图像处理的航空发动机自适应频谱报警技术研究[J].计算机测量与控制,2019,27(9):184-190. 被引量：3
3左丽诗,陆明洲,盛航,张海林,段光辉,尹旺.人工喂养与自由牧食藏羊的食草咀嚼行为音频特征[J].贵州农业科学,2019,47(9):57-60.
4刘立芳,杨海霞,齐小刚.基于线性判别分析的时频域特征提取算法[J].系统工程与电子技术,2019,41(10):2184-2190. 被引量：18
5王珂,周瑶,赵媛媛.一种改进的差分进化算法及其在SVM中的应用[J].现代计算机,2019,0(26):8-12.
6徐进,崔强,林伟,王郸祁,吴国雄.螺旋匝道和螺旋桥的小客车行驶速度特征[J].中国公路学报,2019,32(7):158-171. 被引量：12
7周宏.卷烟物流分拣纠错技术应用[J].中国物流与采购,2019,0(13):38-39. 被引量：2
8张玉波,苏星华,黎大健,赵坚.综合三比值特征量与帝国竞争优化支持向量机的变压器故障诊断模型[J].广西电力,2019,42(3):57-61. 被引量：6
9江雨燕,董映宇,郑炜晨.车联网智能微缩车识别和定位方案设计[J].南阳理工学院学报,2019,11(4):17-23. 被引量：1
10卢欣欣,潘丽平.ELMs和SVMs在多分类问题上的泛化性能比较[J].计算机应用与软件,2019,36(10):262-267. 被引量：5

云南大学学报（自然科学版）

2019年第5期

浏览历史

内容加载中请稍等...

基于过零率及频谱的语音音乐分类算法被引量：20

参考文献14

二级参考文献100

共引文献64

同被引文献196

引证文献20

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于过零率及频谱的语音音乐分类算法 被引量：20

参考文献14

二级参考文献100

共引文献64

同被引文献196

引证文献20

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

基于过零率及频谱的语音音乐分类算法被引量：20