基于节拍谱的语音音乐分类模型被引量：1

Speech Music Classification Model based on Beat Spectrum

下载PDF

导出

摘要语音音乐分类是语音信号处理领域的重要研究方向。针对以往方法通过提取短时能量、短时幅度等特征参数来区分语音和音乐而忽视音乐具有节拍的特性,为此提出了基于节拍谱的话音分类模型。此模型在针对语音和音乐两类信号中,先对语音信号进行预处理,并对待分类的信号计算得到梅尔频率倒谱系数,再计算梅尔频率倒谱系数的相似矩阵和相似矩阵的自相关,得到待分类信号的节拍谱,最后通过阈值判断待信号类别。经试验结果证明,此模型对比传统分类模型,分类准确率提高到98%。 Speech and music classification is an important research direction in the field of speech signal processing.Aiming at the previous method to distinguish between speech and music by extracting feature parameters such as short-term energy and short-term amplitude,while ignoring the characteristics of music with beats,a speech classification model based on beat spectrum is proposed.In this model,for speech and music signals,the speech signal is preprocessed first,and the Mel frequency cepstral coefficient is calculated for the signal to be classified,and then the autocorrelation of the similarity matrix and the similarity matrix of the Mel frequency cepstrum coefficients are calculated to obtain the beat spectrum of the signal to be classified.Finally,the threshold value is used to determine the signal category.The experimental results indicate that compared with that of traditional classification models,the classification accuracy of this model is 98%.

作者郑清杰龙华邵玉斌杜庆治 ZHENG Qing-jie;LONG Hua;SHAO Yu-bin;DU Qing-zhi(Kunming University of Science and Technology,Kunming Yunnan 650000,China)

机构地区昆明理工大学

出处《通信技术》 2020年第11期2675-2679,共5页 Communications Technology

关键词语音音乐分类自相关阈值分类器 speech vocal music classification since the related classifier

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
2郭伟,于凤芹.基于改进时频比的语音音乐信号分离[J].计算机工程,2015,41(3):287-291. 被引量：3
3王超,吴亚锋.基于EMGD_HMM的音频自动分类[J].电声技术,2007,31(11):52-54. 被引量：3
4万玉龙,周若华,颜永红.快速准确的自动音乐/语音分段方法[J].清华大学学报（自然科学版）,2013,53(6):878-882. 被引量：2
5卢坚,陈毅松,孙正兴,张福炎.基于隐马尔可夫模型的音频自动分类[J].软件学报,2002,13(8):1593-1597. 被引量：47
6陈红红,刘加.基于MLER和GMM的语音音乐分类[J].电声技术,2011,35(10):47-50. 被引量：2
7胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6

二级参考文献61

1胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6
2Saunders J.Real-time discrimination of broadcast speech/music. In : Proc.IEEE ICASSP, 1996.
3Scheier E, Slaney M.Construction and evaluation of a robust multifeature speech/music discriminator.In :Proc.IEEE ICASSP,1997.
4Zhang T, Kuo J.Audio content analysis for on-line audio visual data segmentation and classification.IEEE Trans.Speech Audio Process, 2001 ; 9(5).
5Panagiotakis C, Tziritas G.A Speech/Music Discriminator Based on RMS and Zero-Crossings.IEEE Transactions on Multimedia, 2005 ; 7 (2).
6Young T, Fu K-S.Handbook of Pattern Recognition and Image Processing.Eds, Academic, New York, 1986.
7Wold E, Blum T, Keislar D et al.Content-based classification, search, and retrieval of audio.IEEE Multimedia Mag,1996 ; 3.
8[1]Feiten, B., Frank, R., Ungvary, T. Organization of sounds with neural nets. In: Proceedings of the 1991 International Computer Music Conference, International Computer Music Association. San Francisco, 1991. 441～444.
9[2]Feiten, B., Günzel, S. Automatic indexing of a sound database using self-organizing neural nets. Computer Music Journal, 1994,18(3):53～65.
10[3]Wold, E., Blum, T., Keislar, D., et al. Content-Based classification, search and retrieval of audio. IEEE Multimedia Magazine, 1996,3(3):27～36.

共引文献56

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2郑继明,李瑞仙,蒲兴成.基于单状态HMM的音频分类方法研究[J].计算机应用,2009,29(2):392-394.
3陈姗姗.未来广播中的音频检索技术[J].视听界（广播电视技术）,2010(3):62-64.
4柳群英.基于内容的音频信息检索技术[J].现代情报,2005,25(6):91-93. 被引量：7
5郑贵滨,韩纪庆,李海峰,郑铁然.基于分段的实时声频检索方法[J].声学学报,2006,31(2):101-108. 被引量：5
6郭兴吉,范秉琪.基于特征的音频比对技术[J].河南师范大学学报（自然科学版）,2006,34(2):35-38. 被引量：15
7郑贵滨,韩纪庆.基于直方图的树与链表相结合的音频索引方法[J].哈尔滨工业大学学报,2006,38(11):1915-1918. 被引量：1
8郭兴吉.隐马尔科夫模型在音频波形识别中的应用研究[J].福建电脑,2007,23(3):13-14.
9黄光球,汪晓海.基于BP-HMM的网络入侵检测方法研究[J].计算机工程,2007,33(10):131-133. 被引量：2
10郑怡文.典型的音频分类算法[J].计算机与现代化,2007(8):59-63. 被引量：3

同被引文献14

1杨锦隆,施明辉,晁飞,周昌乐.基于深度学习进行动作模仿的舞蹈机器人[J].厦门大学学报（自然科学版）,2019,58(5):759-766. 被引量：11
2迟善娇.排舞智能机器人推广创新研究[J].通化师范学院学报,2020,41(6):91-95. 被引量：1
3范勇冠.基于傅里叶变换和倒谱系数的电子音乐标记算法[J].现代电子技术,2020,43(13):155-158. 被引量：2
4田佳鹭,张岩.一种音乐自动识别及实时可视化的方法[J].电脑与信息技术,2020,28(4):9-12. 被引量：1
5李欣,米红娟,吴雪君.音乐流派的多种机器学习模型分类比较[J].宜宾学院学报,2020,20(12):42-47. 被引量：3
6杨汶雯,石梦荧.基于深度学习的音乐特征提取及流派分类[J].长江信息通信,2021,34(5):9-11. 被引量：4
7孟镇,王昊,虞为,邓三鸿,张宝隆.基于特征融合的声乐分类研究[J].数据分析与知识发现,2021,5(5):59-70. 被引量：7
8万益.基于多模态瑜伽动作姿态检测的设计研究[J].体育研究与教育,2021,36(4):90-96. 被引量：1
9王力,王鑫,谢凌云.音乐信号处理的特征分析综述[J].中国传媒大学学报（自然科学版）,2021,28(6):59-72. 被引量：3
10曾胜强,李琳.基于姿态校正与姿态融合的2D/3D骨架动作识别方法[J].计算机应用研究,2022,39(3):900-905. 被引量：9

引证文献1

1张婷.基于节拍识别的音乐表演机器人构建研究[J].自动化与仪器仪表,2022(12):211-215. 被引量：1

二级引证文献1

1刘芳.基于声纹情感特征提取的舞蹈机器人自动控制研究[J].自动化与仪器仪表,2024(9):276-279.

1赵静,雍楠,张昌甲,阿迪娜,郑坤明,古力•喀德尔,魏洁,魏新玲.Caprini血栓风险评估量表在呼吸科住院患者静脉血栓栓塞的有效性分析[J].临床医药文献电子杂志,2020,7(72):26-27.
2孙刚平.多噪声背景电子音乐类型分类建模与分析研究[J].现代电子技术,2020,43(21):110-113. 被引量：1
3唐风琴.浅议多层网络层间结构信息对链路预测的影响[J].统计学与应用,2020,9(4):533-536.
4高长春,朱慧方,校韩立,许玉凤,潘网生.贵州省县域经济差异的时空格局演变研究[J].湖南工业大学学报,2020,34(6):34-40.
5王向民,王军,谢杰涛,郭治.基于射击误差状态方程的高炮毁伤概率建模[J].上海交通大学学报,2020,54(9):961-966. 被引量：5
6陈巧红,于泽源,孙麒,贾宇波.基于注意力机制与LSTM的语音情绪识别[J].浙江理工大学学报（自然科学版）,2020,43(6):815-822. 被引量：7
7胡鑫,胡佳慧.移动电话计时计费检定仪初步研究[J].中国检验检测,2020,28(5):24-25.
8姜小鹏.论“fa·si”(下)[J].南京艺术学院学报（音乐与表演版）,1986(3):2-8.
9李建如.三种车辆振动分析模型对比[J].上海汽车,2020(11):39-43.
10章森,曹瑞兴,邓海刚.一种稳定、精准、实时的语音信号基频的检测与提取算法[J].图像与信号处理,2020,9(4):246-255.

通信技术

2020年第11期

浏览历史

内容加载中请稍等...

基于节拍谱的语音音乐分类模型被引量：1

参考文献7

二级参考文献61

共引文献56

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于节拍谱的语音音乐分类模型 被引量：1

参考文献7

二级参考文献61

共引文献56

同被引文献14

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于节拍谱的语音音乐分类模型被引量：1