基于增强AlexNet的音乐流派识别研究被引量：4

Music genre recognition research based on enhanced AlexNet

下载PDF

导出

摘要针对机器学习模型对音乐流派特征识别能力较弱的问题,提出了一种基于深度卷积神经网络的音乐流派识别(DCNN-MGR)模型。该模型首先通过快速傅里叶变换提取音频信息,生成可以输入DCNN的频谱并切割生成频谱切片。然后通过融合带泄露整流(Leaky ReLU)函数、双曲正切(Tanh)函数和Softplus分类器对AlexNet进行增强。其次将生成的频谱切片输入增强的AlexNet进行多批次的训练与验证,提取并学习音乐特征,得到可以有效分辨音乐特征的网络模型。最后使用输出模型进行音乐流派识别测试。实验结果表明,增强的AlexNet在音乐特征识别准确率和网络收敛效果上明显优于AlexNet及其他常用的DCNN、DCNN-MGR模型在音乐流派识别准确率上比其他机器学习模型提升了4%~20%。 To solve the problem that machine learning model has weak ability to identify music genre features,a music genre recognition model based on deep convolutional neural network(DCNN-MGR)is proposed in this paper.At first,the model extracts audio information through Fast Fourier Transformation,generating spectrums that can be input to the DCNN and slicing the generated spectrums.Then AlexNet is enhanced by fusion of Leaky ReLU function,Tanh function and Softplus classifier.The generated spectrum slices are input into the enhanced AlexNet for multi-batch training and verification.Music features are extracted and learned,and a network model that can effectively distinguish music features is obtained.At last,the output model is applied to music genre recognition and test.The experimental results show that the enhanced AlexNet is superior to AlexNet and other commonly used DCNN in terms of accuracy of music feature recognition and network convergence effect.The DCNN-MGR model is 4%~20%higher than other machine learning models in music genre recognition accuracy.

作者刘万军孟仁杰曲海成刘腊梅 LIU Wanjun;MENG Renjie;QU Haicheng;LIU Lamei(College of Software,Liaoning Technical University,Huludao 125105,China)

机构地区辽宁工程技术大学软件学院

出处《智能系统学报》 CSCD 北大核心 2020年第4期750-757,共8页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金青年基金项目(41701479).

关键词音乐流派识别深度卷积神经网络机器学习深度学习 AlexNet 音频特征提取音乐特征识别 music genres recognition deep convolutional neural network machine learning deep learning AlexNet audio feature extraction

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1焦李成,杨淑媛,刘芳,王士刚,冯志玺.神经网络七十年:回顾与展望[J].计算机学报,2016,39(8):1697-1716. 被引量：364
2苗北辰,郭为安,汪镭.隐式特征和循环神经网络的多声部音乐生成系统[J].智能系统学报,2019,14(1):158-164. 被引量：5
3盖杉,鲍中运.基于改进深度卷积神经网络的纸币识别研究[J].电子与信息学报,2019,41(8):1992-2000. 被引量：8
4吕鸿蒙,赵地,迟学斌.基于增强AlexNet的深度学习的阿尔茨海默病的早期诊断[J].计算机科学,2017,44(S1):50-60. 被引量：69
5李祥鹏,闵卫东,韩清,刘瑞康.基于深度学习的车牌定位和识别方法[J].计算机辅助设计与图形学学报,2019,31(6):979-987. 被引量：41
6邵曦,姚磊.基于SVM主动学习的音乐分类[J].计算机工程与应用,2016,52(6):127-133. 被引量：8
7甘岚,郭子涵,王瑶.基于径向变换和改进AlexNet的胃肿瘤细胞图像识别方法[J].计算机应用,2019,39(10):2923-2929. 被引量：5
8吴进,钱雪忠.紧凑型深度卷积神经网络在图像识别中的应用[J].计算机科学与探索,2019,13(2):275-284. 被引量：22
9马世龙,乌尼日其其格,李小平.大数据与深度学习综述[J].智能系统学报,2016,11(6):728-742. 被引量：88
10王文秀,傅雨田,董峰,李锋.基于深度卷积神经网络的红外船只目标检测方法[J].光学学报,2018,38(7):152-158. 被引量：49

二级参考文献118

1余棉水,黎绍发.基于边缘与SVM的车牌自动定位与提取[J].计算机应用研究,2004,21(10):131-133. 被引量：8
2SHEN Yan,XIE Mei-ping.Ship motion extreme short time prediction of ship pitch based on diagonal recurrent neural network[J].Journal of Marine Science and Application,2005,4(2):56-60. 被引量：3
3王守觉,曹文明.半导体神经计算机的硬件实现及其在连续语音识别中的应用[J].电子学报,2006,34(2):267-271. 被引量：3
4Wei Dachuan.An improved feature extraction algorithm of humming music[C]//2011 International Conference on Mechanical,and Electrical Engineering,2011:2500-2503.
5Foucard R,Essid S,Richard G,et al.Exploring new features for music classification[C]//2013 14th International Workshop on Image Analysis for Multimedia Interactive Services,2013:1-4.
6Bhat A S,Amith V S,Prasad N S,et al.An efficient classification algorithm for music mood detection in western and hindi music using audio feature extraction[C]//IEEE2014 Fifth International Conference on Signal and Image Processing(ICSIP),2014:359-364.
7Gonzalez-Abril L,Angulo C,Velasco F,et al.A note on the bias in SVMs for multiclassification[J].IEEE Transactions on Neural Networks,2008,19(4):723-725.
8Simon H A,Lea G.Problem solving and rule education:a unified view knowledge and organization[J].Knowledge and Cognition,1974,15(2):63-73.
9Vlachos A.Active learning with support vector machines[D].School of Informatics,University of Edinburgh,2004.
10Seung H S,Opper M,Sompolinsky H.Query by committee[C]//Proceedings of the 15th Annual ACM Workshop on Computational Learning Theory,California,1992:287-294.

共引文献715

1朱新乐.基于BP神经网络的绿色供应链优化研究[J].运输经理世界,2023(11):156-158.
2邢毅雪,朱永华,高海燕,周金,张克.基于注意力机制的远程监督实体关系抽取[J].上海大学学报（自然科学版）,2021,27(5):983-992. 被引量：5
3冯建英,吴丹丹,王博,王智,穆维松.中文在线评论文本分析对生鲜农产品电商影响研究综述[J].农业机械学报,2021,52(S01):504-512. 被引量：7
4张珂,王军政,丁嘉豪,彭析竹.恶劣气候背景下基于CNN的毫米波近程测距技术研究[J].微电子学,2023,53(6):1053-1058.
5刘昕泽,何思雨,张璐,孔亮,李学涛.ApoE修饰白藜芦醇和红景天苷脂质体处方优选及含量测定[J].辽宁中医药大学学报,2021,23(11):48-52. 被引量：1
6胡众义,张夏彬.利用3D-RepVGG进行阿尔兹海默症诊断[J].计算机应用,2023,43(S01):26-32. 被引量：1
7徐美,刘春腊.湖南省资源环境承载力预警评价与警情趋势分析[J].经济地理,2020,40(1):187-196. 被引量：18
8何海洋,路玉,乔保军.一种改进Octave神经网络的图像识别模型[J].河南大学学报（自然科学版）,2020(6):700-706.
9南敬昌,孙雯雯,杜有益,王明寰.一维卷积神经网络超宽带天线建模方法[J].电子测量与仪器学报,2023,37(2):204-210. 被引量：1
10杨灿.高职《深度学习》课程教学的实施[J].办公自动化,2021,26(16):37-38. 被引量：1

同被引文献46

1黄光磊,李喆,许永鹏,钱勇,盛戈皞,江秀臣.基于改进深度信念网络的直流XLPE电缆局部放电模式识别[J].高电压技术,2020,46(1):327-334. 被引量：11
2任先成,薛禹胜,Q.H. WU,丁明.低频低压切负荷的控制负效应及其机理[J].电力系统自动化,2009,33(10):1-5. 被引量：23
3顾卓远,汤涌,张健,易俊,訾鹏,张妍.基于相对动能的电力系统暂态稳定实时紧急控制方案[J].中国电机工程学报,2014,34(7):1095-1102. 被引量：42
4易俊,卜广全,郭强,习工伟,张剑云,屠竞哲.巴西“3·21”大停电事故分析及对中国电网的启示[J].电力系统自动化,2019,43(2):1-6. 被引量：123
5吴为,汤涌,孙华东.基于系统加速能量的切机控制措施量化研究[J].中国电机工程学报,2014,34(34):6134-6140. 被引量：19
6庄严,于凤芹.结合节拍语义和MFCC声学特征的音乐流派分类[J].计算机工程与应用,2015,51(3):197-201. 被引量：7
7冀鲁豫,吴俊勇,周艳真,郝亮亮,于之虹,严剑峰.基于WAMS受扰电压轨迹簇特征的电力系统暂态稳定性预测[J].高电压技术,2015,41(3):807-814. 被引量：20
8姜涛,贾宏杰,李国庆,陈厚合,靳小龙.基于广域量测信息相关性的电力系统同调辨识[J].电工技术学报,2017,32(1):1-11. 被引量：18
9刘浏.语境化音乐流派识别[J].安徽大学学报（自然科学版）,2017,41(3):65-72. 被引量：3
10曾辉,孙峰,李铁,张强,唐俊刺,张涛.澳大利亚“9·28”大停电事故分析及对中国启示[J].电力系统自动化,2017,41(13):1-6. 被引量：201

引证文献4

1董安明,刘宗银,禹继国,韩玉冰,周酉.基于视觉变换网络的音乐流派自动分类[J].计算机应用,2022,42(S01):54-58. 被引量：3
2强子玥,吴俊勇,李宝琴,张若愚,覃柳芸,郝亮亮.基于改进AlexNet的电力系统暂态功角失稳紧急控制策略[J].高电压技术,2022,48(7):2794-2804. 被引量：11
3范静.考虑音符序列的钢琴演奏和弦指法自动标注算法[J].常州工学院学报,2022,35(5):39-45. 被引量：1
4焦健,谢展鸿.基于深度置信网络的音乐配乐识别研究[J].信息技术,2024,48(8):174-180.

二级引证文献15

1杨博,陈义军,姚伟,石重托,束洪春.基于新一代人工智能技术的电力系统稳定评估与决策综述[J].电力系统自动化,2022,46(22):200-223. 被引量：40
2向小民,汪杰,卢云.基于小波时频图和AlexNet网络的电弧故障诊断方法[J].国外电子测量技术,2022,41(10):170-177. 被引量：9
3李宏浩,张沛,刘曌.基于深度强化学习的暂态稳定紧急控制决策方法[J].电力系统自动化,2023,47(5):144-152. 被引量：4
4李强,赵峰,刘茂凯,赵林林.双碳目标下面向清洁能源消纳的源网荷储协调控制[J].自动化与仪表,2023,38(7):19-23. 被引量：4
5张哲,秦博宇,高鑫,丁涛.基于CNN-LSTM网络的电网电压稳定紧急控制策略[J].电力系统自动化,2023,47(11):60-68. 被引量：6
6刘嘉诚,刘俊,李雨婷,王光耀.基于两阶段信息压缩的电网动态轨迹预测与稳定性评估[J].电力系统自动化,2023,47(20):13-22.
7党焱.多模式虚拟音乐交互仪器感知技术研究[J].自动化与仪器仪表,2024(1):30-34. 被引量：1
8李鹏,黄文琦,王鑫,梁凌宇,闫昆鹏,孙凌云.数据与知识联合驱动的人工智能方法在电力调度中的应用综述[J].电力系统自动化,2024,48(1):160-175. 被引量：2
9陈薄茹.基于多基频估计的多声部音乐和声自动编配算法[J].赤峰学院学报（自然科学版）,2024,40(3):10-14.
10宋冠林.基于AM-LSTM网络轨迹预测的超实时紧急控制策略研究[J].吉林电力,2024,52(2):20-24.

1陈浩,吴煜祺.基于物联网技术的音乐特征识别系统设计[J].现代电子技术,2020,43(10):43-45. 被引量：3
2周涛,霍兵强,陆惠玲,师宏斌.医学影像疾病诊断的残差神经网络优化算法研究进展[J].中国图象图形学报,2020,25(10):2079-2092. 被引量：5
3肖楚丽,谢一铭,李金成,彭丽文,肖志勇,于旭东.对香豆酸上调BDNF及改善慢性束缚应激诱导小鼠记忆障碍的作用[J].中国应用生理学杂志,2020,36(4):375-378. 被引量：2
4郭鹏,赵建刚,刘义粉,赵光远,鲍双振,刘防震,尹长恒,裴晓露.基于微阵列数据的胃癌相关核心基因的挖掘和鉴定分析[J].临床医学进展,2020,10(11):2695-2704.
5熊丽婷,张绍彪,揭吁菡.两种高吞吐量低延迟光数据中心网络架构研究[J].光通信研究,2020(6):17-20. 被引量：7

智能系统学报

2020年第4期

浏览历史

内容加载中请稍等...

基于增强AlexNet的音乐流派识别研究被引量：4

参考文献14

二级参考文献118

共引文献715

同被引文献46

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于增强AlexNet的音乐流派识别研究 被引量：4

参考文献14

二级参考文献118

共引文献715

同被引文献46

引证文献4

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于增强AlexNet的音乐流派识别研究被引量：4