CNN-XGBoost混合模型在音频场景分类中的应用被引量：2

Application of CNN-XGBoost Hybrid Model in Acoustic Scene Classification

下载PDF

导出

摘要在拥有海量数据和强大计算能力的人工智能时代,音频场景分类成为了场景理解的重要研究内容之一.针对音频场景分类建模困难和精确率不高的问题,本文提出一种基于卷积神经网络和极端梯度提升算法相结合的系统模型.首先,将预处理后的音频信号转换成梅尔声谱图,然后输入到卷积神经网络中完成抽象特征提取,最后利用极端梯度提升算法进行分类.为了评估模型的有效性,在城市音频场景UrbanSound8K数据集上进行分类性能测试,结果表明,该混合算法模型对音频场景的分类精确率可以达到89%,优于传统的神经网络算法模型,说明该混合模型对音频场景分类问题的有效性. At the age of artificial intelligence w ith massive data and pow erful computing performance,acoustic scene classification has become one of the most important research contents in the field of scene understanding. To solve the problems of difficulty and low accuracy in audio scene classification modeling,this paper proposes a system model based on convolutional neural netw ork and extreme gradient boosting. Firstly,the preprocessed audio signals are transformed into M el spectrum,and then input to convolutional neural netw ork to extract abstract features. Finally,the extreme gradient boosting algorithm is used for classification. In order to evaluate the effectiveness of the model,the performance of the classification is tested on the UrbanSound8 K data set. The results show that the accuracy of the hybrid algorithm model for the classification of audio scenes can reach 89%,w hich is superior to the traditional neural netw ork algorithm model. The validity of the hybrid model for audio scene classification is verified.

作者杨立东胡江涛张壮壮 YANG Li-dong;HU Jiang-tao;ZHANG Zhuang-zhuang(Inner Mongolia University of Science and Technology,School of Information Engineering,Baotou 014010,China)

机构地区内蒙古科技大学信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2021年第1期213-217,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61640012)资助内蒙古自然科学基金项目(2017MS(LH)0602)资助。

关键词音频场景分类卷积神经网络极端梯度提升梅尔声谱图 acoustic scene classification CNN XGBoost mel spectrogram

分类号 TP391 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献16

1方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38. 被引量：661
2陈发广,周步祥,曾澜钰.基于多信息融合的变压器运行状态评估模型[J].电力系统及其自动化学报,2013,25(4):140-144. 被引量：24
3徐岩,陈昕.基于合作博弈和云模型的变压器状态评估方法[J].电力自动化设备,2015,35(3):88-93. 被引量：52
4张惠玲,张蒙.网络节点重要性的多指标综合评价方法[J].西安邮电大学学报,2016,21(1):38-41. 被引量：8
5徐敬友,陈冲,罗纯坚,陈曦,熊炜,林湘宁.基于改进复杂网络模型的电网关键环节辨识[J].电力系统自动化,2016,40(10):53-61. 被引量：32
6Weixing Zhu,Zhixue Wang,Guolin Hou,Minggang Yu.Capability-based context ontology modeling and reasoning for C^4ISR communication[J].Journal of Systems Engineering and Electronics,2016,27(4):845-857. 被引量：4
7李婉华,陈宏,郭昆,郭松荣,韩嘉民,陈羽中.基于随机森林算法的用电负荷预测研究[J].计算机工程与应用,2016,52(23):236-243. 被引量：52
8张钰,陈珺,王晓峰,刘飞,周文晶,王志国.随机森林在滚动轴承故障诊断中的应用[J].计算机工程与应用,2018,54(6):100-104. 被引量：39
9李恒,张氢,秦仙蓉,孙远韬.基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J].振动与冲击,2018,37(19):124-131. 被引量：267
10龚思丞,黄文焘,邰能灵,邓佳莉,马洲俊,张勇.基于复杂网络的电热微网拓扑综合评估方法[J].电力系统自动化,2019,43(23):173-184. 被引量：5

引证文献2

1周杨.基于CNN-RF滚动轴承故障诊断研究[J].自动化与仪表,2021,36(7):51-57. 被引量：1
2曹现刚,陈瑞昊,李彦川,伍宇泽,岳东.基于XGBoost的采煤机健康状态评估方法研究[J].煤炭工程,2022,54(5):175-181. 被引量：5

二级引证文献6

1刘东川,邓艾东,赵敏,卞文彬,许猛.基于改进深度森林的旋转机械故障诊断方法[J].振动与冲击,2022,41(21):19-27. 被引量：7
2胡鹏鹏.采煤机运行时健康状态识别研究[J].矿业装备,2023(1):174-176.
3曹建文.分布式电牵引采煤机健康状态监控系统设计[J].煤矿机械,2023,44(3):213-216. 被引量：3
4周梓健.基于记忆切割法的滚筒式采煤机调高系统自动化性能研究[J].中国煤炭,2023,49(S02):326-329. 被引量：2
5吴珊.采煤机截割部截齿受力的变化分析[J].机械管理开发,2024,39(1):76-77.
6李晓真,张海波,王光远.基于ISSA-FNN的采煤机健康状态评估[J].煤矿机械,2024,45(3):168-171.

1杨立东,张壮壮.改进卷积神经网络的音频场景分类研究[J].现代电子技术,2021,44(3):91-94. 被引量：5
2孙祁.诺镍巨额罚单下的俄罗斯生态立法[J].检察风云,2021(6):56-57.
3张继凯,赵君,张然,吕晓琪,聂俊岚.深度学习的图像实例分割方法综述[J].小型微型计算机系统,2021,42(1):161-171. 被引量：31
4叶晴.与键盘打字相比,手写有助于改善学习和记忆[J].妇女生活（现代家长）,2021(1):58-58.
5石立新.基于改进蚁群算法的机器人路径规划研究[J].航空计算技术,2021,51(2):28-31. 被引量：4
6李俊青,杜宇,田杰,段培永,潘全科.带运输资源约束柔性作业车间调度问题的人工蜂群算法[J].电子学报,2021,49(2):324-330. 被引量：15
7李梦瑶,周亚同,韦创,李民.无人货架场景下的人体关节点定位算法研究[J].计算机工程与科学,2021,43(3):494-502. 被引量：1
8李璐琪,蔡成林.基于深度学习和边缘检测的动态场景下鲁棒SLAM[J].传感技术学报,2021,34(1):80-88. 被引量：6

小型微型计算机系统

2021年第1期

浏览历史

内容加载中请稍等...

CNN-XGBoost混合模型在音频场景分类中的应用被引量：2

同被引文献16

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

CNN-XGBoost混合模型在音频场景分类中的应用 被引量：2

同被引文献16

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

CNN-XGBoost混合模型在音频场景分类中的应用被引量：2