N-DenseNet的城市声音事件分类模型被引量：6

Urban sound event classification with the N-order dense convolutional network

下载PDF

导出

摘要针对城市声音事件分类领域中现有模型分类准确率不高、泛化能力不强的问题,提出了一种N阶密集卷积神经网络的城市声音事件分类模型。首先,介绍了密集卷积神经网络的结构;其次,基于N阶马尔可夫模型将密集连接改进为N阶有关连接;然后,结合两者提出了一种更适合音频分类的模型--N阶密集卷积神经网络。该模型在避免梯度消失的前提下,有针对性、规律性减少了特征图层之间的连接,更高效地融合了前N特征图层的信息,使得模型的收敛速度更快;最后,为了验证该模型,采用N阶密集卷积神经网络的一阶、二阶子模型,基于UrbanSound8K和Dcase2016数据集开展了城市声音事件分类研究。研究结果表明,其模型准确率分别为83.63%、81.03%,验证了该模型具有良好的分类准确率和泛化能力。 An urban sound event classification model based on the N-order Dense Convolutional Network(abbreviated to N-DenseNet)is proposed for the problems of insufficient classification accuracy and generalization ability of existing models.First,the network structure of the DenseNet is briefly introduced.Then,dense connection in the DenseNet is improved by N-order state-dependent connection based on the Norder Markov model.Furthermore,combining advantages of both the DenseNet and N-order Markov,a novel network architecture,i.e.,the N-DenseNet,is proposed in this paper.Theoretically,the NDenseNet satisfying the premise of alleviating vanishing-gradient,can not only produce efficient integration of feature information from the layers,but also accelerate the convergence speed.Finally,in order to validate advantages of the new model,1-DenseNet and 2-DenseNet are respectively exploited in the urban sound event classification based on the UrbanSound8 Kand Dcase2016 dataset.Experimental results show that the accuracy of the two above-mentioned models is respectively 83.63%and 81.03%,which also demonstrates a higher classification accuracy and a better generalization performance of the N-DenseNet.

作者曹毅黄子龙张威刘晨李巍 CAO Yi;HUANG Zilong;ZHANG Wei;LIU Chen;LI Wei(School of Mechanical Engineering,Jiangnan University,Wuxi 214122,China;Jiangsu Key Laboratory of Advanced Food Manufacturing Equipment and Technology,Wuxi 214122,China;Suzhou Instiute of Industrial Technology,Suzhou 215104,China)

机构地区江南大学机械工程学院江苏省食品先进制造装备技术重点实验室苏州工业职业技术学院

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期9-16,94,共9页 Journal of Xidian University

基金江苏省“六大人才高峰”计划（ZBZZ-012）高等学校学科创新引智计划（B18027）江苏省研究生创新计划（KYCX18_0630,KYCX18_1846）江南大学研究生科研与实践创新计划（JNKY19_048,JNSJ19_005）

关键词声音事件分类密集卷积神经网络 N阶马尔可夫模型 N阶密集卷积神经网络 sound event classification dense convolutional network N-order Markov model N-order dense convolutional

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1郭晶晶,马建峰.面向虚拟社区物联网的信任推荐算法[J].西安电子科技大学学报,2015,42(2):52-57. 被引量：10
2王瑞,王康晏,冯玉田,张海燕,金彦亮,张有正.复杂场景下声频传感器网络核稀疏表示车辆识别[J].西安电子科技大学学报,2015,42(4):114-120. 被引量：7
3李东,张雪英,段淑斐,闫密密.结合语音融合特征和随机森林的构音障碍识别[J].西安电子科技大学学报,2018,45(3):149-155. 被引量：8
4吴仁彪,赵婷,屈景怡.基于深度SE-DenseNet的航班延误预测模型[J].电子与信息学报,2019,41(6):1510-1517. 被引量：31
5仲伟峰,方祥,范存航,温正棋,陶建华.深浅层特征及模型融合的说话人识别[J].声学学报,2018,43(2):263-272. 被引量：11
6王静远,李超,熊璋,单志广.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014,51(2):239-259. 被引量：217

二级参考文献63

1YUYibiao,WANGShuozhong.Speaker identification based on complete feature corpus and evaluation of mutual information[J].Chinese Journal of Acoustics,2005,24(3):280-288. 被引量：1
2俞一彪,王朔中.文本无关说话人识别的全特征矢量集模型及互信息评估方法[J].声学学报,2005,30(6):536-541. 被引量：7
3赵金山,狄增如,王大辉.北京市公共汽车交通网络几何性质的实证研究[J].复杂系统与复杂性科学,2005,2(2):45-48. 被引量：45
4肖汉光,蔡从中,廖克俊.利用声波和地震波识别军事车辆类型[J].系统工程理论与实践,2006,26(4):108-113. 被引量：7
5陆化普,石冶.Complexity of Public Transport Networks[J].Tsinghua Science and Technology,2007,12(2):204-213. 被引量：13
6李英,周伟,郭世进.上海公共交通网络复杂性分析[J].系统工程,2007,25(1):38-41. 被引量：65
7刘伟,陈刚,迟广明.脑瘫治疗的现状[J].中国康复理论与实践,2007,13(12):1118-1120. 被引量：33
8Lee G M,Crespi N,Choi J K,et al.Internet of Things[J].Evolution of Telecommunication Services,2013,7768:257-282.
9Jara A J,Zamora-Izquierdo M A,Skarmeta A F.Interconnection Framework for mHealth and Remote Monitoring Based on the Internet of Things[J].IEEE Journal on Selected Areas in Communications,2013,31(9):47-65.
10Cho J H,Swami A,Chen I R.Modeling and Analysis of Trust Management with Trust Chain Optimization in Mobile Ad Hoc Networks[J].Journal of Network and Computer Applications,2012,35(3):1001-1012.

共引文献278

1陈伊玲.基于地理空间大数据的复合空间索引[J].测绘通报,2021(S02):276-279. 被引量：1
2陈能成,刘迎冰,盛浩,王伟.智慧城市时空信息综合决策关键技术与系统[J].武汉大学学报（信息科学版）,2018,43(12):2278-2286. 被引量：14
3安小米,宋刚,路海娟,胡燕华.实现新型智慧城市可持续发展的数据资源协同创新路径研究[J].电子政务,2018(12):90-100. 被引量：23
4柴彦威,申悦,陈梓烽.基于时空间行为的人本导向的智慧城市规划与管理[J].国际城市规划,2014,29(6):31-37. 被引量：74
5彭颖.基于ESB的空间信息集成共享技术研究[J].西南民族大学学报（自然科学版）,2015,41(1):88-92. 被引量：1
6张红,王晓明,曹洁,朱昶胜.基于大数据的智能交通体系架构[J].兰州理工大学学报,2015,41(2):112-115. 被引量：36
7胡兴彬,李益华.基于形状参数的车型快速分类方法研究[J].自动化技术与应用,2015,34(4):79-83. 被引量：1
8高志远,姚建国,郭昆亚,曹阳,宋宁希,李强,孙芊.智能电网对智慧城市的支撑作用研究[J].电力系统保护与控制,2015,43(11):148-153. 被引量：39
9王智莉,卜方玲.异构感知数据的动态适配接入方法[J].传感器与微系统,2015,34(6):13-16. 被引量：6
10高琳琳,马丹,刘岩.智慧城市建设的奠基石——云计算、大数据和物联网[J].现代商业,2015(17):265-266. 被引量：3

同被引文献21

1仇景明,曲桦,赵季红.一种鲁棒网络流量分类及新类型发现算法[J].北京邮电大学学报,2020(2):40-45. 被引量：2
2王玥,钱志鸿,王雪,程光明.基于伽马通滤波器组的听觉特征提取算法研究[J].电子学报,2010,38(3):525-528. 被引量：28
3蔡尚,金鑫,高圣翔,潘接林,颜永红.用于噪声鲁棒性语音识别的子带能量规整感知线性预测系数[J].声学学报,2012,37(6):667-672. 被引量：12
4王静远,李超,熊璋,单志广.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014,51(2):239-259. 被引量：217
5许迅.我国眼底病研究发展现状、进展和努力方向[J].中华眼科杂志,2014,0(11):801-803. 被引量：29
6邢安昊,张鹏远,潘接林,颜永红.基于SVD的DNN裁剪方法和重训练[J].清华大学学报（自然科学版）,2016,56(7):772-776. 被引量：3
7丁蓬莉,李清勇,张振,李峰.糖尿病性视网膜图像的深度神经网络分类方法[J].计算机应用,2017,37(3):699-704. 被引量：24
8Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan.A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J].International Journal of Automation and computing,2017,14(2):119-135. 被引量：36
9周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1556
10王雷,王智广.考虑多种特征因素的设计模式自动识别[J].北京邮电大学学报,2017,40(5):36-42. 被引量：2

引证文献6

1张威,刘晨,费鸿博,李巍,俞经虎,曹毅.基于DL-T及迁移学习的语音识别研究[J].工程科学学报,2021,43(3):433-441. 被引量：4
2翟明浩,张威,黄子龙,刘晨,李巍,曹毅.结合语义分割和特征融合的行人检测方法[J].东华大学学报（自然科学版）,2021,47(2):65-72.
3曹毅,黄子龙,盛永健,刘晨,费鸿博.D-2-DenseNet噪音鲁棒的城市音频分类模型[J].北京邮电大学学报,2021,44(1):86-91.
4张彤,孟亮.基于注意力神经网络的糖尿病视网膜病变识别[J].计算机工程与科学,2022,44(3):479-485. 被引量：3
5韦娟,杨皇卫,宁方立.基于NMF与CNN联合优化的声学场景分类[J].系统工程与电子技术,2022,44(5):1433-1438. 被引量：3
6曹毅,费鸿博,李平,张小勇.基于多流卷积和数据增强的声场景分类方法[J].华中科技大学学报（自然科学版）,2022,50(4):40-46. 被引量：3

二级引证文献13

1温伍正宏,潘甦,张坤.基于大数据和深度学习的语音识别研究[J].软件,2022,43(1):133-135. 被引量：5
2王告.基于改进LeNet-5网络的污泥沉降比检测研究[J].软件导刊,2023,22(1):224-228.
3张添添,王婧.基于At-LSTM模型的音/视频双流语音识别算法仿真[J].计算机仿真,2023,40(1):251-254. 被引量：1
4徐盼盼,陈长骏,闫志文,李林超.基于MA-DRNet的糖尿病视网膜病变等级识别方法[J].科学技术与工程,2023,23(3):1168-1175. 被引量：1
5曹战,于鹏,陈华.基于注意力U-Net模型的露头裂缝自动识别方法[J].科学技术与工程,2023,23(10):4149-4156.
6王泽雨,王国靖.基于改进卷积神经网络的声音事件分类模型[J].信息技术与信息化,2023(5):181-184. 被引量：1
7赵庆媛,赵志强,叶春茂,鲁耀兵.气动目标多频点调制谱融合增强识别方法[J].系统工程与电子技术,2023,45(7):2043-2050.
8杨静,吉晓阳,李少波,胡建军,王阳,刘庭卿.具有正则化约束的脉冲神经网络机器人触觉物体识别方法[J].电子与信息学报,2023,45(7):2595-2604. 被引量：1
9金豪圣.基于深度学习的智能机器人语音自动校准系统[J].电子设计工程,2023,31(24):95-99.
10高适,金宇,黄宇.基于改进卷积神经网络的汉语连续语音识别方法[J].信息与电脑,2023,35(18):114-116.

1王金甲,纪绍男,崔琳,夏静,杨倩.基于注意力胶囊网络的家庭活动识别[J].自动化学报,2019,45(11):2199-2204. 被引量：7
2郝向英,刘平,吴燕妮.谈化学科核心素养的"认知模型"和"'模型认知'过程"[J].师道（教研）,2019,0(12):180-182.
3高利剑,毛启容.环境辅助的多任务混合声音事件检测方法[J].计算机科学,2020,47(1):159-164. 被引量：1
4黄河,周步祥,张致强,刘治凡,袁岳,邹家惠.基于FBE算法的非侵入式事件检测方法[J].水电能源科学,2019,37(10):158-162.
5李卓容,王凯旋,何欣龙,糜忠良,唐云祁.基于卷积神经网络的足跟着地事件检测算法[J].激光与光电子学进展,2019,56(21):139-147. 被引量：5
6舒军,杨露,陈义红,杨莉,邓芳.基于小数据集的改进LeNet图像分类模型研究[J].中南民族大学学报（自然科学版）,2019,38(4):605-612. 被引量：3
7王鹏.铁路站场BIM技术应用研究[J].铁道标准设计,2019,63(11):27-29. 被引量：17
8於海明,徐佳琪,刘浩鲁,刘超,张大成,陈坤杰.基于高光谱和频谱特征的注水肉识别方法[J].农业机械学报,2019,50(11):367-372. 被引量：12

西安电子科技大学学报

2019年第6期

浏览历史

内容加载中请稍等...

N-DenseNet的城市声音事件分类模型被引量：6

参考文献6

二级参考文献63

共引文献278

同被引文献21

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

N-DenseNet的城市声音事件分类模型 被引量：6

参考文献6

二级参考文献63

共引文献278

同被引文献21

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

N-DenseNet的城市声音事件分类模型被引量：6