D-2-DenseNet噪音鲁棒的城市音频分类模型

Noise Robust Urban Audio Classification Based on 2-Order Dense Convolutional Network Using Dual Features

导出

摘要为了提高噪音环境下城市音频分类系统的鲁棒性,提出了一种双特征2阶密集卷积神经网络(D-2-DenseNet)噪音鲁棒的城市音频分类模型.首先介绍了噪音添加和噪音鲁棒处理,阐述了一种双特征互补偿的算法;然后结合2阶密集卷积神经网络与自适应机制提出了一种噪音鲁棒音频分类模型:双特征2阶密集卷积神经网络.模型采用双特征互补偿自适应算法,可在特征提取与模型训练中更有针对性地提取有效音频信息,降低噪音干扰,以提高噪音鲁棒性.最后,基于Dcase2016数据集开展噪音环境下城市音频分类测试.实验结果表明,模型分类准确率分别可达77.12%、75.52%,与基线模型相比,平均分类准确率分别提高了8.51%和10.38%,验证了模型良好的噪音鲁棒性. A noise robust urban sound event classification model based on 2-order dense convolutional network using dual features (D-2-DenseNet) is proposed,which aims at the problems of insufficient robustness of current models. Firstly,the brief introduction of the method of noise adding and robust processing is presented. Moreover,a dual feature mutual compensation algorithm and 2-order dense convolutional network is presented. Meanwhile,a noise robust urban sound event classification model based on 2-DenseNet using dual features,i. e. D-2-DenseNet is proposed. Theoretically,D-2-DenseNet combines the advantages of feature compensation and 2-order dense convolutional neural network. The dual feature mutual compensation adaptive algorithm can effectively extract audio information and reduce noise interference to improve noise robustness. Finally,in order to validate advantages of the D-2-DenseNet,this new model is exploited in the urban sound event classification based on Dcase2016 datasets. Under conditions of channel noise and environmental noise,the experiment shows that the accuracy of the network is respectively 77. 12% and 75. 52%,which has added 8. 51% and 10. 38% compared with baseline. The noise robustness of D-2-DenseNet are also effectively verified.

作者曹毅黄子龙盛永健刘晨费鸿博 CAO Yi;HUANG Zi-long;SHENG Yong-jian;LIU Chen;FEI Hong-bo(School of Mechanical Engineering,Jiangnan University,Wuxi 214122,China)

机构地区江南大学机械工程学院

出处《北京邮电大学学报》 EI CAS CSCD 北大核心 2021年第1期86-91,共6页 Journal of Beijing University of Posts and Telecommunications

基金国家自然科学基金项目(51375209) 江苏省“六大人才高峰”计划项目(ZBZZ-012) 高等学校学科创新引智计划项目(B18027) 江苏省研究生创新计划项目(JNKY20_1928)。

关键词城市音频分类噪音鲁棒性双特征互补偿 2阶密集卷积神经网络双特征2阶密集卷积神经网络 sound event classification noise robust dual features mutual compensation 2-order dense convolutional network 2-order dense convolutional network using dual features

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王静远,李超,熊璋,单志广.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014,51(2):239-259. 被引量：219
2蔡尚,金鑫,高圣翔,潘接林,颜永红.用于噪声鲁棒性语音识别的子带能量规整感知线性预测系数[J].声学学报,2012,37(6):667-672. 被引量：13
3易江燕,陶建华,刘斌,温正棋.基于迁移学习的噪声鲁棒语音识别声学建模[J].清华大学学报（自然科学版）,2018,58(1):55-60. 被引量：5
4仇景明,曲桦,赵季红.一种鲁棒网络流量分类及新类型发现算法[J].北京邮电大学学报,2020(2):40-45. 被引量：2
5王雷,王智广.考虑多种特征因素的设计模式自动识别[J].北京邮电大学学报,2017,40(5):36-42. 被引量：2
6曹毅,黄子龙,张威,刘晨,李巍.N-DenseNet的城市声音事件分类模型[J].西安电子科技大学学报,2019,46(6):9-16. 被引量：6

二级参考文献44

1赵金山,狄增如,王大辉.北京市公共汽车交通网络几何性质的实证研究[J].复杂系统与复杂性科学,2005,2(2):45-48. 被引量：45
2陆化普,石冶.Complexity of Public Transport Networks[J].Tsinghua Science and Technology,2007,12(2):204-213. 被引量：13
3李英,周伟,郭世进.上海公共交通网络复杂性分析[J].系统工程,2007,25(1):38-41. 被引量：65
4Gong Y. Speech recognition in noisy environments: A sur- vey. Speech Communication, 1995; 16:261--291.
5Huang X, Hon H W. Spoken Language Processing: A Guide to Theory, Algorithm and System Development. Prentice Hall PTR, 2001.
6Moreno P. Speech recognition in noisy environments. Ph.D. thesis, Carnegie Mellon University, 1996.
7Gales M J F. The generation and use of regression class trees for MLLR adaptation. Cambridge University, Tech. Rep. CUED/FINFENG/TR263, 1996.
8Varga A, Moore R. Hidden Markov model decomposition of speech and noise. ICASSP, 1990; 2:845--848.
9Ghitza O. Temporal non-plaze information in the auditory- nerve firing patterns as a front-end for speech recognition in a noisy environment. Journal of Phonetics, 1988; 16: 109--123.
10Gajic B, Paliwal K K. Robust speech recognition in noisy environments based on subband spectral centroid his- tograms. IEEE Trans. Audio, Speech, and Language Pro- cessing, 2006; 14:600----608.

共引文献240

1资文杰,贾庆仁,陈浩,李军,景宁.基于Transformer的城市三角网格语义分割方法[J].南京大学学报（自然科学版）,2024,60(1):18-25.
2陈伊玲.基于地理空间大数据的复合空间索引[J].测绘通报,2021(S02):276-279. 被引量：1
3辜华良.冲击器频率的声波测试法[J].长春科技大学学报,2000,30(2):204-205. 被引量：3
4何勇军,付茂国,孙广路.语音特征增强方法综述[J].哈尔滨理工大学学报,2014,19(2):19-25. 被引量：3
5陈能成,刘迎冰,盛浩,王伟.智慧城市时空信息综合决策关键技术与系统[J].武汉大学学报（信息科学版）,2018,43(12):2278-2286. 被引量：15
6安小米,宋刚,路海娟,胡燕华.实现新型智慧城市可持续发展的数据资源协同创新路径研究[J].电子政务,2018(12):90-100. 被引量：23
7侯雷静,郭婷婷,孙燕,齐英杰,应冬文,唐闽,颜永红.面向心音分割的个性化高斯混合建模方法[J].声学学报,2019,44(1):20-27. 被引量：7
8周彬,邹霞,张雄伟.改进的噪声鲁棒语音稀疏线性预测算法[J].声学学报,2014,39(5):655-662. 被引量：1
9柴彦威,申悦,陈梓烽.基于时空间行为的人本导向的智慧城市规划与管理[J].国际城市规划,2014,29(6):31-37. 被引量：75
10彭颖.基于ESB的空间信息集成共享技术研究[J].西南民族大学学报（自然科学版）,2015,41(1):88-92. 被引量：1

1姜燕妮,陈梅,张彩霞.孕前及孕早期环境危险因素暴露与子代先天性心脏病发生的关系[J].实用预防医学,2021,28(5):629-632. 被引量：7
2罗莘涛,陈黎,伍少梅,王昊.基于评论特征提取和隐因子模型的评分预测推荐系统[J].四川大学学报（自然科学版）,2021,58(3):53-60. 被引量：2
3丁少华.基于BIM的装配式建筑预制构件分类与编码体系研究[J].土木建筑工程信息技术,2021,13(2):111-116. 被引量：13
4马贵兰,谭艳,田娅玲,包伦敏,蒋红梅.耐受性树突状细胞通过降低Th1细胞和Th17细胞比例减轻CIA大鼠的关节炎症和病变[J].细胞与分子免疫学杂志,2021,37(3):193-198. 被引量：4
5胥澈.人机工程在煤矿机械设计中的应用[J].装备维修技术,2021(10):0107-0107.
6于敏.基于MHA-Lattice LSTM的中文命名实体识别[J].北京工业职业技术学院学报,2021,20(2):30-35.
7柯永忻,张鹏飞.南海哨兵:岛礁上的“油机专家”[J].当代海军,2021(4):15-16.
8张寅生.新一代人工智能计算模型的创新及其哲学意义[J].学术界,2021(5):59-69. 被引量：3
9田佳鹭,邓立国.结合嵌入模块的细粒度图像分类方法[J].现代计算机,2021,27(11):106-110.

北京邮电大学学报

2021年第1期

浏览历史

内容加载中请稍等...

D-2-DenseNet噪音鲁棒的城市音频分类模型

参考文献6

二级参考文献44

共引文献240

相关作者

相关机构

相关主题

浏览历史