基于双二流卷积和多特征融合的D-S声音分类被引量：2

D-S sound classification based on double two stream convolution and multi-feature fusion

下载PDF

导出

摘要针对现有模型声音分类精度不足的问题,提出了一种基于多特征双二流网络的D-S融合模型。首先,提出了四种组合特征来更全面有效地表征声音。其次,提出双二流网络结构来更好地训练模型。第一和二流网络采用多分辨率多通道特征送入二阶密集卷积网络(2-DenseNet),其中2-DenseNet被分成了两个密集块。第三和四流网络采用单分辨率单通道的特征拼接送入四层CNN。然后利用D-S证据理论对softmax层的输出结果进行融合,得到D-S-Net模型。实验结果表明,基于UrbanSound8k数据集,经数据增强后该模型的准确率达96.36%,较基线提高了25.34%,并验证了在噪声环境下的鲁棒性,在20 dB信噪比下具有90.34%的识别率,在低信噪比下的性能得到了很好的提升。 In order to solve the problem of insufficient accuracy of sound classification,this paper proposed a Dempster-Shafer(D-S)fusion model based on multi-feature double two stream network.Firstly,this paper proposed four combined features to represent sound more comprehensively and effectively.Secondly,this paper proposed a better training model based on double two stream network architecture.By using multi-resolution and multi-channel features,the first and second stream network feed into second-order dense convolution network(2-DenseNet),in which 2-DenseNet divided into two dense blocks.By using the feature splicing of single resolution and single channel,the third and fourth stream networks fed into the four-layer CNN network.Then it fused output results of softmax based on D-S evidence theory to obtain the D-S-Net model.The experimental results show that based on the UrbanSound8 k data set,the accuracy of the model is 96.34%after data enhancement,which is 25.34%higher than the baseline,which verifies the robustness in noise environment.It has a recognition rate of 90.34%at 20 dB signal to noise ratio(SNR),the performance is greatly improved at low SNR.

作者吴佳赛高振斌 Wu Jiasai;Gao Zhenbin(School of Electronic Information Engineering,Hebei University of Technology,Tianjin 300401,China)

机构地区河北工业大学电子信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2022年第3期693-698,703,共7页 Application Research of Computers

关键词声音分类特征融合密集卷积网络 D-S融合双二流网络 sound classification feature fusion dense convolution network D-S fusion double two stream network

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1王静远,李超,熊璋,单志广.以数据为中心的智慧城市研究综述[J].计算机研究与发展,2014,51(2):239-259. 被引量：219
2何光林,陶斯倩,范红波.基于噪声特征的地震动信号目标预警和识别算法研究[J].北京理工大学学报,2014,34(1):64-67. 被引量：7
3张科,苏雨,王靖宇,王霰宇,张彦华.基于融合特征以及卷积神经网络的环境声音分类系统研究[J].西北工业大学学报,2020,38(1):162-169. 被引量：15
4曾金芳,黄费贞,白冰,徐林涛.基于耳蜗谱图纹理特征的声音事件识别[J].声学技术,2020,39(1):69-75. 被引量：4
5王熙,李应.多频带谱减法用于生态环境声音分类[J].计算机工程与应用,2014,50(3):190-193. 被引量：4
6冯陈定,李少波,姚勇,杨静.基于改进卷积神经网络与动态衰减学习率的环境声音识别算法[J].科学技术与工程,2019,19(1):177-182. 被引量：13
7刘慧,李小霞,何宏森.基于多分辨率特征和时频注意力的环境声音分类[J].计算机应用研究,2021,38(12):3569-3573. 被引量：3
8杨磊,赵红东.基于轻量级深度神经网络的环境声音识别[J].计算机应用,2020,40(11):3172-3177. 被引量：4

二级参考文献36

1李业良,张二华,唐振民.基于混合式注意力机制的语音识别研究[J].计算机应用研究,2020,37(1):131-134. 被引量：9
2赵金山,狄增如,王大辉.北京市公共汽车交通网络几何性质的实证研究[J].复杂系统与复杂性科学,2005,2(2):45-48. 被引量：45
3陆化普,石冶.Complexity of Public Transport Networks[J].Tsinghua Science and Technology,2007,12(2):204-213. 被引量：13
4李英,周伟,郭世进.上海公共交通网络复杂性分析[J].系统工程,2007,25(1):38-41. 被引量：65
5Kiyoshi T, Kenichi I.Analysis of GMM by a Gaussian wavelet transform[J].Procedia Computer Science, 2012, 8 ( 1 ) : 467-472.
6Selami S, Bilginer M.Common vector approach and its combination with GMM for text-independent speaker recog- nition[J].Expert Systems with Applications,2011,38(9): 11394-11400.
7Liao Yi-ching, Wu Chien-min.Fast k-nearest neighbors search using modified principal axis search tree[J].Digital Signal Processing, 2010,20 (5) : 1494-1501.
8Jun T, Mineichi K.Probably correct k-nearest neighbor search in high dimensions[J].Pattern Recognition, 2010, 43(4) 1361-1372.
9Wang Shuiping, Tang Zhenming.Design and implementa- tion of an audio classification system based on SVM[J]. Procedia Engineering, 2011,15 ( 1 ) : 4031-4035.
10Manikanda J, Venkataramani B.Design of a real time automatic speech recognition system using modified one against all SVM classifier[J].Microprocessors and Micro- systems, 2011,35 (6) : 568-578.

共引文献261

1杜晓冬,滕光辉,刘慕霖,赵雨晓,周振宇,祝鹏飞.基于轻量级卷积神经网络的种鸡发声识别方法[J].农业机械学报,2022,53(10):271-276. 被引量：2
2资文杰,贾庆仁,陈浩,李军,景宁.基于Transformer的城市三角网格语义分割方法[J].南京大学学报（自然科学版）,2024,60(1):18-25.
3陈伊玲.基于地理空间大数据的复合空间索引[J].测绘通报,2021(S02):276-279. 被引量：1
4杨智伦,朱铮涛,陈树雄,李博,招祖炜.改进CNN的供水管道泄漏声音识别[J].国外电子测量技术,2023,42(1):153-158. 被引量：4
5陈能成,刘迎冰,盛浩,王伟.智慧城市时空信息综合决策关键技术与系统[J].武汉大学学报（信息科学版）,2018,43(12):2278-2286. 被引量：15
6安小米,宋刚,路海娟,胡燕华.实现新型智慧城市可持续发展的数据资源协同创新路径研究[J].电子政务,2018(12):90-100. 被引量：23
7柴彦威,申悦,陈梓烽.基于时空间行为的人本导向的智慧城市规划与管理[J].国际城市规划,2014,29(6):31-37. 被引量：75
8彭颖.基于ESB的空间信息集成共享技术研究[J].西南民族大学学报（自然科学版）,2015,41(1):88-92. 被引量：1
9张红,王晓明,曹洁,朱昶胜.基于大数据的智能交通体系架构[J].兰州理工大学学报,2015,41(2):112-115. 被引量：36
10胡兴彬,李益华.基于形状参数的车型快速分类方法研究[J].自动化技术与应用,2015,34(4):79-83. 被引量：1

同被引文献21

1田莎莎,唐菀,佘纬.改进MFCC参数在非特定人语音识别中的研究[J].科技通报,2013,29(3):139-142. 被引量：15
2蒋翠清,邵宏波.基于MFCC与改进ACF的汽车声音识别算法研究[J].计算机技术与发展,2015,25(2):140-143. 被引量：6
3陈炜亮,孙晓.基于MFCCG-PCA的语音情感识别[J].北京大学学报（自然科学版）,2015,51(2):269-274. 被引量：16
4史秋莹,郑铁然.基于深度学习的环境声音识别[J].智能计算机与应用,2018,8(5):34-37. 被引量：7
5周萍,沈昊,郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J].应用科学学报,2019,37(1):24-32. 被引量：42
6张科,苏雨,王靖宇,王霰宇,张彦华.基于融合特征以及卷积神经网络的环境声音分类系统研究[J].西北工业大学学报,2020,38(1):162-169. 被引量：15
7赵薇,靳聪,涂中文,SRIDHAR Krishnan,刘杉.基于多特征融合的SVM声学场景分类算法研究[J].北京理工大学学报,2020,40(1):69-75. 被引量：15
8孙继平.煤矿瓦斯和煤尘爆炸感知报警与爆源判定方法研究[J].工矿自动化,2020,46(6):1-5. 被引量：20
9孙继平,范伟强.基于视频图像的瓦斯和煤尘爆炸感知报警及爆源判定方法[J].工矿自动化,2020,46(7):1-4. 被引量：15
10耿琪深,王丰华,金霄.基于Gammatone滤波器倒谱系数与鲸鱼算法优化随机森林的干式变压器机械故障声音诊断[J].电力自动化设备,2020,40(8):191-196. 被引量：28

引证文献2

1周帅,李理,彭章君,黄鹏程.基于多通道特征和混合注意力的环境声音分类[J].计算机技术与发展,2023,33(8):43-50.
2余星辰,李小伟.基于特征融合的煤矿瓦斯和煤尘爆炸声音识别方法[J].煤炭学报,2023,48(S02):638-646.

1林水生,卫伯言,杨海芬,熊勇,朱磊基,于良.引入新数据源的D-S融合检测方法[J].电子科技大学学报,2021,50(6):861-867. 被引量：4
2任超.硬核技术驱动元宇宙七层价值链[J].企业家,2021(6):68-69.
3牛迪.基于自注意力机制的多特征融合槽抽取模型[J].南京理工大学学报,2022,46(1):69-75. 被引量：2
4魏曙寰,曾强,陈砚桥.基于AHP/D-S证据理论的贝叶斯网络参数学习方法[J].海军工程大学学报,2021,33(6):19-24. 被引量：4
5李云飞,王红成.基于双分支卷积和注意力机制的无参考图像质量评估[J].东莞理工学院学报,2022,29(1):77-84. 被引量：1
6胡海星,王宜贵,袁卫华,张志军,秦倩倩.基于评论文本的自适应特征提取推荐研究[J].软件导刊,2022,21(2):1-7. 被引量：1
7孟明,董芝超,高云园,孔万增.基于相关性和稀疏表示的运动想象脑电通道选择方法[J].电子与信息学报,2022,44(2):477-485. 被引量：5
8武滢.基于主轴电流信号多特征融合的刀具磨损状态监测[J].制造技术与机床,2022(3):44-48. 被引量：4
9宋宇,王小瑀,梁超,程超.基于多级特征图联合上采样的实时语义分割[J].计算机技术与发展,2022,32(2):82-87. 被引量：1
10刘英明.RBF神经网络的多特征融合目标跟踪算法[J].单片机与嵌入式系统应用,2022,22(3):32-35.

计算机应用研究

2022年第3期

浏览历史

内容加载中请稍等...

基于双二流卷积和多特征融合的D-S声音分类被引量：2

参考文献8

二级参考文献36

共引文献261

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于双二流卷积和多特征融合的D-S声音分类 被引量：2

参考文献8

二级参考文献36

共引文献261

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于双二流卷积和多特征融合的D-S声音分类被引量：2