采用混合域注意力机制的无人机识别方法被引量：6

Drone Identification Method Based on Mixed Domain Attention Mechanism

下载PDF

导出

摘要针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。 An economical,convenient and undisturbed drone detection method using sound and multiscale group convolution network with attention mechanism in mixed domain of channel space(ECSANet)is proposed in the context of susceptibility to electronic interference in identification of drones by radar and radio,and the interference of light and obstruction in identification of drones by images in public environments such as urban parks,squares and large amusement parks.Firstly,nine kinds of sound dataset of civil drones are established,and their logarithmic Mel spectra and dynamic characteristics are extracted.Secondly,based on packet convolution,channel shuffling and residual structure,a multi-scale group convolution network with channel shuffle(MSSGNet)is designed to reduce the network parameters and avoid over fitting.Then,the efficient channel and spatial attention(ECSA)is designed to extract more and more effective features of drone sounds.Finally,the ECSA is inserted into the MSSGNet to form an improved multiscale group convolution network with attention mechanism in mixed domain of channel space(ECSANet),offering a new method for sound recognition of drones.The designed ECSANet is used to identify the self-built civil drone sound dataset and environmental sound dataset urbansound8k.The results reveal that when compared with benchmark networks such as ResNet18,ResNet34,ResNeXt18,and MobileNetV2,the MSSGNet has fewer network parameters but a higher identification accuracy(up to 95.1%).The ECSA can be inserted into a variety of networks to improve identification accuracy of network models without introducing too many parameters,and it works well for sound classification tasks like drones.As compared with the MSSGNet,the improved ECSANet has an identification accuracy of 95.9%,an increase of 0.8 percent,demonstrating the superiority and feasibility in identifying a small sample of drones.

作者薛珊卫立炜顾宸瑜吕琼莹 XUE Shan;WEI Liwei;GU Chenyu;Lü Qiongying(School of Mechanical and Electrical Engineering,Changchun University of Science and Technology,Changchun 130022,China;Chongqing Research Institute,Changchun University of Science and Technology,Chongqing 401135,China;School of Information and Communications Engineering,Xi’an Jiaotong University,Xi’an 710049,China)

机构地区长春理工大学机电工程学院长春理工大学重庆研究院西安交通大学信息与通信工程学院

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第10期141-150,共10页 Journal of Xi'an Jiaotong University

基金吉林省重点科技研发资助项目(20180201058SF) 吉林省教育厅科学技术研究资助项目(JJKH20210812KJ)。

关键词无人机声音识别对数梅尔谱图神经网络混合域注意力机制 drone voice recognition log Mel-spectrogram neural network mixed domain attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1罗俊海,王芝燕.无人机探测与对抗技术发展及应用综述[J].控制与决策,2022,37(3):530-544. 被引量：29
2陈唯实,黄毅峰,卢贤锋.多传感器融合的无人机探测技术应用综述[J].现代雷达,2020,42(6):15-29. 被引量：15
3李云红,梁思程,贾凯莉,张秋铭,宋鹏,何琛,王刚毅,李禹萱.一种改进的DNN-HMM的语音识别方法[J].应用声学,2019,38(3):371-377. 被引量：17
4余浩帅,汤宝平,张楷,谭骞,魏静.小样本下混合自注意力原型网络的风电齿轮箱故障诊断方法[J].中国机械工程,2021,32(20):2475-2481. 被引量：23
5郑作武,邵斯绮,高晓沨,陈贵海.基于社交圈层和注意力机制的信息热度预测[J].计算机学报,2021,44(5):921-936. 被引量：5
6孙红帅,王霞,柳萱,张连超,赵兴杰.频域注意力机制下的癫痫脑电信号分类[J].西安交通大学学报,2021,55(2):129-135. 被引量：8
7莫仁鹏,李天梅,司小胜,朱旭.采用残差网络与卷积注意力机制的设备剩余使用寿命预测方法[J].西安交通大学学报,2022,56(4):194-202. 被引量：8
8张连超,乔瑞萍,党祺玮,翟沛源,孙红帅.具有全局特征的空间注意力机制[J].西安交通大学学报,2020,54(11):129-138. 被引量：9

二级参考文献59

1罗俊海,杨阳.基于数据融合的目标检测方法综述[J].控制与决策,2020,35(1):1-15. 被引量：26
2E.K.Silberman,H.Weingartier,王益明.情绪的大脑半球功能的单侧化[J].心理科学进展,1992,2(1):26-31. 被引量：2
3孟庆芳,周卫东,陈月辉,彭玉华.基于非线性预测效果的癫痫脑电信号的特征提取方法[J].物理学报,2010,59(1):123-130. 被引量：12
4胡政权,曾毓敏,宗原,李梦超.说话人识别中MFCC参数提取的改进[J].计算机工程与应用,2014,50(7):217-220. 被引量：28
5赵涛涛,杨鸿武.结合EMD和加权Mel倒谱的语音共振峰提取算法[J].计算机工程与应用,2015,51(9):207-212. 被引量：7
6刘玉文,廖小兵,蒋明,段菖蒲.反无人机技术体系基本框架构建[J].四川兵工学报,2015,36(10):18-20. 被引量：31
7陈唯实,刘佳,陈小龙,李敬.基于运动模型的低空非合作无人机目标识别[J].北京航空航天大学学报,2019,45(4):687-694. 被引量：23
8罗倩.基于稀疏表示的杂波建模和微弱运动目标探测[J].现代雷达,2016,38(2):43-46. 被引量：5
9伍光新,刘鹏,沈伟,谢洲烨.有源雷达与红外探测器组网定位精度分析[J].现代雷达,2016,38(5):1-3. 被引量：1
10邓侃,欧智坚.深层神经网络语音识别自适应方法研究[J].计算机应用研究,2016,33(7):1966-1970. 被引量：15

共引文献104

1蒋冬婷,范长军,雍其润,瞿崇晓,刘硕,张永晋.面向重点区域安防的无人机探测与反制技术研究[J].应用科学学报,2022,40(1):167-178. 被引量：12
2张冉,宋宝燕,单晓欢,王俊陆.多源异构区块链数据质量评估模型[J].计算机与数字工程,2023,51(1):14-19.
3高雷阜,荣雪娇,吴涛,高金鑫.多约束下智能飞行器航迹规划的误差校正方法[J].辽宁工程技术大学学报（自然科学版）,2021,40(6):558-566. 被引量：1
4谢将剑,杨俊,邢照亮,张卓,陈新.多特征融合的鸟类物种识别方法[J].应用声学,2020,39(2):199-206. 被引量：13
5张威,翟明浩,黄子龙,李巍,曹毅.SE-MCNN-CTC的中文语音识别声学模型[J].应用声学,2020,39(2):223-230. 被引量：10
6周红锴.基于单片机控制的孤立词语音自动识别系统设计[J].现代电子技术,2020,43(18):64-66. 被引量：2
7徐振华,杨江洪,牛利民,霍恩来.传感器飞机国内外研究进展和作战使用模式分析[J].传感器世界,2020,26(9):7-11. 被引量：3
8郑文秀,赵峻毅,文心怡,姚引娣.基于瓶颈复合特征的声学模型建立方法[J].计算机工程,2020,46(11):301-305. 被引量：3
9宓林晖,袁骏毅,潘常青,沈晓冬.基于智能语音识别技术的医技报告交互系统的设计与应用[J].中国医疗设备,2021,36(2):92-95. 被引量：16
10林思岑.基于去相关化的低秩矩阵分解对口语能力的评估方法[J].微型电脑应用,2021,37(2):33-36.

同被引文献47

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：7
2杨智伦,朱铮涛,陈树雄,李博,招祖炜.改进CNN的供水管道泄漏声音识别[J].国外电子测量技术,2023,42(1):153-158. 被引量：4
3陶磊,洪韬,钞旭.基于YOLOv3的无人机识别与定位追踪[J].工程科学学报,2020,42(4):463-468. 被引量：26
4崔艳鹏,王元皓,胡建伟.一种改进YOLOv3的动态小目标检测方法[J].西安电子科技大学学报,2020,47(3):1-7. 被引量：27
5陈勇,刘曦,刘焕淋.基于特征通道和空间联合注意机制的遮挡行人检测方法[J].电子与信息学报,2020,42(6):1486-1493. 被引量：14
6汪昱东,郭继昌,王天保.一种改进的雾天图像行人和车辆检测算法[J].西安电子科技大学学报,2020,47(4):70-77. 被引量：18
7陈小龙,陈唯实,饶云华,黄勇,关键,董云龙.飞鸟与无人机目标雷达探测与识别技术进展与展望[J].雷达学报（中英文）,2020,9(5):803-827. 被引量：40
8薛珊,李广青,吕琼莹,毛逸维.基于卷积神经网络的反无人机系统声音识别方法[J].工程科学学报,2020,42(11):1516-1524. 被引量：8
9丛龙剑,刘燕欣,靳松直,郝梦茜,刘严羊硕,周斌,张辉.一种小尺度目标检测卷积神经网络设计[J].西北工业大学学报,2020,38(S01):146-153. 被引量：1
10郭泽坤,田隆,韩宁,王鹏辉,刘宏伟,陈渤.采用CNN-SSD的雷达HRRP小样本目标识别方法[J].西安电子科技大学学报,2021,48(2):7-14. 被引量：7

引证文献6

1薛珊,张亚亮,吕琼莹,曹国华.复杂背景下的反无人机系统目标检测算法[J].吉林大学学报（工学版）,2023,53(3):891-901. 被引量：2
2薛珊,王亚博,吕琼莹,曹国华.基于YOLOX-drone的反无人机系统抗遮挡目标检测算法[J].工程科学学报,2023,45(9):1539-1549. 被引量：2
3薛珊,卢涛,吕琼莹,曹国华.基于多尺度融合和轻量化网络的无人机目标检测算法[J].湖南大学学报（自然科学版）,2023,50(8):82-93. 被引量：1
4孟焕.基于多特征融合与随机森林的汉语普通话声调识别算法研究[J].自动化与仪器仪表,2023(11):39-43.
5薛珊,安宏宇,吕琼莹,曹国华.复杂背景下基于YOLOv7-tiny的图像目标检测算法[J].红外与激光工程,2024,53(1):261-272.
6郑滨汐,杨志钢,丁钰峰.基于主干增强和特征重排的反无人机目标跟踪[J].液晶与显示,2024,39(4):532-542.

二级引证文献3

1江祥奎,杜遥遥,胡浩昌.一种改进YOLOv5s小目标无人机实时检测算法[J].西安邮电大学学报,2023,28(3):88-96.
2梁迎港,吴韶波.基于深度学习的反无人机视觉检测方法研究[J].计算机科学与技术汇刊（中英文版）,2023,10(2):1-6.
3薛珊,安宏宇,吕琼莹,曹国华.复杂背景下基于YOLOv7-tiny的图像目标检测算法[J].红外与激光工程,2024,53(1):261-272.

1穆鑫瑞.体态律动教学法在小学音乐课堂中的应用探究[J].艺术科技,2022,35(8):203-205.
2孟艳霞.多元识读框架下视频广告的多模态意义构建——以央视“社会主义核心价值观”宣传广告为例[J].考试与评价,2022(3):120-124.
3王昊,刘渊晨,赵萌,裘靖文.基于多模态特征的音乐情感多任务识别研究[J].现代情报,2022,42(11):61-75. 被引量：1
4张名芳,吴禹峰,王力,王庞伟.基于金字塔特征融合的二阶段三维点云车辆检测[J].交通运输系统工程与信息,2022,22(5):107-116. 被引量：1
5张洋,岳峻,贾世祥,李振波,盛国瑞.基于可见光谱和卷积神经网络的贝类识别方法[J].光谱学与光谱分析,2022,42(10):3298-3306.
6张正吉.新媒体时代广播电视台播音主持的特点和技巧探讨[J].广告大观,2022(5):0078-0080.
7李园园.以年度网络热词为例探究网络语言对汉语言文化的影响[J].花溪,2022(30):0121-0123.
8万智勇,周松斌,刘忆森,肖明,李昌,邱泽帆.基于双通道自监督编码器的机械声音异常检测[J].组合机床与自动化加工技术,2022(10):128-132. 被引量：1
9任军胜,晁永生.基于改进YOLOX-S的机械臂自主识别抓取[J].组合机床与自动化加工技术,2022(10):59-63. 被引量：1

西安交通大学学报

2022年第10期

浏览历史

内容加载中请稍等...

采用混合域注意力机制的无人机识别方法被引量：6

参考文献8

二级参考文献59

共引文献104

同被引文献47

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

采用混合域注意力机制的无人机识别方法 被引量：6

参考文献8

二级参考文献59

共引文献104

同被引文献47

引证文献6

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

采用混合域注意力机制的无人机识别方法被引量：6