-
题名YOLOX-S声光信息融合目标识别算法
- 1
-
-
作者
杨茸宇
刘凤丽
郝永平
-
机构
沈阳理工大学机械工程学院
沈阳理工大学辽宁省先进制造技术与装备重点实验室
-
出处
《探测与控制学报》
CSCD
北大核心
2024年第5期71-79,共9页
-
基金
装备预研重点实验室基金项目(2021JCJQLB055009)。
-
文摘
针对现代战场单一探测手段的局限性和单模态目标识别存在信息不全面、易受噪声干扰等缺点,提出一种融合声光两种模态的目标识别方法。该方法利用深度卷积残差网络对声纹信息的对数梅尔频谱系数特征进行提取,使用YOLOX-S网络对目标进行光学特征提取,并计算目标的像空间位置与类别信息,然后在YOLOX-S模型预测部分的解耦头中引入用于处理声音特征的支路,将目标的光学特性与声学特性在YOLOX-S检测头分类支路上进行空间归一化,使视觉数据与声纹数据在同一可拼接域上进行映射与融合,对目标的声光融合特征进行识别推理。在自建数据集上进行验证,实验结果表明声纹信息和图像信息融合可以提供更全面的感知能力,使得目标的检测和识别更加准确和可靠。
-
关键词
目标识别
特征融合
YOLOX-S
声纹特征
-
Keywords
target recognition
feature fusion
YOLOX-S
voiceprint features
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-