针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在...针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在网络结构中引入通道自适应感受野模块和RepVGG模块,采用FC模块(concatenate with convolutions)过滤冗余特征,强化模型的特征提取能力;采用Alpha-CIOU损失和知识蒸馏优化训练,提高算法的检测能力。在Pascal VOC和MS COCO数据集上的实验结果表明,该算法在尺度变化、精度和速度等方面取得了优秀的性能。展开更多
本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信...本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷.同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重.相较于一些主流的注意力模块而言,在保证性能提升的同时大幅度缩减了参数量.通过在公开数据集上进行图像分类和目标检测实验验证网络的有效性,结果表明本文提出的网络结构在视觉任务上性能都有较大提升.展开更多
针对跌倒检测任务中复杂信息干扰和数据集缺乏导致模型精度不高的问题,设计一种高精度跌倒检测算法,降低模型参数的同时保持各种场景下的鲁棒性。该算法基于YOLOv5s改进,在骨干网络中使用Ghost module和解耦全连接注意力,以较低计算开...针对跌倒检测任务中复杂信息干扰和数据集缺乏导致模型精度不高的问题,设计一种高精度跌倒检测算法,降低模型参数的同时保持各种场景下的鲁棒性。该算法基于YOLOv5s改进,在骨干网络中使用Ghost module和解耦全连接注意力,以较低计算开销提升模型在光线变化、遮挡等干扰环境下的性能。在颈部层使用自适应感受野和空间通道混合注意力,提升神经元对不同尺度特征的适应性,应对人体形变、视角变化等干扰。引入EIoU损失函数,加速收敛提升训练精度。在公开数据集Le2i Fall Detection Dataset和UR Fall Detection上,精确率、召回率、mAP0.5和mAP(0.5:0.95)相比YOLOv5s分别提高4.0%,4.2%,2.9%和4.3%,参数量降低38.6%。该算法在多种应用场景下都保持较高检测精度,参数量较低,满足实际应用场景部署要求。展开更多
文摘针对不同尺度的目标容易造成模型的特征提取和尺度变化的适应性问题,提出一种融合自适应感受野的目标检测算法。通过对特征图采用拆分、卷积和融合的方式构造通道自适应感受野模块,以提取不同尺度的感受野,提高对尺度变化的适应能力;在网络结构中引入通道自适应感受野模块和RepVGG模块,采用FC模块(concatenate with convolutions)过滤冗余特征,强化模型的特征提取能力;采用Alpha-CIOU损失和知识蒸馏优化训练,提高算法的检测能力。在Pascal VOC和MS COCO数据集上的实验结果表明,该算法在尺度变化、精度和速度等方面取得了优秀的性能。
文摘本文提出一种自适应感受野卷积神经网络结构,简称ARFN(Adaptive Receptive Field Network).通过卷积核的自主选择机制来实现感受野的动态调整,更大程度上获取残差网络低层特征的空间信息并与高层特征进行自适应融合,弥补高层特征空间信息不足的缺陷.同时,在残差块中加入一种轻量的新型注意力机制,通过一维空洞卷积实现特征通道间适当的非线性交互,有效地学习各通道特征的权重.相较于一些主流的注意力模块而言,在保证性能提升的同时大幅度缩减了参数量.通过在公开数据集上进行图像分类和目标检测实验验证网络的有效性,结果表明本文提出的网络结构在视觉任务上性能都有较大提升.
文摘针对跌倒检测任务中复杂信息干扰和数据集缺乏导致模型精度不高的问题,设计一种高精度跌倒检测算法,降低模型参数的同时保持各种场景下的鲁棒性。该算法基于YOLOv5s改进,在骨干网络中使用Ghost module和解耦全连接注意力,以较低计算开销提升模型在光线变化、遮挡等干扰环境下的性能。在颈部层使用自适应感受野和空间通道混合注意力,提升神经元对不同尺度特征的适应性,应对人体形变、视角变化等干扰。引入EIoU损失函数,加速收敛提升训练精度。在公开数据集Le2i Fall Detection Dataset和UR Fall Detection上,精确率、召回率、mAP0.5和mAP(0.5:0.95)相比YOLOv5s分别提高4.0%,4.2%,2.9%和4.3%,参数量降低38.6%。该算法在多种应用场景下都保持较高检测精度,参数量较低,满足实际应用场景部署要求。