期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于改进YOLOX的自然环境下核桃识别算法研究
1
作者 钟正扬 云利军 +1 位作者 杨璇玺 陈载清 《河南农业科学》 北大核心 2024年第1期152-161,共10页
针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transforme... 针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transformer的多头注意力机制对小目标的特征信息进行提取并与特征图进行融合,可以有效解决因网络层数加深导致的高层特征图中小目标特征信息丢失问题;其次,为了提高算法的检测精度,引入更高效的Repblock模块对原网络中的CSP模块进行替换;最后,为了提高下采样效果,使用更为优秀的Transition Block模块作为主干特征提取网络的下采样模块。结果表明,改进后的YOLOX-S模型在采集的自然环境下核桃数据集上平均精度AP50达到96.72%,分别比Faster-RCNN、YOLOv5-S、YOLOX-S算法提高7.36、1.38、0.62百分点,检测速度达到46 f/s,模型参数大小为20.55 M。改进后的YOLOX-S算法具有更好的精度,改善了漏检和误检问题,对自然环境下的核桃有更好的识别效果。 展开更多
关键词 核桃识别 Swin Transformer 多层特征融合模块 YOLOX-S 深度学习
下载PDF
改进YOLOv5s的无人机视角下小目标检测算法 被引量:6
2
作者 吴明杰 云利军 +1 位作者 陈载清 钟天泽 《计算机工程与应用》 CSCD 北大核心 2024年第2期191-199,共9页
针对无人机飞行时与目标距离较远,被拍摄的目标大小有明显的差异且存在被物体遮挡等问题,提出一种基于YOLOv5s的无人机视角下小目标检测改进算法BD-YOLO。在特征融合网络中采用双层路由注意力(bi-level routing attention,BRA),其以动... 针对无人机飞行时与目标距离较远,被拍摄的目标大小有明显的差异且存在被物体遮挡等问题,提出一种基于YOLOv5s的无人机视角下小目标检测改进算法BD-YOLO。在特征融合网络中采用双层路由注意力(bi-level routing attention,BRA),其以动态稀疏的方式过滤特征图中最不相关的特征,保留部分重要区域特征,从而提高模型特征提取的能力;由于特征图经过多次下采样后会丢失大量位置信息和特征信息,因此采用一种结合注意力机制的动态目标检测头DyHead(dynamic head),该检测头通过尺度感知、空间感知和任务感知的三者统一,以实现更强的特征表达能力;使用Focal-EIoU损失函数,来解决YOLOv5s中CIoU Loss计算回归结果不准确的问题,从而提高模型对小型目标的检测精度。实验结果表明,在VisDrone2019-DET数据集上,BD-YOLO模型较YOLOv5s模型在平均精度(mAP@0.5)指标上提高了0.062,对比其他主流模型对于小目标的检测都有更好的效果。 展开更多
关键词 无人机视角 YOLOv5s 小目标 注意力机制 损失函数
下载PDF
VR显示器中视差线索对伽马估计的影响
3
作者 彭毅钧 陈载清 云利军 《云南民族大学学报(自然科学版)》 CAS 2024年第1期95-101,共7页
虚拟现实(virtual reality,VR)头戴立体显示器能够呈现视差线索,从而产生具有深度感的沉浸式交互体验.基于显示器伽马值人眼视觉估计方案,本文开展实验探讨了VR显示器中不同视差线索对伽马值估计的影响.实验要求被试者使用Unity开发的V... 虚拟现实(virtual reality,VR)头戴立体显示器能够呈现视差线索,从而产生具有深度感的沉浸式交互体验.基于显示器伽马值人眼视觉估计方案,本文开展实验探讨了VR显示器中不同视差线索对伽马值估计的影响.实验要求被试者使用Unity开发的VR显示器伽马值人眼视觉估计软件,在不同视差下对VR显示器伽马值进行估计,并将估计结果与光谱仪PR715测量结果进行对比.实验结果表明,当视差为-40弧分时,人眼视觉估计VR显示器伽马值的准确度最高,估计误差为0.045,当虚拟深度从近距离(-40弧分视差)到远距离(+120弧分视差)变化时,人眼视觉估计误差由0.045增大到0.190,当虚拟深度从远距离(-40弧分视差)到近距离(-120弧分视差)时,人眼视觉估计误差由0.045增大到0.105.实验结果表明视差线索对被试者视觉估计VR显示器伽马值产生了影响. 展开更多
关键词 视差 人眼视觉估计 虚拟现实显示器 伽马值
下载PDF
基于改进YOLOv5s的复杂道路交通目标检测算法
4
作者 汤林东 云利军 +1 位作者 罗瑞林 卢琳 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期64-71,共8页
针对目前自动驾驶场景下交通目标检测算法抗复杂背景干扰能力弱,导致检测性能不足的问题,提出了一种改进YOLOv5s的复杂道路交通目标检测算法。首先,在特征提取区域,采用多头自注意残差模块(MHSARM)来强化待检目标特征信息,弱化复杂背景... 针对目前自动驾驶场景下交通目标检测算法抗复杂背景干扰能力弱,导致检测性能不足的问题,提出了一种改进YOLOv5s的复杂道路交通目标检测算法。首先,在特征提取区域,采用多头自注意残差模块(MHSARM)来强化待检目标特征信息,弱化复杂背景干扰;其次,在特征融合区域,采用CoordConv代替传统Conv,使网络具备空间信息感知能力,提升网络检测精度。在开源数据集Kitti及BDD100K上的实验结果表明:改进YOLOv5s算法在复杂道路中具备更强的特征提取能力及良好的泛化能力,mAP_0.5分别达到93.3%和47.4%,与YOLOv5s相比,分别提升了0.9%和1.4%。另外,改进YOLOv5s相较于目前最新的目标检测算法YOLOv7、YOLOv8,mAP_0.5分别提高了1.3%和2.2%,与在Kitti数据集上最新的研究成果Sim-YOLOv4算法相比,mAP_0.5提高了2.2%。 展开更多
关键词 自动驾驶 目标检测 YOLOv5s MHSARM CoordConv
下载PDF
基于知识蒸馏的步态识别方法
5
作者 李若愚 云利军 +2 位作者 金雪松 杨彦辰 程飞燕 《云南师范大学学报(自然科学版)》 2024年第2期49-53,共5页
针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识... 针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识别准确率.该方法在中科院CASIA-B和CASIA-C数据库中进行多次仿真实验.结果表明,ConvNext-KD模型在保持较小参数量和较低复杂度的同时,可以显著缩短训练测试的时长并取得较高识别准确率. 展开更多
关键词 步态识别 知识蒸馏 ConvNext
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部