-
题名基于改进YOLOX的自然环境下核桃识别算法研究
- 1
-
-
作者
钟正扬
云利军
杨璇玺
陈载清
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
云南省林业调查规划院生态分院卫星林业应用中心
-
出处
《河南农业科学》
北大核心
2024年第1期152-161,共10页
-
基金
云南省教育厅科学研究基金项目(2023Y0533)。
-
文摘
针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transformer的多头注意力机制对小目标的特征信息进行提取并与特征图进行融合,可以有效解决因网络层数加深导致的高层特征图中小目标特征信息丢失问题;其次,为了提高算法的检测精度,引入更高效的Repblock模块对原网络中的CSP模块进行替换;最后,为了提高下采样效果,使用更为优秀的Transition Block模块作为主干特征提取网络的下采样模块。结果表明,改进后的YOLOX-S模型在采集的自然环境下核桃数据集上平均精度AP50达到96.72%,分别比Faster-RCNN、YOLOv5-S、YOLOX-S算法提高7.36、1.38、0.62百分点,检测速度达到46 f/s,模型参数大小为20.55 M。改进后的YOLOX-S算法具有更好的精度,改善了漏检和误检问题,对自然环境下的核桃有更好的识别效果。
-
关键词
核桃识别
Swin
Transformer
多层特征融合模块
YOLOX-S
深度学习
-
Keywords
Walnut detection
Swin Transformer
Multi-layer feature fusion module
YOLOX-S
Deep learning
-
分类号
S664.1
[农业科学—果树学]
S126
[农业科学—农业基础科学]
-
-
题名改进YOLOv5s的无人机视角下小目标检测算法
被引量:6
- 2
-
-
作者
吴明杰
云利军
陈载清
钟天泽
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第2期191-199,共9页
-
基金
云南省教育厅科学研究基金(2023Y0533)。
-
文摘
针对无人机飞行时与目标距离较远,被拍摄的目标大小有明显的差异且存在被物体遮挡等问题,提出一种基于YOLOv5s的无人机视角下小目标检测改进算法BD-YOLO。在特征融合网络中采用双层路由注意力(bi-level routing attention,BRA),其以动态稀疏的方式过滤特征图中最不相关的特征,保留部分重要区域特征,从而提高模型特征提取的能力;由于特征图经过多次下采样后会丢失大量位置信息和特征信息,因此采用一种结合注意力机制的动态目标检测头DyHead(dynamic head),该检测头通过尺度感知、空间感知和任务感知的三者统一,以实现更强的特征表达能力;使用Focal-EIoU损失函数,来解决YOLOv5s中CIoU Loss计算回归结果不准确的问题,从而提高模型对小型目标的检测精度。实验结果表明,在VisDrone2019-DET数据集上,BD-YOLO模型较YOLOv5s模型在平均精度(mAP@0.5)指标上提高了0.062,对比其他主流模型对于小目标的检测都有更好的效果。
-
关键词
无人机视角
YOLOv5s
小目标
注意力机制
损失函数
-
Keywords
unmanned aerial vehicle perspective
YOLOv5s
small object
attention mechanism
loss function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名VR显示器中视差线索对伽马估计的影响
- 3
-
-
作者
彭毅钧
陈载清
云利军
-
机构
云南师范大学信息学院
云南师范大学云南省教育厅计算机视觉与智能控制技术工程研究中心
云南师范大学云南省光电信息技术重点实验室
-
出处
《云南民族大学学报(自然科学版)》
CAS
2024年第1期95-101,共7页
-
基金
国家自然科学基金(61865015,61875171,62165019).
-
文摘
虚拟现实(virtual reality,VR)头戴立体显示器能够呈现视差线索,从而产生具有深度感的沉浸式交互体验.基于显示器伽马值人眼视觉估计方案,本文开展实验探讨了VR显示器中不同视差线索对伽马值估计的影响.实验要求被试者使用Unity开发的VR显示器伽马值人眼视觉估计软件,在不同视差下对VR显示器伽马值进行估计,并将估计结果与光谱仪PR715测量结果进行对比.实验结果表明,当视差为-40弧分时,人眼视觉估计VR显示器伽马值的准确度最高,估计误差为0.045,当虚拟深度从近距离(-40弧分视差)到远距离(+120弧分视差)变化时,人眼视觉估计误差由0.045增大到0.190,当虚拟深度从远距离(-40弧分视差)到近距离(-120弧分视差)时,人眼视觉估计误差由0.045增大到0.105.实验结果表明视差线索对被试者视觉估计VR显示器伽马值产生了影响.
-
关键词
视差
人眼视觉估计
虚拟现实显示器
伽马值
-
Keywords
disparity
human vision estimation
VR head-mounted display
Gamma
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进YOLOv5s的复杂道路交通目标检测算法
- 4
-
-
作者
汤林东
云利军
罗瑞林
卢琳
-
机构
云南师范大学信息学院
云南师范大学云南省教育厅计算机视觉与智能控制技术工程研究中心
云南省烟草烟叶公司
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2024年第3期64-71,共8页
-
基金
国家自然科学基金资助项目(62265017)。
-
文摘
针对目前自动驾驶场景下交通目标检测算法抗复杂背景干扰能力弱,导致检测性能不足的问题,提出了一种改进YOLOv5s的复杂道路交通目标检测算法。首先,在特征提取区域,采用多头自注意残差模块(MHSARM)来强化待检目标特征信息,弱化复杂背景干扰;其次,在特征融合区域,采用CoordConv代替传统Conv,使网络具备空间信息感知能力,提升网络检测精度。在开源数据集Kitti及BDD100K上的实验结果表明:改进YOLOv5s算法在复杂道路中具备更强的特征提取能力及良好的泛化能力,mAP_0.5分别达到93.3%和47.4%,与YOLOv5s相比,分别提升了0.9%和1.4%。另外,改进YOLOv5s相较于目前最新的目标检测算法YOLOv7、YOLOv8,mAP_0.5分别提高了1.3%和2.2%,与在Kitti数据集上最新的研究成果Sim-YOLOv4算法相比,mAP_0.5提高了2.2%。
-
关键词
自动驾驶
目标检测
YOLOv5s
MHSARM
CoordConv
-
Keywords
automatic driving
target detection
YOLOv5s
MHSARM
CoordConv
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于知识蒸馏的步态识别方法
- 5
-
-
作者
李若愚
云利军
金雪松
杨彦辰
程飞燕
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
玉溪市第二人民医院信息网络中心
-
出处
《云南师范大学学报(自然科学版)》
2024年第2期49-53,共5页
-
基金
国家自然科学基金资助项目(62265017)
云南师范大学研究生科研创新基金资助项目(YJSJJ23-B181)。
-
文摘
针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识别准确率.该方法在中科院CASIA-B和CASIA-C数据库中进行多次仿真实验.结果表明,ConvNext-KD模型在保持较小参数量和较低复杂度的同时,可以显著缩短训练测试的时长并取得较高识别准确率.
-
关键词
步态识别
知识蒸馏
ConvNext
-
Keywords
Gait recognition
Knowledge distillation
ConvNext
-
分类号
TN219
[电子电信—物理电子学]
TP181
[自动化与计算机技术—控制理论与控制工程]
-