-
题名基于感受野注意力卷积的自动驾驶多任务感知算法
- 1
-
-
作者
刘云翔
马海力
朱建林
张晴
金婍
-
机构
上海应用技术大学计算机科学与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第20期133-141,共9页
-
基金
上海市自然科学基金(21ZR1462600)。
-
文摘
可行驶区域分割、车道线检测及交通目标检测等作为自动驾驶感知的关键部分,并行执行对智能车辆的算力要求较高,多任务感知算法能够实现实际应用中精度与速度的权衡。针对多任务感知算法中路况复杂、目标受遮挡等难点,通过改进YOLOP网络,提出一种基于感受野注意力卷积(RFAConv)的多任务感知算法。将主干网络中的部分卷积替换为感受野注意力卷积,根据感受野中图像特征的重要程度动态分配卷积核权重以提高网络的特征提取能力;重构特征金字塔网络,使用高效跨尺度融合模块替换原有的跨阶段层次模块,充分保留特征融合的有效信息,并使用内容感知特征重组模块作为上采样方法,减少特征融合时上采样的信息丢失;使用MPDIoU函数计算回归损失,解决真实框与预测框之间同比例但不同大小的问题,进一步提高对交通目标的检测能力。在BDD100K数据集上的测试结果表明,该模型在可行驶区域分割、车道线检测及交通目标检测方面检测精度优于其他多任务模型甚至单任务模型,同时保证了网络实时推理性能。
-
关键词
多任务感知
自动驾驶
目标检测
语义分割
感受野注意力卷积(RFAConv)
-
Keywords
multi-task perception
autonomous driving
object detection
semantic segmentation
receptive-field attention convolution(RFAConv)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进YOLOv8s的交通标志检测算法
- 2
-
-
作者
张京淇
李超
李晓磊
-
机构
河北建筑工程学院
-
出处
《电脑知识与技术》
2024年第30期31-34,共4页
-
基金
2024年河北省省级研究生示范课程建设项目(KCJSX2024108)
2023年河北省科技特派员专项基金(2240618)
2023年河北省科技特派员专项基金(2240661)。
-
文摘
针对当前道路交通标志识别中遇到的众多环境干扰因素以及小目标比例较高的难题,提出了一种基于YOLOv8s改进的目标检测算法。该算法采用感受野卷积替代骨干网络中的普通卷积,这一改进显著提升了模型对目标物体的关注度。同时,修改了原算法的空间金字塔池化模块,使其能够对输入特征图进行多尺度的空间金字塔池化,从而增强特征的表达能力。此外,使用Focal-EIOU损失函数实现了更为精确的边界框回归。在CCTSDB数据集上的验证结果显示,mAP@0.5与mAP@0.5:0.95两个指标分别提升了1.6%和1.3%。
-
关键词
交通标志检测
YOLOv8
感受野卷积
空间金字塔池化
Focal-EIOU
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于掩码自编码的农作物病虫害分类方法
- 3
-
-
作者
鞠萍
宋岩
张英杰
徐一夫
邵杭
-
机构
烟台大学经济管理学院
滨化集团股份有限公司
山东中烟工业有限责任公司青州卷烟厂
南京理工大学计算机科学与工程学院
-
出处
《电子科技》
2024年第10期23-29,共7页
-
基金
国家自然科学基金(61806094)
山东省社会科学规划重点项目(18BGLJ04)。
-
文摘
作物病虫害使农业生产遭受损失,但仅依靠人工调查难以满足田间需求。基于机器视觉可实现病虫害自动分类,为农业精准高效生产提供保障。然而现有利用深度学习的方法易受刚性卷积感受野影响,数据增强手段低效且样本量匮乏。针对这些问题,文中提出一种基于掩码自编码学习范式的农业经济作物病虫害分类方法,来弥补现有技术在识别准确率方面的不足。通过对作物图像随机掩蔽、特征提取和依高维映射的全局重建,所提算法能充分挖掘输入的高阶语义隐式表征,建模同一图像内远距离上下文关系,从而训练鲁棒性更强的模型。通过相对总变分变换消除了高频噪声对预训练特征提取过程的干扰。所提方法与当前基于主流卷积网络的方法的对比结果表明,所提方法可显著提升现有方法的性能,准确率由基于ResNet50基准网络的90.48%提升至95.24%。
-
关键词
机器视觉
深度学习
农业经济作物
病虫害检测
掩码自编码
相对总变分
神经网络
卷积感受野
-
Keywords
machine vision
deep learning
agricultural cash crop
diseases and pests detection
masked autoencoding
relative total variation
neural network
convolutional receptive field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-