复杂交通环境下目标检测中存在很多外界干扰因素,导致通用的目标检测算法效果较差。针对目标检测方法中全局特征信息利用不充分,小目标、遮挡目标检测精度低,以及模型计算量大等问题,提出一种基于改进YOLOv5s的融合全局特征目标检测方...复杂交通环境下目标检测中存在很多外界干扰因素,导致通用的目标检测算法效果较差。针对目标检测方法中全局特征信息利用不充分,小目标、遮挡目标检测精度低,以及模型计算量大等问题,提出一种基于改进YOLOv5s的融合全局特征目标检测方法。首先,对YOLOv5s的主干网络进行扩展,得到更深层的特征图以增强较大目标的语义信息;其次,在此基础上引入全局信息融合模块代替原模型中的Neck部分,以3D卷积的方式融合各尺度信息;然后,设计了一种基于位置的先验框匹配方法,在原图尺度上搜索与真实框匹配的先验框;最后,使用Copy-Paste数据增强方法增大小目标样本数量并使用DIoUNMS作为后处理方法进行非极大值抑制。该模型在BDD100K数据集中平均精确率(mean Average Precision,mAP)为54.55%,检测速度为63.72帧每秒(Frames Per Second,FPS)。与原始YOLOv5s算法相比,该方法在检测速度及精度方面均有明显优势。展开更多
目的柑橘是我国最常见的水果之一,目前多以人工采摘为主,成本高、效率低等问题严重制约规模化生产,因此柑橘自动采摘成为近年的研究热点。但是,柑橘生长环境复杂、枝条形态各异、枝叶和果实互遮挡严重,如何精准实时地定位采摘点成为自...目的柑橘是我国最常见的水果之一,目前多以人工采摘为主,成本高、效率低等问题严重制约规模化生产,因此柑橘自动采摘成为近年的研究热点。但是,柑橘生长环境复杂、枝条形态各异、枝叶和果实互遮挡严重,如何精准实时地定位采摘点成为自动采摘的关键。通过构建级联混合网络模型,提出了一种通用且高效的柑橘采摘点自动精准定位方法。方法构建团簇框生成模型和枝条稀疏实例分割模型,对两者进行级联混合实现实时柑橘采摘点定位。首先,构建柑橘果实检测网络,提出团簇框生成模型,该模型通过特征提取、果实检测框生成和DBSCAN(density-based spatial clustering of applications with noise)果实密度聚类,实时地生成图像内果实数目最多的团簇框坐标;然后,提出融合亮度先验的枝条稀疏分割模型,该模型以团簇框内的图像作为输入,有效降低背景枝条的干扰,通过融合亮度先验的稀疏实例激活图,实时地分割出与果实相连接枝条实例;最后基于分割结果搜索果实采摘点定位坐标。结果经过长时间户外采集制作了柑橘果实检测数据集CFDD(citrus fruit detection dataset)和柑橘枝条分割数据集CBSD(citrus branch segmentation dataset)。这两个数据集由成熟果实、未成熟果实组成,包含晴天、阴天、顺光和逆光等挑战,总共37000幅图像。在该数据集上本文方法的采摘点定位精准度达到了95.77%,帧率(frames per second,FPS)达到了28.21帧/s。结论本文方法在果实采摘点定位方面取得较好进展,能够快速且准确地获取柑橘采摘点,并且提供配套的机械臂采摘设备可供该采摘点定位算法的落地使用,为柑橘产业发展提供有力支持。展开更多
针对人工神经元网络应用中最主要的问题之一——"黑箱"特性进行文献综述.增加人工神经元网络系统的透明度是解决该问题必不可少的手段.为了便于理解各种已有方法的应用特点及其局限性,提出"透明度"研究中的方法分...针对人工神经元网络应用中最主要的问题之一——"黑箱"特性进行文献综述.增加人工神经元网络系统的透明度是解决该问题必不可少的手段.为了便于理解各种已有方法的应用特点及其局限性,提出"透明度"研究中的方法分类框架.首先将"透明度"研究划分为两种基本策略:1)将先验信息引入系统设计;2)从模型中提取系统相关规则或知识.在此基础上,对各种主要方法进一步分类并进行应用特点介绍.最后对机器学习多目标研究进行讨论.提出基于"性能价格比"与基于提高系统"透明度"的目标函数.指出提高"透明度"是神经元网络研究中最为基本而又直接的解决方案.为此提出"反馈知识增长(Knowledge Increasing via Feedback)"型机器学习方法.展开更多
文摘复杂交通环境下目标检测中存在很多外界干扰因素,导致通用的目标检测算法效果较差。针对目标检测方法中全局特征信息利用不充分,小目标、遮挡目标检测精度低,以及模型计算量大等问题,提出一种基于改进YOLOv5s的融合全局特征目标检测方法。首先,对YOLOv5s的主干网络进行扩展,得到更深层的特征图以增强较大目标的语义信息;其次,在此基础上引入全局信息融合模块代替原模型中的Neck部分,以3D卷积的方式融合各尺度信息;然后,设计了一种基于位置的先验框匹配方法,在原图尺度上搜索与真实框匹配的先验框;最后,使用Copy-Paste数据增强方法增大小目标样本数量并使用DIoUNMS作为后处理方法进行非极大值抑制。该模型在BDD100K数据集中平均精确率(mean Average Precision,mAP)为54.55%,检测速度为63.72帧每秒(Frames Per Second,FPS)。与原始YOLOv5s算法相比,该方法在检测速度及精度方面均有明显优势。
文摘目的柑橘是我国最常见的水果之一,目前多以人工采摘为主,成本高、效率低等问题严重制约规模化生产,因此柑橘自动采摘成为近年的研究热点。但是,柑橘生长环境复杂、枝条形态各异、枝叶和果实互遮挡严重,如何精准实时地定位采摘点成为自动采摘的关键。通过构建级联混合网络模型,提出了一种通用且高效的柑橘采摘点自动精准定位方法。方法构建团簇框生成模型和枝条稀疏实例分割模型,对两者进行级联混合实现实时柑橘采摘点定位。首先,构建柑橘果实检测网络,提出团簇框生成模型,该模型通过特征提取、果实检测框生成和DBSCAN(density-based spatial clustering of applications with noise)果实密度聚类,实时地生成图像内果实数目最多的团簇框坐标;然后,提出融合亮度先验的枝条稀疏分割模型,该模型以团簇框内的图像作为输入,有效降低背景枝条的干扰,通过融合亮度先验的稀疏实例激活图,实时地分割出与果实相连接枝条实例;最后基于分割结果搜索果实采摘点定位坐标。结果经过长时间户外采集制作了柑橘果实检测数据集CFDD(citrus fruit detection dataset)和柑橘枝条分割数据集CBSD(citrus branch segmentation dataset)。这两个数据集由成熟果实、未成熟果实组成,包含晴天、阴天、顺光和逆光等挑战,总共37000幅图像。在该数据集上本文方法的采摘点定位精准度达到了95.77%,帧率(frames per second,FPS)达到了28.21帧/s。结论本文方法在果实采摘点定位方面取得较好进展,能够快速且准确地获取柑橘采摘点,并且提供配套的机械臂采摘设备可供该采摘点定位算法的落地使用,为柑橘产业发展提供有力支持。
文摘针对人工神经元网络应用中最主要的问题之一——"黑箱"特性进行文献综述.增加人工神经元网络系统的透明度是解决该问题必不可少的手段.为了便于理解各种已有方法的应用特点及其局限性,提出"透明度"研究中的方法分类框架.首先将"透明度"研究划分为两种基本策略:1)将先验信息引入系统设计;2)从模型中提取系统相关规则或知识.在此基础上,对各种主要方法进一步分类并进行应用特点介绍.最后对机器学习多目标研究进行讨论.提出基于"性能价格比"与基于提高系统"透明度"的目标函数.指出提高"透明度"是神经元网络研究中最为基本而又直接的解决方案.为此提出"反馈知识增长(Knowledge Increasing via Feedback)"型机器学习方法.