当前的目标分割模型难以兼顾分割性能与推断效率,为此提出一种基于尺度注意知识迁移的自蒸馏目标分割方法。首先,构建了一个仅利用主干特征的目标分割网络作为推断网络,实现高效的前向推断过程。其次,提出了一种基于尺度注意知识的自蒸...当前的目标分割模型难以兼顾分割性能与推断效率,为此提出一种基于尺度注意知识迁移的自蒸馏目标分割方法。首先,构建了一个仅利用主干特征的目标分割网络作为推断网络,实现高效的前向推断过程。其次,提出了一种基于尺度注意知识的自蒸馏学习模型:一方面,设计了具有尺度注意机制的金字塔特征模块,利用尺度注意机制自适应地捕获不同语义水平的上下文信息,提取更具区分性的自蒸馏知识;另一方面,融合交叉熵、KL(Kullback-Leibler)散度和L2距离构造蒸馏损失,高效驱动蒸馏知识向分割网络迁移,提升泛化性能。该方法在COD(Camouflaged Object Detection)、DUT-O(Dalian University of Technology-OMRON)、SOC(Salient Objects in Clutter)等五个目标分割数据集上进行了验证:将所提推断网络作为基准网络,所提自蒸馏模型分割性能在Fβ指标上平均提升3.01%,比免教师(TF)自蒸馏模型增加了1.00%;所提网络与近期的残差分割网络(R2Net)相比,参数量减少了2.33×10^(6),推断帧率提升了2.53%,浮点运算量减少了40.50%,分割性能提升了0.51%。实验结果表明:所提方法能有效兼顾性能与效率,适用于计算和存储资源受限的应用场景。展开更多
目的利用深度学习技术,建立临床常见的侵袭性真菌图像辅助分类模型。方法回顾性收集2020年9月—2021年4月解放军总医院第八医学中心曲霉菌属、酵母菌属和新型隐球菌属真菌感染者的显微镜图像,按7∶1.5∶1.5的比例随机分为训练集、验证...目的利用深度学习技术,建立临床常见的侵袭性真菌图像辅助分类模型。方法回顾性收集2020年9月—2021年4月解放军总医院第八医学中心曲霉菌属、酵母菌属和新型隐球菌属真菌感染者的显微镜图像,按7∶1.5∶1.5的比例随机分为训练集、验证集和测试集。使用训练集和验证集图像对改进的MobileNetV2网络结构进行训练和参数调试,构建基于多尺度注意力机制的卷积神经网络(convolutional neural network,CNN)真菌图像11分类模型。以机器鉴定结果为金标准,以查准率、召回率和F1值为指标评价该模型对测试集真菌图像的分类效果。将该模型与5种经典CNN模型进行比较,评价指标包括模型参数量、内存占用量、网络每秒处理的图像数量(frames per second,FPS)、准确率及受试者操作特征曲线下面积(area under the curve,AUC)。结果共纳入真菌显微镜图像7666张,分别包括曲霉菌属、酵母菌属和新型隐球菌属图像2781张、4115张、770张。其中训练集5366张、验证集1150张、测试集1150张。改进的MobileNetV2模型对测试集11种真菌图像具有较高的分类性能,查准率为96.36%~100%,召回率为96.53%~100%,F1值为97.01%~100%。该模型的参数量、内存占用量分别为4.22 M、356.89 M,FPS为573,准确率为(99.09±0.18)%,AUC为0.9944±0.0018,综合性能优于5种经典网络模型。结论本研究提出的真菌图像分类模型,在保持低运算成本的情况下,可获得较高的真菌图像识别能力,其整体性能优于常见的经典模型。展开更多
随着遥感图像中小目标检测问题的日益突出,传统目标检测方法在小目标的精确定位上存在局限性。为解决这一问题,本文提出了一种基于YOLOv11模型的多尺度注意力机制优化方法。首先,删除了YOLOv11模型中用于大目标检测的20 × 20尺度...随着遥感图像中小目标检测问题的日益突出,传统目标检测方法在小目标的精确定位上存在局限性。为解决这一问题,本文提出了一种基于YOLOv11模型的多尺度注意力机制优化方法。首先,删除了YOLOv11模型中用于大目标检测的20 × 20尺度检测层,增加了160 × 160尺度的小目标检测层,以提升小目标的检测精度。其次,采用EIoU (Enhanced Intersection over Union)损失函数替代CIoU损失函数,解决了CIoU在长宽比差异较大的目标中的定位问题,从而加速收敛并提高定位精度。最后,结合空间注意力和通道注意力机制,增强了模型对不同尺度目标的感知能力。实验结果表明,优化后的YOLOv11模型在多个遥感图像数据集上表现出较传统YOLOv11显著提高的精度、召回率和F1分数,特别在小目标检测任务中具有更强的鲁棒性和更高的检测精度。研究表明,提出的方法能有效提升小目标检测性能,为遥感图像分析提供了新的解决方案。With the increasingly prominent problem of small target detection in remote sensing images, traditional object detection methods have limitations in accurately locating small targets. To address this issue, this paper proposes a multi-scale attention mechanism optimization method based on the YOLOv11 model. Firstly, the 20 × 20 scale detection layer used for large object detection in the YOLOv11 model was removed, and a 160 × 160 scale small object detection layer was added to improve the detection accuracy of small objects. Secondly, the EIoU (Enhanced Intersection over Union) loss function is used instead of the CIoU loss function to solve the localization problem of CIoU in targets with large aspect ratio differences, thereby accelerating convergence and improving localization accuracy. Finally, by combining spatial attention and channel attention mechanisms, the model’s perception ability for targets of different scales was enhanced. The experimental results show that the optimized YOLOv11 model exhibits significantly improved accuracy, recall, and F1 score compared to traditional YOLOv11 on multiple remote sensing image datasets, especially in small object detection tasks with stronger robustness and higher detection accuracy. Research has shown that the proposed method can effectively improve the performance of small object detection, providing a new solution for remote sensing image analysis.展开更多
文摘当前的目标分割模型难以兼顾分割性能与推断效率,为此提出一种基于尺度注意知识迁移的自蒸馏目标分割方法。首先,构建了一个仅利用主干特征的目标分割网络作为推断网络,实现高效的前向推断过程。其次,提出了一种基于尺度注意知识的自蒸馏学习模型:一方面,设计了具有尺度注意机制的金字塔特征模块,利用尺度注意机制自适应地捕获不同语义水平的上下文信息,提取更具区分性的自蒸馏知识;另一方面,融合交叉熵、KL(Kullback-Leibler)散度和L2距离构造蒸馏损失,高效驱动蒸馏知识向分割网络迁移,提升泛化性能。该方法在COD(Camouflaged Object Detection)、DUT-O(Dalian University of Technology-OMRON)、SOC(Salient Objects in Clutter)等五个目标分割数据集上进行了验证:将所提推断网络作为基准网络,所提自蒸馏模型分割性能在Fβ指标上平均提升3.01%,比免教师(TF)自蒸馏模型增加了1.00%;所提网络与近期的残差分割网络(R2Net)相比,参数量减少了2.33×10^(6),推断帧率提升了2.53%,浮点运算量减少了40.50%,分割性能提升了0.51%。实验结果表明:所提方法能有效兼顾性能与效率,适用于计算和存储资源受限的应用场景。
文摘目的利用深度学习技术,建立临床常见的侵袭性真菌图像辅助分类模型。方法回顾性收集2020年9月—2021年4月解放军总医院第八医学中心曲霉菌属、酵母菌属和新型隐球菌属真菌感染者的显微镜图像,按7∶1.5∶1.5的比例随机分为训练集、验证集和测试集。使用训练集和验证集图像对改进的MobileNetV2网络结构进行训练和参数调试,构建基于多尺度注意力机制的卷积神经网络(convolutional neural network,CNN)真菌图像11分类模型。以机器鉴定结果为金标准,以查准率、召回率和F1值为指标评价该模型对测试集真菌图像的分类效果。将该模型与5种经典CNN模型进行比较,评价指标包括模型参数量、内存占用量、网络每秒处理的图像数量(frames per second,FPS)、准确率及受试者操作特征曲线下面积(area under the curve,AUC)。结果共纳入真菌显微镜图像7666张,分别包括曲霉菌属、酵母菌属和新型隐球菌属图像2781张、4115张、770张。其中训练集5366张、验证集1150张、测试集1150张。改进的MobileNetV2模型对测试集11种真菌图像具有较高的分类性能,查准率为96.36%~100%,召回率为96.53%~100%,F1值为97.01%~100%。该模型的参数量、内存占用量分别为4.22 M、356.89 M,FPS为573,准确率为(99.09±0.18)%,AUC为0.9944±0.0018,综合性能优于5种经典网络模型。结论本研究提出的真菌图像分类模型,在保持低运算成本的情况下,可获得较高的真菌图像识别能力,其整体性能优于常见的经典模型。
文摘随着遥感图像中小目标检测问题的日益突出,传统目标检测方法在小目标的精确定位上存在局限性。为解决这一问题,本文提出了一种基于YOLOv11模型的多尺度注意力机制优化方法。首先,删除了YOLOv11模型中用于大目标检测的20 × 20尺度检测层,增加了160 × 160尺度的小目标检测层,以提升小目标的检测精度。其次,采用EIoU (Enhanced Intersection over Union)损失函数替代CIoU损失函数,解决了CIoU在长宽比差异较大的目标中的定位问题,从而加速收敛并提高定位精度。最后,结合空间注意力和通道注意力机制,增强了模型对不同尺度目标的感知能力。实验结果表明,优化后的YOLOv11模型在多个遥感图像数据集上表现出较传统YOLOv11显著提高的精度、召回率和F1分数,特别在小目标检测任务中具有更强的鲁棒性和更高的检测精度。研究表明,提出的方法能有效提升小目标检测性能,为遥感图像分析提供了新的解决方案。With the increasingly prominent problem of small target detection in remote sensing images, traditional object detection methods have limitations in accurately locating small targets. To address this issue, this paper proposes a multi-scale attention mechanism optimization method based on the YOLOv11 model. Firstly, the 20 × 20 scale detection layer used for large object detection in the YOLOv11 model was removed, and a 160 × 160 scale small object detection layer was added to improve the detection accuracy of small objects. Secondly, the EIoU (Enhanced Intersection over Union) loss function is used instead of the CIoU loss function to solve the localization problem of CIoU in targets with large aspect ratio differences, thereby accelerating convergence and improving localization accuracy. Finally, by combining spatial attention and channel attention mechanisms, the model’s perception ability for targets of different scales was enhanced. The experimental results show that the optimized YOLOv11 model exhibits significantly improved accuracy, recall, and F1 score compared to traditional YOLOv11 on multiple remote sensing image datasets, especially in small object detection tasks with stronger robustness and higher detection accuracy. Research has shown that the proposed method can effectively improve the performance of small object detection, providing a new solution for remote sensing image analysis.