-
题名改进DeepLabv2的实时图像语义分割算法
被引量:10
- 1
-
-
作者
马书浩
安居白
于博
-
机构
大连海事大学信息科学技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第18期157-164,共8页
-
基金
国家自然科学基金(No.61471079)。
-
文摘
图像语义分割是计算机视觉感知系统的重要组成之一,针对现有的语义分割算法存在分割速度慢的问题提出基于DeepLabv2改进的实时图像语义分割算法。与DeepLabv2相比,改进后的算法使用轻量卷积神经网络Xception作为编码器,增加特征金字塔网络(Feature Pyramid Net,FPN)解码特征的过程,减少空洞金字塔池化网络(Atrous convolution Spatial Pyramid Pooling,ASPP)参数的数量,进而大幅度压缩了算法模型,提升了算法分割速度。此外,还对Focal Loss损失函数在多分类任务中难以选择超参数的问题做出改进,并用于提升算法分割精度。在Cityscapes和Pascal VOC2012数据集上的实验结果表明改进后的算法可达到实时分割速度且具有分割精度高的优点,同时还表明提出的超参数选择方法可进一步提升算法分割精度。
-
关键词
语义分割
卷积神经网络
图像分割
无人驾驶
-
Keywords
semantic segmentation
Convolution Neural Network(CNN)
image segmentation
unmanned
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于YOLOv3改进的肺炎检测算法
被引量:6
- 2
-
-
作者
马书浩
安居白
-
机构
大连海事大学信息科学技术学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2020年第18期310-316,共7页
-
基金
国家自然科学基金(61471079)。
-
文摘
肺炎是一种严重威胁人类健康的疾病,及时、准确地检测出肺炎可以尽早帮助患者接受治疗。因此,提出了一种基于YOLOv3改进的Multi branch YOLO检测算法。用多分枝膨胀卷积输出的特征代替YOLOv3中不同层级的特征进行检测,在多分枝卷积神经网络中引入Boosting思想,并使用最大化熵方法优化网络。将每个卷积分枝视为一个弱分类器,通过最大化熵方法使每个分枝学习到相近的检测能力,避免多分枝卷积模型退化成单分枝卷积模型。基于北美放射学会提供的肺部X射线影像进行实验,结果表明,该算法在实验数据集上的检测准确率高于其他目标检测算法。
-
关键词
目标检测
肺炎检测
医学图像
卷积神经网络
-
Keywords
object detection
pneumonia detection
medical image
convolution neural network
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名远红外车载图像实时行人检测与自适应实例分割
被引量:9
- 3
-
-
作者
于博
马书浩
李红艳
李春庚
安居白
-
机构
大连海事大学信息科学技术学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2020年第2期286-296,共11页
-
基金
国家自然科学基金(61471079)。
-
文摘
针对红外图像检测与分割任务中颜色信息缺失,特征细节模糊并带有噪声,当目标数量较多时传统方法提取过程速度较慢等问题,提出一种用于远红外图像的优化YOLO检测与分割网络模型。提出的两个优化点分别为:综合分析实验使用的两种远红外数据集后使用K-means++聚类算法寻找多尺度预测标记锚点框尺寸;使用局部检测位置自适应阈值分割方法对检测目标进行像素级实例分割。本文优化算法在FLIR公开数据集与本文数据集中的检测速度分别为29frame/s与28frame/s,保证了实时输出的要求;行人检测准确率分别达到75.3%与77.6%,分割结果平均交并比达到70%~90%。实验结果表明,本文算法具有良好的稳健性和普适性,在远红外图像中可快速有效地检测行人并生成实例掩模。
-
关键词
机器视觉
远红外图像
行人检测
实例分割
聚类算法
实时输出
-
Keywords
machine vision
far infrared image
pedestrian detection
instance segmentation
clustering algorithm
real-time output
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-