-
题名基于卷积神经网络的目标检测算法综述
被引量:20
- 1
-
-
作者
胡伏原
李林燕
尚欣茹
沈军宇
戴永良
-
机构
苏州科技大学电子与信息工程学院
苏州市虚拟现实智能交互及应用技术重点实验室
苏州市大数据与信息服务重点实验室
苏州经贸职业技术学院信息技术学院
昆山市农业信息中心
-
出处
《苏州科技大学学报(自然科学版)》
CAS
2020年第2期1-10,25,共11页
-
基金
国家自然科学基金资助项目(61876121)
江苏省重点研发计划项目(BE2017663)
+1 种基金
江苏省教育厅高等学校自然科学研究面上项目(19KJB520054)
苏州经贸职业技术学院科研项目(KY-ZRA1805)。
-
文摘
针对基于卷积神经网络的目标检测算法的国内外发展现状进行综述。首先,回顾了传统目标检测算法的发展历程和算法尚存的问题。然后,简要阐述了基于卷积神经网络(CNN)的目标检测算法原理和优势,并根据算法处理目标分类和边框回归使用的解决思路不同,分别介绍了基于候选区域的多阶段目标检测算法和基于回归思想的一阶段检测算法;依据算法发展演变过程,对每个类别中若干经典算法的产生背景、解决问题和设计思路进行了描述。最后,在公开的MS COCO与Pascal VOC数据集上对算法检测效果进行对比分析,并对未来发展趋势进行展望。
-
关键词
计算机视觉
目标检测
深度学习
卷积神经网络
-
Keywords
computer vision
object detection
deep learning
convolution neural networks
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种改进的Mask RCNN特征融合实例分割方法
被引量:18
- 2
-
-
作者
温尧乐
李林燕
尚欣茹
胡伏原
-
机构
苏州科技大学电子与信息工程学院
苏州经贸职业技术学院
苏州科技大学苏州市虚拟现实智能交互及应用技术重点实验室
苏州科技大学苏州市大数据与信息服务重点实验室
-
出处
《计算机应用与软件》
北大核心
2019年第10期130-133,共4页
-
基金
国家自然科学基金项目(61876121,61472267,61672371)
江苏省重点研发计划项目(BE2017663)
-
文摘
实例分割需要兼顾像素级的分类准确性和目标实例级的高级语义特性,非常具有挑战性。由于特征金字塔网络低层特征到高层特征的融合路径太长,导致低层特征在整个特征层次中的作用较弱。在特征金字塔网络的基础上,引入一条自下而上的路径来增强整个特征层次,缩短较低层特征与顶部特征之间的融合路径,增强低层特征在整个特征层次中的作用;在卷积神经网络中引入空洞卷积算法扩大卷积感受域,进一步提升掩膜预测准确度。在MicrosoftCOCO数据集测试结果表明,该方法有效提高了实例分割的准确度。
-
关键词
实例分割
特征融合
卷积神经网络
空洞卷积
-
Keywords
Instance segmentation
Feature fusion
Convolutional neural network(CNN)
Atrous convolution
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于YOLO算法的车辆违停检测
被引量:5
- 3
-
-
作者
徐江浪
李林燕
尚欣茹
胡伏原
-
机构
苏州科技大学电子与信息工程学院
苏州经贸职业技术学院信息技术学院
-
出处
《苏州科技大学学报(自然科学版)》
CAS
2020年第4期68-72,共5页
-
基金
国家自然科学基金资助项目(61876121,61472267)
江苏省重点研发计划项目(BE2017663)。
-
文摘
车辆图像和视频的违停检测,对于交通管理和社会治理方面具有重要意义。传统的车辆检测利用区域选择算法在候选区域上提取特征,但多样化的环境容易造成算法复杂度较高且检测精度较低。采用端到端的YOLO检测算法,首先,通过提取整张图像的特征,利用多层卷积运算和非极大值抑制法来处理提取的特征,检测目标的准确位置;然后,通过损失函数的反向校正,提高了目标检测的精度;最后,利用检测框和违停区域框之间的重叠度及阈值来判断车辆是否违停。在数据集KITTI和实际道路上的图像中进行实验,验证该算法能够实现对目标的精确检测。
-
关键词
YOLO算法
图像处理
车辆检测
深度学习
-
Keywords
YOLO algorithm
image processing
vehicle detection
deep learning
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名孪生导向锚框RPN网络实时目标跟踪
被引量:10
- 4
-
-
作者
尚欣茹
温尧乐
奚雪峰
胡伏原
-
机构
苏州科技大学电子与信息工程学院
苏州科技大学苏州市大数据与信息服务重点实验室
苏州科技大学苏州市虚拟现实智能交互及应用技术重点实验室
-
出处
《中国图象图形学报》
CSCD
北大核心
2021年第2期415-424,共10页
-
基金
国家自然科学基金项目(61876121)
江苏省重点研发计划项目(BE2017663)
江苏省教育厅高等学校自然科学研究面上项目(19KJB520054)。
-
文摘
目的区域推荐网络(region proposal network,RPN)与孪生网络(Siamese)相结合进行视频目标跟踪,显示了较高的准确性。然而,孪生RPN网络(Siamese region proposal network,Siam RPN)目标跟踪器依赖于密集的锚框策略,会产生大量冗余的锚框并影响跟踪的精度和速度。为了解决该问题,本文提出了孪生导向锚框RPN网络(Siamese-guided anchor RPN,Siamese GA-RPN)。方法Siamese GA-RPN的主要思想是利用语义特征来指导锚框生成。其中导向锚框网络包括位置预测模块和形状预测模块,这两个模块分别利用孪生网络中CNN(convolutional neural network)产生的语义特征预测锚框的位置和长宽尺寸,减少了冗余锚框的产生。然后,进一步设计了特征自适应模块,利用每个锚框的形状信息,通过可变卷积层来修正跟踪目标的原始特征图,降低目标特征与锚框信息的不一致性,提高了目标跟踪的准确性。结果在3个具有挑战性的视频跟踪基准数据集VOT(video object tracking)2015、VOT2016和VOT2017上进行了跟踪实验,测试了算法在目标快速移动、遮挡和光照等复杂场景下的跟踪性能,并与多种优秀算法在准确性和鲁棒性两个评价指标上进行定量比较。在VOT2015数据集上,本文算法与孪生RPN网络相比,准确性提高了1.72%,鲁棒性提高了5.17%;在VOT2016数据集上,本文算法与孪生RPN网络相比,准确性提高了3.6%,鲁棒性提高了6.6%;在VOT2017数据集上进行实时实验,本文算法表现出了较好的实时跟踪效果。结论通过孪生导向锚框RPN网络提高了锚框生成的有效性,确保了特征与锚框的一致性,实现了对目标的精确定位,较好地解决了锚框尺寸对目标跟踪精度的影响。在目标尺度发生变化、遮挡、光照条件变化和目标快速运动等复杂场景下仍然表现出了较强的鲁棒性和适应性。
-
关键词
目标跟踪
孪生网络
RPN网络
导向锚框
特征适应
-
Keywords
target tracking
Siamese network
region proposal network(RPN)
guided anchoring
feature adaptation
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-