-
题名基于金字塔池化网络的道路场景深度估计方法
被引量:7
- 1
-
-
作者
周武杰
潘婷
顾鹏笠
翟治年
-
机构
浙江科技学院信息与电子工程学院
浙江大学信息与电子工程学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2019年第10期2509-2515,共7页
-
基金
国家自然科学基金(61502429)
浙江省自然科学基金(LY18F0002)~~
-
文摘
针对从单目视觉图像中估计深度信息时存在的预测精度不够准确的问题,该文提出一种基于金字塔池化网络的道路场景深度估计方法。该方法利用4个残差网络块的组合提取道路场景图像特征,然后通过上采样将特征图逐渐恢复到原始图像尺寸,多个残差网络块的加入增加网络模型的深度;考虑到上采样过程中不同尺度信息的多样性,将提取特征过程中各种尺寸的特征图与上采样过程中相同尺寸的特征图进行融合,从而提高深度估计的精确度。此外,对4个残差网络块提取的高级特征采用金字塔池化网络块进行场景解析,最后将金字塔池化网络块输出的特征图恢复到原始图像尺寸并与上采样模块的输出一同输入预测层。通过在KITTI数据集上进行实验,结果表明该文所提的基于金字塔池化网络的道路场景深度估计方法优于现有的估计方法。
-
关键词
单目视觉
深度估计
神经网络
金字塔池化网络
-
Keywords
Monocular vision
Depth estimation
Neural network
Pyramid pooling network
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于颜色和局部二值模式特征的车辆跟踪算法
被引量:1
- 2
-
-
作者
顾鹏笠
周武杰
潘婷
-
机构
浙江科技学院机械与能源工程学院
浙江科技学院信息与电子工程学院
-
出处
《浙江科技学院学报》
CAS
2018年第6期481-487,共7页
-
基金
国家自然科学基金项目(61502429)
浙江省自然科学基金项目(LY18F020012)
浙江科技学院研究生科研创新基金项目(2017YJSKC004)
-
文摘
针对目前车辆跟踪算法在应对光照变化时不稳定的特点,提出一种基于颜色特征和局部二值模式特征的车辆跟踪算法。即:提取样本的颜色特征和局部二值模式(LBP)特征,用结构化输出支持向量机(SVM)对正负样本进行分类,预测评分值最高的预测样本对应的坐标就是目标车辆所在位置。通过在有光照变化、运动模糊、快速运动等挑战的视频序列中进行仿真试验,表明在光照变化等情况下本文跟踪算法具有较强的鲁棒性。
-
关键词
车辆跟踪
智能交通
颜色特征
局部二值模式
-
Keywords
vehicle tracking
intelligent transportation
color feature
local binary pattern (LBP)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于卷积神经网络的车辆和行人检测算法
被引量:3
- 3
-
-
作者
潘婷
周武杰
顾鹏笠
-
机构
浙江科技学院机械与能源工程学院
浙江科技学院信息与电子工程学院
-
出处
《浙江科技学院学报》
CAS
2018年第5期398-403,共6页
-
基金
国家自然科学基金项目(61502429)
浙江省自然科学基金项目(LY18F020012)
浙江科技学院研究生科研创新基金项目(2017YJSKC004)
-
文摘
针对传统的车辆和行人检测算法在提取特征时鲁棒性较差的问题,提出一种基于深度学习的车辆和行人检测算法。该算法利用更快速的区域卷积神经网络(Faster RCNN)开源框架和Squeezenet网络,通过在线负样本学习(OHEM)算法和可变的非极大值抑制(Soft-NMS)算法来改进算法的检测精度。首先采用Squeezenet网络框架对图片提取特征,然后通过区域提取网络算法(RPN)获取图片中待检测的区域,最后在检测阶段加入OHEM算法对疑难样本进行重新学习和Soft-NMS抑制重叠矩形框,从而得到目标的得分和边界框。结果表明,基于卷积神经网络的车辆和行人检测算法能够获得较好的检测效果。
-
关键词
目标检测
Squeezenet网络
更快速的区域卷积神经网络
在线负样本学习
-
Keywords
object detection
Squeezenet network
Faster RCNN
OHEM
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度卷积神经网络的道路场景深度估计
被引量:7
- 4
-
-
作者
袁建中
周武杰
潘婷
顾鹏笠
-
机构
浙江科技学院信息与电子工程学院
浙江大学信息与电子工程学院
-
出处
《激光与光电子学进展》
CSCD
北大核心
2019年第8期171-179,共9页
-
基金
国家自然科学基金(61502429)
浙江省自然科学基金(LY18F020012)
浙江科技学院研究生科研创新基金(2017YJSKC004)
-
文摘
提出了一种基于深度卷积神经网络的单目视觉深度估计方法,该方法采用端到端学习框架来构建模型。采用残差网络(ResNet)作为神经网络模型框架的编码部分来提取深度信息特征。采用密集连接卷积网络(DenseNet)对编码后的信息进行译码。通过Skip-Connections实现编码和解码的信息流的集成,避免了层间信息传输的丢失。实验结果表明,与其他单目视觉深度估计方法相比,使用深度卷积神经网络可以更有效准确地估计视觉深度。
-
关键词
机器视觉
深度卷积神经网路
深度估计
单目图像
深度学习
-
Keywords
machine vision
deep convolutional neural network
depth estimation
monocular image
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-