为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度...为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。展开更多
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据...为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。展开更多
针对YOLO v5l(you only look once version 5 large)算法对于小目标、少样本且背景复杂的排水管道缺陷图像检测的精度低、误检和漏检率较高等问题,提出了一种基于YOLO v5l-Im算法的排水管道缺陷检测改进方法。做了三点改进:首先提出了Fo...针对YOLO v5l(you only look once version 5 large)算法对于小目标、少样本且背景复杂的排水管道缺陷图像检测的精度低、误检和漏检率较高等问题,提出了一种基于YOLO v5l-Im算法的排水管道缺陷检测改进方法。做了三点改进:首先提出了Focal-EIoU(focal embedding intersection over union)损失函数,有效提升了检测模型的性能;其次为增强检测模型对小目标缺陷的检测效果,减少缺陷误检和漏检的概率,将骨干网络中浅层特征图融合到双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)中,增加针对小目标的预测层;最后在YOLO v5l中引入坐标注意力机制(coordinate attention,CA),提高模型对图像中感兴趣区域的敏感程度,减少冗余背景信息的干扰。3种改进对平均检测准确率(mean average precision,mAP)的提升分别为2.0、2.9、5.9个百分点。将三种有效改进融合到一起,检测结果表明:本文提出的YOLO v5l-Im模型的mAP达到了92.1%,较原模型的85.5%提升了6.5个百分点。由此可见,所做的改进有效增强了YOLO v5l对排水管道缺陷的检测能力。展开更多
针对弱光线环境下道路交通标志检测精度不高、漏检、错检等情况,提出了一种改进YOLOX的融合检测算法。该算法引入轻量级Mobile Vi T Block模块,将CNN和Transformer结合,提高了网络对物体局部和全局特征的学习能力;通过添加自适应特征融...针对弱光线环境下道路交通标志检测精度不高、漏检、错检等情况,提出了一种改进YOLOX的融合检测算法。该算法引入轻量级Mobile Vi T Block模块,将CNN和Transformer结合,提高了网络对物体局部和全局特征的学习能力;通过添加自适应特征融合金字塔ASFF,对有效特征层进行加权融合,加快了网络训练收敛速度;并采用Focal Loss替换二元交叉熵损失函数,用以解决因样本少导致分类不准确的问题。实验结果表明,相较于YOLOX算法,改进YOLOX算法mAP值提升了2.89%,参数量减少了6.23 M,可视化实验进一步验证了所提算法可以提高检测精度,有效避免因弱光线导致的漏检、错检现象。展开更多
文摘为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。
文摘为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。
文摘针对YOLO v5l(you only look once version 5 large)算法对于小目标、少样本且背景复杂的排水管道缺陷图像检测的精度低、误检和漏检率较高等问题,提出了一种基于YOLO v5l-Im算法的排水管道缺陷检测改进方法。做了三点改进:首先提出了Focal-EIoU(focal embedding intersection over union)损失函数,有效提升了检测模型的性能;其次为增强检测模型对小目标缺陷的检测效果,减少缺陷误检和漏检的概率,将骨干网络中浅层特征图融合到双向特征金字塔网络(bidirectional feature pyramid network,BiFPN)中,增加针对小目标的预测层;最后在YOLO v5l中引入坐标注意力机制(coordinate attention,CA),提高模型对图像中感兴趣区域的敏感程度,减少冗余背景信息的干扰。3种改进对平均检测准确率(mean average precision,mAP)的提升分别为2.0、2.9、5.9个百分点。将三种有效改进融合到一起,检测结果表明:本文提出的YOLO v5l-Im模型的mAP达到了92.1%,较原模型的85.5%提升了6.5个百分点。由此可见,所做的改进有效增强了YOLO v5l对排水管道缺陷的检测能力。
文摘针对弱光线环境下道路交通标志检测精度不高、漏检、错检等情况,提出了一种改进YOLOX的融合检测算法。该算法引入轻量级Mobile Vi T Block模块,将CNN和Transformer结合,提高了网络对物体局部和全局特征的学习能力;通过添加自适应特征融合金字塔ASFF,对有效特征层进行加权融合,加快了网络训练收敛速度;并采用Focal Loss替换二元交叉熵损失函数,用以解决因样本少导致分类不准确的问题。实验结果表明,相较于YOLOX算法,改进YOLOX算法mAP值提升了2.89%,参数量减少了6.23 M,可视化实验进一步验证了所提算法可以提高检测精度,有效避免因弱光线导致的漏检、错检现象。