为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度...为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。展开更多
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据...为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。展开更多
针对传统目测法检测贴片二极管表面缺陷效率低下和基于手工特征的目标检测算法模型较浅,以及语义性不高等问题,提出了改进YOLO-V4的贴片二极管表面缺陷检测方法。首先考虑到随着网络加深使梯度消失,以及减少网络中的特征冗余和参数量的...针对传统目测法检测贴片二极管表面缺陷效率低下和基于手工特征的目标检测算法模型较浅,以及语义性不高等问题,提出了改进YOLO-V4的贴片二极管表面缺陷检测方法。首先考虑到随着网络加深使梯度消失,以及减少网络中的特征冗余和参数量的情况,CSP1模块采用DenseNet替换原网络中的ResNet;其次,为了实现特征信息的跨维度交互,让网络更加关注重要信息,在CSP1模块后引入了三分支注意力机制模块,同时使用FPN+PANet对特征进行融合;并且用CSP2替换CBL×5模块,降低了网络的运算量,提高了算法检测速度;最后优化了Focal Loss函数,对正负样本添加权重,以解决正负样本不平衡的问题。本文算法相较于YOLO-V4的检测精度(precision,P)、召回率(recall,R)和多分类平均精度(mean average precision,mAP),分别高出2.98%,2.65%,2.92%,表明改进YOLO-V4可以有效检测贴片二极管表面缺陷问题。展开更多
文摘为了提高多视图深度估计结果精度,提出一种基于自适应空间特征增强的多视图深度估计算法。设计了由改进后的特征金字塔网络(feature pyramid network,FPN)和自适应空间特征增强(adaptive space feature enhancement,ASFE)组成的多尺度特征提取模块,获取到具有全局上下文信息和位置信息的多尺度特征图像。通过残差学习网络对深度图进行优化,防止多次卷积操作出现重建边缘模糊的问题。通过分类的思想构建focal loss函数增强网络模型的判断能力。由实验结果可知,该算法在DTU(technical university of denmark)数据集上和CasMVSNet(Cascade MVSNet)算法相比,在整体精度误差、运行时间、显存资源占用上分别降低了14.08%、72.15%、4.62%。在Tanks and Temples数据集整体评价指标Mean上该模型优于其他算法,证明提出的基于自适应空间特征增强的多视图深度估计算法的有效性。
文摘为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。
文摘针对传统目测法检测贴片二极管表面缺陷效率低下和基于手工特征的目标检测算法模型较浅,以及语义性不高等问题,提出了改进YOLO-V4的贴片二极管表面缺陷检测方法。首先考虑到随着网络加深使梯度消失,以及减少网络中的特征冗余和参数量的情况,CSP1模块采用DenseNet替换原网络中的ResNet;其次,为了实现特征信息的跨维度交互,让网络更加关注重要信息,在CSP1模块后引入了三分支注意力机制模块,同时使用FPN+PANet对特征进行融合;并且用CSP2替换CBL×5模块,降低了网络的运算量,提高了算法检测速度;最后优化了Focal Loss函数,对正负样本添加权重,以解决正负样本不平衡的问题。本文算法相较于YOLO-V4的检测精度(precision,P)、召回率(recall,R)和多分类平均精度(mean average precision,mAP),分别高出2.98%,2.65%,2.92%,表明改进YOLO-V4可以有效检测贴片二极管表面缺陷问题。