期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于ConvMixer骨干的显著性目标检测模型
1
作者 张斯博 朱敬华 +1 位作者 奚赫然 杜欣月 《黑龙江大学工程学报(中英俄文)》 2024年第1期48-57,共10页
显著性目标检测(Saliency Object Detection,SOD)算法多采用基于卷积神经网络(Convolutional Neural Network,CNN)的骨干网络提取特征,然而CNN无法获取图像的长范围特征依赖。视觉转换器(Vision Transformer,ViT)将图像划分为图块(patc... 显著性目标检测(Saliency Object Detection,SOD)算法多采用基于卷积神经网络(Convolutional Neural Network,CNN)的骨干网络提取特征,然而CNN无法获取图像的长范围特征依赖。视觉转换器(Vision Transformer,ViT)将图像划分为图块(patch),通过Transformer在patch之间传播全局上下文信息获得长范围特征依赖,但Transformer的自注意力层具有二次方的时间复杂性。因此,提出一种低复杂性的基于patch的SOD算法CM-PoolNet,对经典的显著性目标检测PoolNet模型的骨干网络进行改进,使用卷积模型ConvMixer替换VGG和RestNet,提出新的特征融合方法。基于U型结构,编码器对输入图像进行Patch Embedding,送入重复堆叠的由深度可分离卷积和膨胀卷积构成的ConvMixer特征提取器中。为解码器设计了基于patch的特征融合模块。设计了BCE、SSIM和IOU 3种损失,引导模型在像素级、图块级、特征图级3级层次中学习输入图像和真值图像之间的转换。在DUTS数据集和ECSSD数据集上进行实验,结果表明:提出的模型能够有效地分割突出的目标区域,并且准确预测具有清晰边界的精细结构。 展开更多
关键词 显著性目标检测 补丁嵌入 混合损失函数 PoolNet convmixer
下载PDF
基于ConvMixer架构的高效点云分类方法
2
作者 王淳 赵艳明 冯燕 《中国传媒大学学报(自然科学版)》 2024年第1期56-64,共9页
近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非... 近年来,视觉Transformer模型在点云分类等三维计算机视觉任务中显现出潜在的优越性,但其有效性来源仍然模糊不清。研究它们在视觉任务中的性能是完全归功于Transformer结构本身的优越性,还是至少部分得益于使用局部块作为输入表示,是非常必要的。受此启发,本文提出了一种简单但仍然有效的点云分类和分割模型PointConvMixer,用ConvMixer架构取代了Point-BERT中的标准Transformer。PointConvMixer在ModelNet40数据集上的整体分类准确率达到92.3%,在ShapeNet Parts数据集上进行点云部分分割时mIOUI和mIOUC分别为85.4%和83.9%,均优于基于Transformer的对比模型。此外,本文还进一步提出PPFConvMixer,其利用高效的局部特征描述符PPF增强了PointConvMixer,从而优化了点云分类性能。在查询半径为0.25m时,PPFConvMixer的总体分类准确率达到了93.8%。 展开更多
关键词 三维点云分类 深度学习 convmixer Point Pair Feature
下载PDF
基于改进YOLOv7模型的地铁隧道衬砌表观病害检测方法
3
作者 陈霆 雷洋 +1 位作者 白堂博 许贵阳 《铁道建筑》 北大核心 2024年第3期94-99,共6页
针对地铁隧道内部光线昏暗,诸多附属设备与衬砌表观病害纹理及灰度近似,病害检测精度低的问题,提出了一种基于改进YOLOv7(You Only Look Once v7)的地铁隧道衬砌表观病害与附属设施的检测方法。在原YOLOv7模型的骨干部分引入混合卷积模... 针对地铁隧道内部光线昏暗,诸多附属设备与衬砌表观病害纹理及灰度近似,病害检测精度低的问题,提出了一种基于改进YOLOv7(You Only Look Once v7)的地铁隧道衬砌表观病害与附属设施的检测方法。在原YOLOv7模型的骨干部分引入混合卷积模块(Mixed Convolutional Module,ConvMixer)并增加了微小物体检测头,降低网络复杂度并提高对微小病害的敏感度;在原YOLOv7模型的颈部将路径聚合网络(Path Aggregation Network,PANet)替换为双向特征金字塔网络(Bidirectional Feature Pyramid Network,BiFPN),用于捕获全局特征信息,在隧道复杂环境下精确定位;在最大池化卷积(MaxPooling Convolution,MPC)模块中引入无参注意力机制(Simple Parameter Free Attention Mechanism,SimAM),给检测目标的特征矢量赋予三维权重,以增加检测精度。检测结果表明,本文提出的改进模型的检测准确率和召回率分别达到89.1%、87.8%,且权重文件大小仅为59.6 MB,检测速率为89帧/s。该模型在保证较高检测精度的同时降低了权重文件大小,提高了检测速率,适用于隧道巡检系统。 展开更多
关键词 铁路隧道 检测精度 深度学习 衬砌病害 YOLOv7 convmixer BiFPN SimAM
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部