-
题名基于机器视觉的金属零件表面缺陷检测研究
- 1
-
-
作者
孙姿姣
罗芳
李阳辉
-
机构
清远职业技术学院机电与汽车工程学院
清远职业技术学院信息技术与创意设计学院
-
出处
《清远职业技术学院学报》
2025年第1期42-48,共7页
-
文摘
目前制造业中,金属零件的缺陷问题会导致重大经济损失,主要问题在于零件缺陷小且缺陷位置出现随机,传统人工检测难以区分微小缺陷位置与非缺陷位置,且人力成本高,经济效益低下。针对这一问题,研究提出一种基于机器视觉的金属零件表面缺陷检测方法,通过机器视觉检测代替人力劳动,同时采用交互式空间位置注意力模块,解决了金属零件表面的缺陷不明显难以检测的问题,采用对偶局部-全局Transformer模块,解决了缺陷区域与周围正常区域难以区分的问题,提高了金属零件表面微小缺陷的检测性能,从而提高企业经济效益。
-
关键词
机器视觉
缺陷检测
交互式空间位置注意力模块
对偶局部-全局Transformer模块
-
Keywords
machine vision
defect detection
interactive spatial position attention module
dual local-global transformer module
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进MMAL的细粒度图像分类研究
- 2
-
-
作者
李冰锋
冀得魁
杨艺
-
机构
河南理工大学电气工程与自动化学院
河南省煤矿装备智能检测与控制重点实验室
-
出处
《电子测量技术》
北大核心
2024年第17期172-179,共8页
-
基金
河南省科技攻关项目(222102210230)
河南理工大学博士基金(B2018-33)项目资助。
-
文摘
针对细粒度图像分类中目标区域难以精准定位及其内部细粒度特征难以识别的问题,提出了一种基于改进MMAL的细粒度图像分类方法。首先,利用形变卷积的感知区域可变性原理,动态地感知样本图像中不同尺度和形状的目标区域特征,从而增强网络对目标区域位置的感知能力。随后,采用GradCAM梯度回流的方法生成网络注意力热图,以减小特征背景噪声的干扰,实现对图像目标区域的精准定位。最后,提出位置感知空间注意力模块,通过融合坐标位置和双尺度空间信息,显著提升了网络对目标区域细粒度特征的提取能力。实验结果表明,与基线算法相比,该方法在CUB-200-2011、Stanford Car和FGVC-Aircraft三个公共数据集上分类精度分别提升了1.4%、1.5%、1.9%,该结果验证了所提方法的有效性。
-
关键词
细粒度图像分类
多尺度形变分组
位置感知空间注意力
GradCAM热图定位
多分支
-
Keywords
fine-grained image classification
multi-scale deformable grouping
position-aware spatial attention
GradCAM heatmap localization
multi-branch architecture
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TN791
[电子电信—电路与系统]
-
-
题名矿山人员行为视觉语义方法研究
- 3
-
-
作者
王戈琛
闫雨寒
刘晓文
丁恩杰
-
机构
中国矿业大学物联网(感知矿山)研究中心
中国矿业大学信息与控制工程学院
中国矿业大学电气与动力工程学院
中国矿业大学江苏省煤矿电气与自动化工程实验室
-
出处
《工矿自动化》
北大核心
2021年第5期40-45,51,共7页
-
基金
“十三五”国家重点研发计划项目(2017YFC0804400,2017YFC0804401)。
-
文摘
煤矿井下人员行为检测是感知矿山建设关注的重点,而现有的基于电磁波、基于可穿戴设备、基于计算机视觉等人员行为检测方法无法综合时间、地点、行为、环境等多方面因素评判矿山人员行为是否安全。提出了一种矿山人员行为视觉语义方法,通过特征提取、语义检测、特征重构、解码等生成描述视频中人员行为的语句。分别采用InceptionV4网络、I3D网络提取视频图像静态、动态特征,在InceptionV4网络中引入基于空间位置注意力模型和通道注意力模型的并行双重注意力机制,提高了网络的特征提取能力。针对视频内容与视觉语义易出现不一致的问题,引入语义检测网络对视频特征添加高级语义标签生成嵌入特征,将其与视频特征、语义特征共同输入解码器,并在解码过程中引入特征重构模块,通过获取解码器隐藏层状态重建视频特征,增强了视频特征与描述语句之间的关联关系,提高了视觉语义生成的准确性。采用MSVD,MSR-VTT公共数据集及自制矿山视频数据集进行实验,结果表明该方法具有较好的语义一致性,能准确获取视频中关键语义,更好地反映视频真实含义。
-
关键词
感知矿山
人员行为检测
视觉语义
双重注意力机制
空间位置注意力
通道注意力
语义检测
特征重构
-
Keywords
sensor mine
personnel behavior detection
visual semantics
dual attention mechanism
spatial location attention
channel attention
semantic detection
characteristic reconstruction
-
分类号
TD67
[矿业工程—矿山机电]
-