期刊文献+
共找到830篇文章
< 1 2 42 >
每页显示 20 50 100
基于S-YOLO V5和Vision Transformer的视频内容描述算法
1
作者 徐鹏 李铁柱 职保平 《印刷与数字媒体技术研究》 CAS 北大核心 2023年第4期212-222,共11页
视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于... 视频内容描述的自动生成是结合计算机视觉和自然语言处理等相关技术提出的一种新型交叉学习任务。针对当前视频内容生成描述模型可读性不佳的问题,本研究提出一种基于S-YOLO V5和Vison Transformer(ViT)的视频内容描述算法。首先,基于神经网络模型KATNA提取关键帧,以最少帧数进行模型训练;其次,利用S-YOLO V5模型提取视频帧中的语义信息,并结合预训练ResNet101模型和预训练C3D模型提取视频静态视觉特征和动态视觉特征,并对两种模态特征进行融合;然后,基于ViT结构的强大长距离编码能力,构建模型编码器对融合特征进行长距离依赖编码;最后,将编码器的输出作为LSTM解码器的输入,依次输出预测词,生成最终的自然语言描述。通过在MSR-VTT数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为42.9、28.8、62.4和51.4;在MSVD数据集上进行测试,本研究模型的BLEU-4、METEOR、ROUGEL和CIDEr分别为56.8、37.6、74.5以及98.5。与当前主流模型相比,本研究模型在多项评价指标上表现优异。 展开更多
关键词 视频内容描述 S-YOLO V5 vision Transformer 多头注意力
下载PDF
Global Calibration Method of Multi-sensor Vision System Using Skew Laser Lines 被引量:7
2
作者 LIU Qianzhe SUN Junhua +1 位作者 LIU Zhen ZHANG Guangjun 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2012年第2期405-410,共6页
Multi-sensor vision system plays an important role in the 3D measurement of large objects.However,due to the widely distribution of sensors,the problem of lacking common fields of view(FOV) arises frequently,which m... Multi-sensor vision system plays an important role in the 3D measurement of large objects.However,due to the widely distribution of sensors,the problem of lacking common fields of view(FOV) arises frequently,which makes the global calibration of the vision system quite difficult.The primary existing solution relies on large-scale surveying equipments,which is ponderous and inconvenient for field calibrations.In this paper,a global calibration method of multi-sensor vision system is proposed and investigated.The proposed method utilizes pairs of skew laser lines,which are generated by a group of laser pointers,as the calibration objects.Each pair of skew laser lines provides a unique coordinate system in space which can be reconstructed in certain vision sensor's coordinates by using a planar pattern.Then the geometries of sensors are computed under rigid transformation constrains by taking coordinates of each skew lines pair as the intermediary.The method is applied on both visual cameras with synthetic data and a real two-camera vision system;results show the validity and good performance.The prime contribution of this paper is taking skew laser lines as the global calibration objects,which makes the method simple and flexible.The method need no expensive equipments and can be used in large-scale calibration. 展开更多
关键词 multi-vision system global calibration non-overlapping cameras skew laser lines
下载PDF
Multi-camera calibration method based on minimizing the difference of reprojection error vectors 被引量:3
3
作者 HUO Ju LI Yunhui YANG Ming 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第4期844-853,共10页
In order to achieve a high precision in three-dimensional(3D) multi-camera measurement system, an efficient multi-cameracalibration method is proposed. A stitching method of large scalecalibration targets is deduced... In order to achieve a high precision in three-dimensional(3D) multi-camera measurement system, an efficient multi-cameracalibration method is proposed. A stitching method of large scalecalibration targets is deduced, and a fundamental of multi-cameracalibration based on the large scale calibration target is provided.To avoid the shortcomings of the method, the vector differencesof reprojection error with the presence of the constraint conditionof the constant rigid body transformation is modelled, and mini-mized by the Levenberg-Marquardt (LM) method. Results of thesimulation and observation data calibration experiment show thatthe accuracy of the system calibrated by the proposed methodreaches 2 mm when measuring distance section of 20 000 mmand scale section of 7 000 mm × 7 000 mm. Consequently, theproposed method of multi-camera calibration performs better thanthe fundamental in stability. This technique offers a more uniformerror distribution for measuring large scale space. 展开更多
关键词 vision measurement multi-camera calibration field stitching vector error
下载PDF
Rail fastener defect inspection method for multi railways based on machine vision 被引量:2
4
作者 Junbo Liu YaPing Huang +3 位作者 ShengChun Wang XinXin Zhao Qi Zou XingYuan Zhang 《Railway Sciences》 2022年第2期210-223,共14页
Purpose–This research aims to improve the performance of rail fastener defect inspection method for multi railways,to effectively ensure the safety of railway operation.Design/methodology/approach–Firstly,a fastener... Purpose–This research aims to improve the performance of rail fastener defect inspection method for multi railways,to effectively ensure the safety of railway operation.Design/methodology/approach–Firstly,a fastener region location method based on online learning strategy was proposed,which can locate fastener regions according to the prior knowledge of track image and template matching method.Online learning strategy is used to update the template library dynamically,so that the method not only can locate fastener regions in the track images of multi railways,but also can automatically collect and annotate fastener samples.Secondly,a fastener defect recognition method based on deep convolutional neural network was proposed.The structure of recognition network was designed according to the smaller size and the relatively single content of the fastener region.The data augmentation method based on the sample random sorting strategy is adopted to reduce the impact of the imbalance of sample size on recognition performance.Findings–Test verification of the proposed method is conducted based on the rail fastener datasets of multi railways.Specifically,fastener location module has achieved an average detection rate of 99.36%,and fastener defect recognition module has achieved an average precision of 96.82%.Originality/value–The proposed method can accurately locate fastener regions and identify fastener defect in the track images of different railways,which has high reliability and strong adaptability to multi railways. 展开更多
关键词 Rail fastener Defects inspection multi railways Image recognition Deep convolutional neural network Machine vision
下载PDF
基于改进YOLOX与多级数据关联的行人多目标跟踪算法研究 被引量:2
5
作者 韩锟 彭晶莹 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第1期94-105,共12页
目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的... 目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的基础上,提出一种基于改进YOLOX与多级数据关联的行人多目标跟踪算法。对于检测器,为了增强网络的特征表达能力,提高检测精度,在YOLOX骨架网络与颈部网络分别引入ECA通道注意力模块与ASFF自适应特征融合模块。对于身份识别特征,为了减少数据关联步骤的错误匹配数量,提高跟踪效率,使用轻量的OSNet重识别网络与NSA卡尔曼滤波获取目标特征。对于数据关联,为了减少身份切换次数,避免目标丢失,将检测与跟踪都进行分类处理,使用不同的相似性计算方法,实现基于检测置信度与轨迹状态的多级数据关联。实验结果表明:与改进前YOLOX与DeepSORT简单结合的算法相比,在YOLOX中引入ECA模块与ASFF模块使误检数量大幅降低,使用YOLOX-s模型时降幅可达17%;结合OSNet模型与NSA卡尔曼滤波的特征提取方法能提高跟踪稳定性,IDF1指标提高0.77%,IDSW减少947;基于检测置信度与轨迹状态的多级数据关联算法可以明显改善跟踪性能,MOTA指标提升3.36%。算法最终在MOT17与MOT20测试集上的MOTA达80.4%与77.7%,IDF1达78.4%与76.7%。提出的行人多目标跟踪方法相较于其他先进算法在跟踪精度与跟踪速度上达到更好的平衡,可为工业上在线行人多目标跟踪应用提供参考。 展开更多
关键词 多目标跟踪 目标检测 注意力机制 数据关联 计算机视觉
下载PDF
基于改进Tracktor的行人多目标跟踪算法 被引量:1
6
作者 谌海云 黄忠义 +1 位作者 王海川 余鸿皓 《计算机工程与应用》 CSCD 北大核心 2024年第8期242-249,共8页
在多目标视频跟踪中,针对受交互遮挡等影响导致检测偏差从而致使目标身份丢失的问题,提出一种基于改进Tracktor的行人多目标跟踪算法DUTracktor。在检测框回归中设计一个动态更新模块,利用孪生网络对建议框进一步检测定位;利用时序信息... 在多目标视频跟踪中,针对受交互遮挡等影响导致检测偏差从而致使目标身份丢失的问题,提出一种基于改进Tracktor的行人多目标跟踪算法DUTracktor。在检测框回归中设计一个动态更新模块,利用孪生网络对建议框进一步检测定位;利用时序信息增强模块更新当前帧更适合的模板,建立全局上下文关系;并通过像素相关进行特征融合,从而增强目标边缘信息和尺度信息;利用相机运动补偿和融合相似矩阵构建二级关联跟踪机制,建立检测框和轨迹更强大的关联性,提高目标跟踪的鲁棒性。在公开的MOT16数据集上进行实验测试,并与当前主流算法相比,该算法跟踪精度表现较优,具有良好的鲁棒性,FPS稳定在24帧。 展开更多
关键词 计算机视觉 多目标跟踪 Tracktor 孪生网络
下载PDF
Evaluation of Behavior of Evacuees on a Floor in a Disaster Situation Using Multi-agent Simulation and Mixed Reality Game: Effectiveness of the Field of Vision and Priority of Referred Objects
7
作者 Keita Sugiura Masahiro Arakawa 《Computer Technology and Application》 2016年第5期227-235,共9页
下载PDF
一种密集多尺度特征引导代价聚合的改进立体匹配网络
8
作者 张博 张美灵 +1 位作者 李雪 朱磊 《西安工程大学学报》 CAS 2024年第1期121-130,共10页
针对目前立体匹配算法在重复纹理、无纹理、边缘等不适定性区域仍存在匹配不准确的问题,提出了一种基于PSMNet的密集多尺度特征引导代价聚合的立体匹配算法—DGNet(Dense multi-scale features Guided aggregation Network)。首先,基于... 针对目前立体匹配算法在重复纹理、无纹理、边缘等不适定性区域仍存在匹配不准确的问题,提出了一种基于PSMNet的密集多尺度特征引导代价聚合的立体匹配算法—DGNet(Dense multi-scale features Guided aggregation Network)。首先,基于密集连接空洞空间金字塔池化结构设计了密集多尺度特征提取模块,该模块利用不同膨胀率的空洞卷积提取不同尺度的区域级特征,并通过密集连接方式有效整合不同尺度的图像特征,使网络捕获丰富的上下文关系;其次,在每个视差等级下将左右特征图串联形成初始代价体,再提出密集多尺度特征引导代价聚合结构,在聚合代价体的同时自适应融合代价体和密集多尺度特征,从而使后续的解码层在多尺度上下文信息的引导下解码出更加精确和高分辨率的几何信息;最后,将全局优化后的高分辨率代价体送入视差回归模块以获得视差图。实验结果表明:所提算法在KITTI 2015和KITTI 2012数据集上的误匹配率分别降至1.76%和1.24%,SceneFlow数据集上的端点误差降至0.56 px,与GWCNet、CPOP-Net等先进算法相比,所提算法在不适定区域有明显改善。 展开更多
关键词 双目视觉 立体匹配 密度多尺度特征 自适应融合
下载PDF
基于自适应聚合循环递归的稠密点云重建网络
9
作者 王江安 黄乐 +2 位作者 庞大为 秦林珍 梁温茜 《图学学报》 CSCD 北大核心 2024年第1期230-239,共10页
为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多... 为了解决弱纹理重建难、资源消耗大和重建时间长等问题,提出了一种基于自适应聚合循环递归卷积的多阶段稠密点云重建网络,即A2R2-MVSNet(adaptive aggregation recurrent recursive multi view stereo net)。该方法首先引入一种基于多尺度循环递归残差的特征提取模块,聚合上下文语义信息,以解决弱纹理或无纹理区域特征提取难的问题。在代价体正则化部分,提出一种残差正则化模块,该模块在略微增加内存消耗的前提下,提高了3D CNN提取和聚合上下文语意的能力。实验结果表明,提出的方法在DTU数据集上的综合指标排名靠前,在重建细节上有着更好的体现,且在BlendedMVS数据集上生成了不错的深度图和点云结果,此外网络还在自采集的大规模高分辨率数据集上进行了泛化测试。归功于由粗到细的多阶段思想和我们提出的模块,网络在生成高准确性和完整性深度图的同时,还能进行高分辨率重建以适用于实际问题。 展开更多
关键词 深度学习 计算机视觉 三维重建 稠密重建 多视图立体 递归神经网络
下载PDF
多耦合反馈网络的图像融合和超分辨率方法
10
作者 王蓉 端木春江 《计算机工程与应用》 CSCD 北大核心 2024年第5期210-220,共11页
人们在日常生活中往往需要得到高动态范围和高分辨率的图像。但由于技术设备的限制,高动态范围的图像往往通过低动态范围图像的多曝光融合(MEF)而获得,高分辨率图像往往通过低分辨率图像的超分辨率(SR)而获得。MEF和SR通常被作为两个独... 人们在日常生活中往往需要得到高动态范围和高分辨率的图像。但由于技术设备的限制,高动态范围的图像往往通过低动态范围图像的多曝光融合(MEF)而获得,高分辨率图像往往通过低分辨率图像的超分辨率(SR)而获得。MEF和SR通常被作为两个独立的内容进行研究。为了解决当前模型不能同时实现高动态范围和高分辨率的问题,通过对现有方法进行研究,提出了一种基于多耦合反馈网络MCF-Net及其方法。模型包括:N个子网和输出模块;在方法中,将N张下采样图片I_(lr)^(i),I_(lr)^(m),I_(lr)^(-i)分别输入至N个子网,提取的低分辨率特征F_(lr)^(i),F_(lr)^(m),F_(lr)^(-i);根据低分辨率特征F_(lr)^(i),F_(lr)^(m),F_(lr)^(-i)提取对应图像的超分辨率特征G_(0)^(i),G_(0)^(m),G_(0)^(-i);得到融合高分辨率特征G_(t)^(i),G_(t)^(m),G_(t)^(-i)并输入至下个MCFB中,直至第T个MCFB得到融合高分辨率特征G_(T)^(i),G_(T)^(m),G_(T)^(-i);获取对应的融合超分辨率图像I_(t)^(i),I_(t)^(m),I_(t)^(-i);融合N个子网中第T个重建模块REC输出的I_(T)^(i),I_(T)^(m),I_(T)^(-i)得到高动态范围、超分辨率图像I_(out)。在SICE数据集上实验并验证了性能,与现有的33种方法进行对比,结果显示以下各评价指标都有明显的提高,其中结构相似性(SSIM)达到0.833 2,峰值信噪比(PSNR)达到22.07 dB,多曝光融合相似性(MEF-SSIM)达到0.937 8。 展开更多
关键词 图像多曝光融合 图像超分辨率 卷积神经网络 计算机视觉 深度学习
下载PDF
修复缺陷嫌疑区域的无监督磁瓦表面缺陷检测
11
作者 唐善成 逯建辉 +2 位作者 张莹 金子成 赵安新 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第4期718-728,共11页
磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.... 磁瓦表面缺陷样本数量少,异常视觉特征分布发散,现有依赖目标特征的有监督检测方法不能有效检测未定义缺陷;磁瓦表面正常纹理呈非均匀且非周期性分布,使得经典重构网络难以准确地重构磁瓦表面正常特征,导致相关无监督检测方法性能低下.为此,采用多头注意力增强的掩码图像修复网络(MIINet),长距离提取图像特征,捕捉全局信息,增强图像修复的能力;引入视觉显著性算法抑制磁瓦表面纹理信息和突显缺陷区域,以便二值化算法精准分割缺陷嫌疑区域;利用MIINet修复待检测图像缺陷嫌疑区域,选用修复前后图像的残差图像和结构相似性实现缺陷检测与缺陷判定.与经典无监督方法相比,修复缺陷嫌疑区域的表面缺陷检测方法的准确率提升了2.36%,F1值提升了1.62%. 展开更多
关键词 多头注意力 磁瓦表面缺陷检测 无监督学习 图像修复 视觉显著性
下载PDF
基于计算机视觉的舰船模型三维重建方法
12
作者 王玉 孙红娟 《舰船科学技术》 北大核心 2024年第6期161-164,共4页
为保证舰船模型三维重建的完整性以及细节程度,提出基于计算机视觉的舰船模型三维重建方法。基于双目立体视觉计算全局舰船目标点云坐标,生成舰船全局的三维点云数据;多视角点云配准方法对该数据进行配准后,输入多尺度特征递归卷积的稠... 为保证舰船模型三维重建的完整性以及细节程度,提出基于计算机视觉的舰船模型三维重建方法。基于双目立体视觉计算全局舰船目标点云坐标,生成舰船全局的三维点云数据;多视角点云配准方法对该数据进行配准后,输入多尺度特征递归卷积的稠密点云重建网络模型中,通过该模型生成舰船模型三维深度图,在此基础上,利用运动结构法完成舰船深度图中的三维曲线重建,对舰船模型进行颜色渲染,输出舰船模型三维重建结果。测试结果显示,该方法能够完成不同图像之间对应点的可靠匹配,确定各点的坐标位置;三维重建后模型的空间偏差均在0.015以下;能够较好地完成舰船结构的重建,重建后舰船模型的完整性较好,清晰呈现舰船的结构细节。 展开更多
关键词 计算机视觉 舰船模型 三维重建 多视角 颜色渲染 三维曲线重建
下载PDF
结合视角矫正和改进ViViT的驾驶员睡意判断方法
13
作者 傅由甲 孟雪莹 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第6期172-179,共8页
针对传统检测方法中摄像头视角受限问题,提出了一种结合面部姿态矫正和改进ViViT的多视角下人脸疲倦检测方法。采用Mediapipe Face Mesh定位面部三维特征点并将其矫正为正面,利用提出的FGR-ViViT模型来捕捉矫正后的眼睛、眉毛、嘴巴线... 针对传统检测方法中摄像头视角受限问题,提出了一种结合面部姿态矫正和改进ViViT的多视角下人脸疲倦检测方法。采用Mediapipe Face Mesh定位面部三维特征点并将其矫正为正面,利用提出的FGR-ViViT模型来捕捉矫正后的眼睛、眉毛、嘴巴线条图像帧序列变化。FGR-ViViT通过在ViViT的Temporal Transformer Encoder中添加部件选择模块来捕捉特征在时间维度中的细微差异,同时融合2次dropout和改进的对比损失函数来调整样本的相似性,降低模型过拟合风险并提高泛化能力。实验结果表明,提出的方法在YawDD和DROZY矫正后的线条图像帧的测试集上,F1-分数达到了94.5%和97.6%,相较于原始人脸图像帧分别提高了3.2%和10.4%,其FGR-ViViT相较于原始ViViT分别提高了6.1%和0.7%。所提方法适用于摄像头灵活摆放的多种应用场景,对解决多视角人脸睡意判断具有积极意义。 展开更多
关键词 疲劳检测 多视角 Video vision Transformer 部件选择模块
下载PDF
中厚板多层多道焊视觉测量与工艺规划
14
作者 王天琪 张树浩 +1 位作者 龙斌 王克宽 《天津工业大学学报》 CAS 北大核心 2024年第3期75-81,共7页
针对中厚板多层多道焊的焊道测量问题,提出利用焊缝检测和焊道尺寸视觉测量的信息融合自适应微调焊枪位置的方法。首先基于结构光视觉传感器系统采集焊缝图像,在典型图像处理算法的基础上,结合FROSAC提取算法提取焊缝特征信息;将提取到... 针对中厚板多层多道焊的焊道测量问题,提出利用焊缝检测和焊道尺寸视觉测量的信息融合自适应微调焊枪位置的方法。首先基于结构光视觉传感器系统采集焊缝图像,在典型图像处理算法的基础上,结合FROSAC提取算法提取焊缝特征信息;将提取到的特征点进行坐标转换,采用视觉测量获得焊道轮廓和尺寸信息,来修正机器人的运动路径;根据焊缝特征信息分析工艺参数对焊道成型的影响,确定焊道层数、各焊道的工艺参数以及焊枪的偏移量,完成多层多道焊接工艺规划;最后基于搭建的机器人焊接视觉系统在12 mm母材上进行V形坡口多层多道焊接试验。结果表明:该方法下坡口填充良好,焊道尺寸平均测量误差小于0.2 mm,满足多层多道焊接工业应用需求。 展开更多
关键词 多层多道规划 结构光视觉传感器 三维检测 FROSAC算法 焊接工艺参数
下载PDF
ViT和注意力融合的类别不均衡PCB缺陷检测方法
15
作者 陈俊英 李朝阳 +1 位作者 席月芸 刘冲 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第4期294-306,共13页
针对实际环境下印刷电路板(PCB)缺陷样本难以收集造成的数据长尾分布和检测精度低以及ViT用于检测时计算复杂度高等问题,提出多尺度ViT特征提取和注意力特征融合的端到端PCB缺陷检测算法。首先结合ViT和部分卷积构建多尺度特征提取网络... 针对实际环境下印刷电路板(PCB)缺陷样本难以收集造成的数据长尾分布和检测精度低以及ViT用于检测时计算复杂度高等问题,提出多尺度ViT特征提取和注意力特征融合的端到端PCB缺陷检测算法。首先结合ViT和部分卷积构建多尺度特征提取网络,利用层级多头注意力对不同尺度的特征图执行自适应的注意力操作,使网络能够更好地捕捉局部和全局信息进而增强其特征提取能力,部分卷积可以降低计算开销。其次,基于能量空域抑制的无参数注意力机制将多尺度特征有效融合,提升网络融合特征图的表达能力。最后,引入对类别不均衡敏感的分类函数对网络的损失函数进行改进,增强网络对类别不平衡数据的拟合程度,提高网络的泛化能力。在3种不同类型的公开PCB数据集上的实验结果表明,所提出的检测算法在PCB表面缺陷数据集的平均精度均值(mAP)均有提升,分别为99.13%、98.67%,99.82%;在类别不均衡的PCB缺陷检测任务上,相较于改进前方法,mAP提升了11.94%,网络检测速度达到25 FPS,为PCB缺陷的检测提供了一种快速、有效的方法。 展开更多
关键词 缺陷检测 印刷电路板 vision Transformer 注意力机制 多尺度特征提取
下载PDF
基于多维投影时空事件帧的动态视觉传感手势识别
16
作者 康来 张亚坤 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期649-658,共10页
基于视觉的手势识别是虚拟现实、游戏仿真等领域常用的人机交互手段。在实际应用中,手势动作快速变化将导致传统RGB相机或深度相机成像模糊,给手势识别带来巨大挑战。针对上述问题,利用动态视觉传感器捕捉高速手势运动信息,提出一种基... 基于视觉的手势识别是虚拟现实、游戏仿真等领域常用的人机交互手段。在实际应用中,手势动作快速变化将导致传统RGB相机或深度相机成像模糊,给手势识别带来巨大挑战。针对上述问题,利用动态视觉传感器捕捉高速手势运动信息,提出一种基于多维投影时空事件帧(spatiotemporal event frame,STEF)的动态视觉数据手势识别方法。将时空信息嵌入到数据投影面融合形成多维投影时空事件帧,克服现有动态视觉信息事件帧表达方法时域信息丢失的局限性,提升动态视觉传感数据的特征表达能力。在此基础上,采用先进的脉冲神经网络对时空事件帧进行分类实现手势识别。在公开数据集上的识别精度达到96.67%,性能优于同类方法,表明该方法可显著提升动态视觉传感数据手势识别准确率。 展开更多
关键词 动态视觉传感器 手势识别 多维投影 时空事件帧 脉冲神经网络
下载PDF
基于残差卷积与多头自注意力的CXR图像分类
17
作者 陈辉 张甜 陈润斌 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第3期219-227,共9页
为了提高新型冠状病毒肺炎(COVID-19)检测的效率和准确性,本文提出一种自动识别COVID-19胸部X射线(CXR)图像的网络模型(MHRA-RCNet)。在ResNet50模型的基础上,首先,采用残差卷积对CXR图像中形状复杂的感染区域进行局部特征提取。其次,... 为了提高新型冠状病毒肺炎(COVID-19)检测的效率和准确性,本文提出一种自动识别COVID-19胸部X射线(CXR)图像的网络模型(MHRA-RCNet)。在ResNet50模型的基础上,首先,采用残差卷积对CXR图像中形状复杂的感染区域进行局部特征提取。其次,选择在ResNet50的第2、3阶段引入多头关系聚合模块,以增强对全局信息的建模能力;为了进一步将局部信息和全局信息进行融合,以提高特征的表达能力和特征之间位置的相关性,在ResNet50的最后阶段引入了空洞视觉Transforme模块,有助于识别CXR图像中复杂的病变区域。最后,将融合后的特征以串联方式输入全局平均池化层进行全局空间信息整合,通过多层感知机进行图像分类并进行可视化分析。在公开访问的COVID-19 Radiography Database数据集与其他深度学习模型进行实验对比。实验结果表明:本文模型在多项分类指标上具有较好的分类精度;另外,从精确度、灵敏度和特异性上也可以直观地看出本文模型能够较好地识别新冠肺炎,进一步证明了本文模型在图像分类任务中的优越性和有效性。 展开更多
关键词 新型冠状病毒肺炎 图像分类 残差卷积 多头关系聚合 空洞视觉Transformer
下载PDF
基于AMP架构的青霉素结晶与发酵检测系统设计
18
作者 王晓君 孙梓林 王雁 《仪表技术与传感器》 CSCD 北大核心 2024年第5期66-73,共8页
目前,在青霉素工业生产中,人工检测是青霉素结晶状态以及发酵液高度检测的主要方式,这种方式成本高、自动化水平低且易造成误判,对青霉素产量和品质有很大影响。针对此种情况,文中设计了一种基于AMP架构的青霉素结晶状态与发酵液高度检... 目前,在青霉素工业生产中,人工检测是青霉素结晶状态以及发酵液高度检测的主要方式,这种方式成本高、自动化水平低且易造成误判,对青霉素产量和品质有很大影响。针对此种情况,文中设计了一种基于AMP架构的青霉素结晶状态与发酵液高度检测系统。该系统以ZYNQ-7000作为可重构嵌入式平台。在PL部分,利用Vivado HLS工具实现结晶状态、发酵液高度检测的图像预处理算法IP核设计,并搭建出视觉传感系统的硬件平台。在PS部分,系统采用双核AMP(非对称多处理)运行模式,完成结晶状态检测、发酵液高度检测算法处理与以太网视频传输、图像存储功能的并行处理。实验结果表明:该系统支持2种检测模式的切换,可实现对工业生产中青霉素结晶状态与发酵液高度的精确检测与视频数据的实时传输。 展开更多
关键词 图像处理 ZYNQ 视觉传感系统 Vivado HLS 多核并行处理 视频图像处理
下载PDF
语义增强的多视立体视觉方法
19
作者 韩燮 王若蓝 赵融 《计算机技术与发展》 2024年第3期41-48,共8页
针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvL... 针对在基于深度学习技术的特征提取网络中,深层次的卷积神经网络提取的特征缺乏低级语义信息的问题,该文提出了语义增强的多视立体视觉方法。首先,提出了一种ConvLSTM(Convolutional Long Short-Term Memory)语义聚合网络,通过使用ConvLSTM网络结构,对多个卷积层提取的特征图进行预测,得到融合每层语义信息的特征图,有助于在空间上层层抽取图像的高级特征时,利用长短期记忆神经网络结构的记忆功能来增强高层特征图中的低级语义信息,提高了弱纹理区域的重建效果,提高了3D重建的鲁棒性和完整性;其次,提出了一种可见性网络,在灰度图的基础上,通过突出特征图上可见区域的特征,加深了可见区域在特征图中的影响,有助于提高三维重建效果;最后,提取图像的纹理信息,并进入ConvLSTM语义聚合网络提取深层次特征,提高了弱纹理区域的重建效果。与主流的多视立体视觉重建方法相比,重建效果较好。 展开更多
关键词 三维重建 深度学习 多视立体视觉 特征提取 语义聚合网络
下载PDF
基于改进DDNet的皮带输送机位移故障诊断研究
20
作者 高飞 《计算机测量与控制》 2024年第8期47-54,共8页
针对煤矿带式输送机皮带位移故障诊断中存在局限性大、耗时长的问题,将故障数据进行多源异构处理,并在数据处理的基础上将边缘检测算法与深度细节网络,构建了一种结合边缘检测算法与改进深度细节网络的多源异构数据故障诊断模型;首先利... 针对煤矿带式输送机皮带位移故障诊断中存在局限性大、耗时长的问题,将故障数据进行多源异构处理,并在数据处理的基础上将边缘检测算法与深度细节网络,构建了一种结合边缘检测算法与改进深度细节网络的多源异构数据故障诊断模型;首先利用边缘检测算法提取输送机图像中的边缘特征,然后结合多源异构数据,并通过改进后的深度细节网络进行故障识别,并构建故障诊断模型;结果表明检测模型在皮带边缘图像数据处理的检测准确率平均值为95.27%,比目标检测算法和K最邻近分类算法的准确率高出了5.34%和10.21%;同时检测模型的图像数据查全率平均值为93.46%,比目标检测算法和K最邻近分类算法的查全率高出了4.09%和7.18%;这说明研究构建的多源异构数据故障诊断模型能够显著提升皮带位移检测的可靠性和鲁棒性,具有重要的研究价值和实际应用前景。 展开更多
关键词 DDNet网络 皮带输送机 机器视觉模块 多源异构数据 位移故障
下载PDF
上一页 1 2 42 下一页 到第
使用帮助 返回顶部