期刊文献+
共找到140,059篇文章
< 1 2 250 >
每页显示 20 50 100
基于5G多接入边缘计算的云化PLC系统架构设计与应用 被引量:3
1
作者 冯毅雄 杨晨 +5 位作者 胡炳涛 赖颢善 石莹 宋光敏 汪勇 谭建荣 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第1期33-46,共14页
随着工业控制系统对柔性化、扁平化的要求不断提升,以PLC为构建基础的传统工业控制网络在大规模接入、算力提升和部署灵活性方面均受到限制.针对这些问题,融合5G网络和边缘计算技术,设计了基于5G多接入边缘计算的云化PLC系统架构,阐述... 随着工业控制系统对柔性化、扁平化的要求不断提升,以PLC为构建基础的传统工业控制网络在大规模接入、算力提升和部署灵活性方面均受到限制.针对这些问题,融合5G网络和边缘计算技术,设计了基于5G多接入边缘计算的云化PLC系统架构,阐述了该架构的运行机制和所涉及的关键技术;在此基础上,进行PLC系统的云化部署和调试,实现了工业现场、企业数据中心、5G网络和边缘网络的集成;最后,通过在某汽车制造公司产线改造过程中的应用,验证了所提架构的有效性. 展开更多
关键词 5G 边缘计算 云化PLC(可编程逻辑控制器) 架构设计
下载PDF
基于CRV-YOLO的苹果中心花和边花识别方法 被引量:2
2
作者 司永胜 孔德浩 +2 位作者 王克俭 刘丽星 杨欣 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期278-286,共9页
苹果树疏花是果园生产管理中的重要环节。准确高效地识别苹果中心花和边花,是研发智能疏花机器人的前提。针对苹果疏花作业中的实际需求,提出了一种基于CRV-YOLO的苹果中心花和边花识别方法。本文基于YOLO v5s模型进行了如下改进:将C-Co... 苹果树疏花是果园生产管理中的重要环节。准确高效地识别苹果中心花和边花,是研发智能疏花机器人的前提。针对苹果疏花作业中的实际需求,提出了一种基于CRV-YOLO的苹果中心花和边花识别方法。本文基于YOLO v5s模型进行了如下改进:将C-CoTCSP结构融入Backbone,更好地学习上下文信息并提高了模型特征提取能力,提高了模型对外形相似和位置关系不明显的中心花和边花的检测性能。在Backbone中添加改进RFB结构,扩大特征提取感受野并对分支贡献度进行加权,更好地利用了不同尺度特征。采用VariFocal Loss损失函数,提高了模型对遮挡等场景下难识别样本检测能力。在3个品种1837幅图像数据集上进行了实验,结果表明,CRV-YOLO的精确率、召回率和平均精度均值分别为95.6%、92.9%和96.9%,与原模型相比,分别提高3.7、4.3、3.9个百分点,模型受光照变化和苹果品种影响较小。与Faster R-CNN、SSD、YOLOX、YOLO v7模型相比,CRV-YOLO的精确率、平均精度均值、模型内存占用量和复杂度性能最优,召回率接近最优。研究成果可为苹果智能疏花提供技术支持。 展开更多
关键词 苹果花识别 YOLO v5s 上下文信息 中心花 边花
下载PDF
用于多通道单分子定位的高精度图像配准方法 被引量:1
3
作者 林丹樱 龚振权 +3 位作者 黄黎琳 聂梦娇 于斌 屈军乐 《物理学报》 SCIE EI CAS CSCD 北大核心 2024年第6期374-385,共12页
单分子定位技术可以绕过光学系统的衍射限制,在生物样品的单粒子追踪和超分辨显微成像中得到了广泛应用.多通道单分子定位采用多个成像通道,可以实现对不同目标的同时追踪或多色超分辨成像,也可以提升单粒子追踪的轴向深度或实现更高的... 单分子定位技术可以绕过光学系统的衍射限制,在生物样品的单粒子追踪和超分辨显微成像中得到了广泛应用.多通道单分子定位采用多个成像通道,可以实现对不同目标的同时追踪或多色超分辨成像,也可以提升单粒子追踪的轴向深度或实现更高的定位精度和密度.但各通道图像间的差异会影响协同定位或定量分析,因此图像配准是其图像数据预处理的关键环节;且由于单分子定位精度高,其对多通道图像配准精度的要求也很高.现有技术一般采用基于控制点的配准方法,且多采用复杂而精密的方式来获取基准物网格图像用于定位得到控制点对,以实现高精度图像配准,对样品或实验设备要求高,难以直接推广.为此,本文基于局部非线性变换和误匹配点剔除,发展了一种可以直接采用随机分布荧光珠样品作为基准物的高精度图像配准方法,通过在特征匹配和变换模型参数估计的过程中对控制点进行监测和迭代筛选,以剔除因单分子定位不准确或精度差而导致未精确匹配的控制点对,从而消除以随机分布荧光珠样品作为基准物时对于控制点准确获取和精确匹配所带来的不良影响,同时采用基于局部加权平均的二阶多项式拟合进行变换模型参数估计,以更好地适用于不同通道间存在局部非线性形变的情形.结果表明,采用该方法只需要3次迭代,就可以将未准确定位和精确匹配的控制点对找到并剔除,从而实现更准确的变换模型参数估计,将配准精度提高一个数量级,在图像局部非线性形变情况严重的正交像散双通道单分子定位成像系统中实现了约6 nm的配准精度. 展开更多
关键词 单分子定位 多通道成像 图像配准 误匹配点剔除
下载PDF
基于改进YOLOv5l的轻量化鸭蛋裂纹检测算法 被引量:1
4
作者 殷建军 康俊琪 肖德琴 《农业工程学报》 EI CAS CSCD 北大核心 2024年第5期216-223,共8页
鸭蛋裂纹检测技术对于禽蛋加工工厂实现智能化蛋品检测、分级具有重要意义。该研究针对鸭蛋裂纹检测流程复杂、计算量大、模型尺寸大等问题,提出了一种基于改进YOLOv5l(you only look once version5 large)的轻量裂纹检测算法,通过在黑... 鸭蛋裂纹检测技术对于禽蛋加工工厂实现智能化蛋品检测、分级具有重要意义。该研究针对鸭蛋裂纹检测流程复杂、计算量大、模型尺寸大等问题,提出了一种基于改进YOLOv5l(you only look once version5 large)的轻量裂纹检测算法,通过在黑暗条件下使用LED灯照射鸭蛋,根据裂纹蛋壳与完好蛋壳透光性不同产生的图像差异进行检测。通过在YOLOv5中引入Ghost_conv模块,大大减少了模型的浮点计算量和参数量,并在模型的骨干网络中加入ECA(efficient channel attention)注意力机制以及使用多尺度特征融合方法 BIFPN(bi-directional feature pyramid network),增加模型对有效信息的关注度,以提高算法检测精度。同时使用CIoU与α-IoU损失函数融合后替代YOLOv5原始GIoU函数加速回归预测。利用自建的鸭蛋裂纹数据集验证改进后模型的性能,结果表明,本研究提出的改进YOLOv5l网络模型检测精准率为93.8%,与原始YOLOv5l模型相比,检测精度提高了6.3个百分点,参数量和浮点计算量分别减少了30.6%、39.4%。检测帧速率为28.954帧/s,较原始YOLOv5l模型仅下降3.824帧/s。与其他的目标检测常用网络SSD(single shot multibox detector)、YOLOv4、Faster-RCNN(faster region convolutional neural networks)相比,精度分别提高了13.1、12.5、8.2个百分点。本研究提出的方法能够在低硬件资源条件下进行高精度检测,可为实际场景应用提供解决方案和技术支持。 展开更多
关键词 计算机视觉 图像识别 裂纹检测 注意力机制 鸭蛋
下载PDF
基于改进FasterNet的轻量化小麦生育期识别模型 被引量:1
5
作者 时雷 雷镜楷 +4 位作者 王健 杨程凯 刘志浩 席磊 熊蜀峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第5期226-234,共9页
针对现阶段小麦生育期信息获取需依靠人工观测,效率低、主观性强等问题,本文构建包含冬小麦越冬期、返青期、拔节期和抽穗期4个生育期共计4599幅小麦图像数据集,并提出一种基于FasterNet的轻量化网络模型FSST(Fast shuffle swin transfo... 针对现阶段小麦生育期信息获取需依靠人工观测,效率低、主观性强等问题,本文构建包含冬小麦越冬期、返青期、拔节期和抽穗期4个生育期共计4599幅小麦图像数据集,并提出一种基于FasterNet的轻量化网络模型FSST(Fast shuffle swin transformer),开展4个关键生育期的智能识别。在FasterNet部分卷积的基础上引入Channel Shuffle机制,以提升模型计算速度。引入Swin Transformer模块来实现特征融合和自注意力机制,用来提升小麦关键生育期识别准确率。调整整个模型结构,进一步降低网络复杂度,并在训练中引入Lion优化器,加快网络模型收敛速度。在自建的数据集上进行模型验证,结果表明,FSST模型参数量仅为1.22×10^(7),平均识别准确率、F1值和浮点运算量分别为97.22%、78.54%和3.9×10^(8),与FasterNet、GhostNet、ShuffleNetV2和MobileNetV34种模型相比,FSST模型识别精度更高,运算速度更快,并且识别时间分别减少84.04%、73.74%、72.22%和77.01%。提出的FSST模型能够较好地进行小麦关键生育期识别,并且具有识别快速精准和轻量化的特点,可以为大田作物生长实时监测提供信息技术支持。 展开更多
关键词 小麦 生育期识别 FasterNet 轻量化 Lion优化器
下载PDF
基于改进YOLOX与多级数据关联的行人多目标跟踪算法研究 被引量:2
6
作者 韩锟 彭晶莹 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第1期94-105,共12页
目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的... 目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的基础上,提出一种基于改进YOLOX与多级数据关联的行人多目标跟踪算法。对于检测器,为了增强网络的特征表达能力,提高检测精度,在YOLOX骨架网络与颈部网络分别引入ECA通道注意力模块与ASFF自适应特征融合模块。对于身份识别特征,为了减少数据关联步骤的错误匹配数量,提高跟踪效率,使用轻量的OSNet重识别网络与NSA卡尔曼滤波获取目标特征。对于数据关联,为了减少身份切换次数,避免目标丢失,将检测与跟踪都进行分类处理,使用不同的相似性计算方法,实现基于检测置信度与轨迹状态的多级数据关联。实验结果表明:与改进前YOLOX与DeepSORT简单结合的算法相比,在YOLOX中引入ECA模块与ASFF模块使误检数量大幅降低,使用YOLOX-s模型时降幅可达17%;结合OSNet模型与NSA卡尔曼滤波的特征提取方法能提高跟踪稳定性,IDF1指标提高0.77%,IDSW减少947;基于检测置信度与轨迹状态的多级数据关联算法可以明显改善跟踪性能,MOTA指标提升3.36%。算法最终在MOT17与MOT20测试集上的MOTA达80.4%与77.7%,IDF1达78.4%与76.7%。提出的行人多目标跟踪方法相较于其他先进算法在跟踪精度与跟踪速度上达到更好的平衡,可为工业上在线行人多目标跟踪应用提供参考。 展开更多
关键词 多目标跟踪 目标检测 注意力机制 数据关联 计算机视觉
下载PDF
基于VGG-UNet的食用菌菌丝体表型参数自动测量方法 被引量:1
7
作者 陈燕 陆嘉豪 +1 位作者 胡小春 祁亮亮 《农业机械学报》 EI CAS CSCD 北大核心 2024年第1期233-240,共8页
食用菌菌丝体表型特征是食用菌种质资源评价和科学育种的重要依据。针对传统阈值分割方法提取菌丝体区域易受到光照不均、菌丝体不规则生长和培养皿内产生代谢物等因素干扰的问题,制作食用菌菌丝体图像数据集,并提出一种基于深度学习的... 食用菌菌丝体表型特征是食用菌种质资源评价和科学育种的重要依据。针对传统阈值分割方法提取菌丝体区域易受到光照不均、菌丝体不规则生长和培养皿内产生代谢物等因素干扰的问题,制作食用菌菌丝体图像数据集,并提出一种基于深度学习的食用菌菌丝体表型参数自动测量方法。将U-Net网络编码器部分替换为VGG16的前13个卷积层,引入预训练权重,构建适用于菌丝体分割的VGG-UNet模型。测试集上对比实验表明,该模型的平均交并比达到98.18%,比原始U-Net模型高0.93个百分点。经该模型获取菌丝体分割图像后,利用OpenCV相关函数计算菌丝体的半径、周长、面积、覆盖度、圆整度这5个表型参数。将人工测量方法与本文方法进行线性回归分析,得出菌丝体半径、周长、面积和覆盖度的决定系数分别为0.979 5、0.991 5、0.975 0和0.975 0,均方根误差分别为2.20 mm、4.73 mm、176.74 mm^(2)和3.16%。经测试,本文方法能准确地完成食用菌菌丝体表型参数自动测量任务,为食用菌表型分析研究提供理论基础。 展开更多
关键词 食用菌菌丝体 表型参数 深度学习 图像处理 语义分割 VGG-UNet
下载PDF
一种道路裂缝检测的变尺度VS-UNet模型 被引量:1
8
作者 赵志宏 何朋 郝子晔 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期63-72,共10页
为解决目前现有的图像分割算法存在检测精度低、对裂缝检测缺乏针对性等问题,采用多尺度特征融合方法,提出一种扩展LG Block模块Extend-LG Block,其由多个并行不同膨胀率的空洞卷积组成.通过参数可调节分支数量和空洞卷积膨胀率,从而改... 为解决目前现有的图像分割算法存在检测精度低、对裂缝检测缺乏针对性等问题,采用多尺度特征融合方法,提出一种扩展LG Block模块Extend-LG Block,其由多个并行不同膨胀率的空洞卷积组成.通过参数可调节分支数量和空洞卷积膨胀率,从而改变其感受野大小,进而提取和融合不同尺度的裂缝特征.对比在深层使用多尺度特征融合模块的网络以及使用固定尺度结构进行多尺度特征融合的网络的优劣,提出一种变尺度结构的UNet模型VS-UNet,使用多个不同参数的Extend-LG Block替换UNet网络中的基本卷积块.该结构在网络浅层进行多尺度特征融合,多尺度特征融合模块提取的尺度随网络层加深逐渐减少.此结构在加强图像的细节特征提取能力的同时保持原有的抽象特征提取能力,还可避免网络参数的增加.在DeepCrack数据集以及CFD数据集上进行实验验证,结果表明,相较于其他两种结构和方法,提出的变尺度结构的网络在有更高检测精度的同时,在可视化实验对比上对各种大小的裂缝有更好的分割效果.最后与其他图像分割算法进行对比,各项指标与UNet相比均有一定程度提升,证明了网络改进的有效性.研究结果可为进一步提升道路裂缝检测效果提供参考. 展开更多
关键词 U-Net 多尺度 裂缝检测 空洞卷积 深度学习
下载PDF
基于改进YOLOv8的嵌入式道路裂缝检测算法 被引量:1
9
作者 耿焕同 刘振宇 +2 位作者 蒋骏 范子辰 李嘉兴 《计算机应用》 CSCD 北大核心 2024年第5期1613-1618,共6页
在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替... 在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替换YOLOv8 C2f模块中的Bottleneck结构,并将改进后的C2f模块记为C2f-Faster;其次,在YOLOv8主干网络中的每个C2f-Faster模块之后接一个SE(Squeeze-and-Excitation)通道注意力层,进一步提高检测的精度。在开源道路损害数据集RDD20(Road Damage Detection 20)上的实验结果表明:所提方法的平均F1得分为0.573,每秒检测帧数(FPS)为47,模型大小为55.5MB,相较于GRDDC2020(GlobalRoadDamageDetection Challenge 2020)的SOTA(State-Of-The-Art)模型,F1得分提高了0.8个百分点,FPS提高了291.7%,模型大小减小了41.8%,实现了在边缘设备上对道路裂缝实时且准确的检测。 展开更多
关键词 YOLOv8 目标检测 轻量化 注意力机制 道路裂缝
下载PDF
基于跨模态交叉注意力网络的多模态情感分析方法 被引量:1
10
作者 王旭阳 王常瑞 +1 位作者 张金峰 邢梦怡 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期84-93,共10页
挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映... 挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映射到局部特征空间;其次,构造模态内自注意力和模态间交叉注意力特征;然后,设计一种跨模态交叉注意力融合模块实现不同模态内和模态间特征的深度融合,提升多模态特征表达的可靠性;最后,通过Softmax获得最终预测结果。在2个开源数据集CMU-MOSI和CMU-MSOEI上进行测试,本文模型在七分类任务上获得45.9%和54.1%的准确率,相比当前MCGMF模型,提升了0.66%和2.46%,综合性能提升显著。 展开更多
关键词 情感分析 多模态 跨模态交叉注意力 自注意力 局部和全局特征
下载PDF
U型卷积网络在乳腺医学图像分割中的研究综述 被引量:1
11
作者 蒲秋梅 殷帅 +1 位作者 李正茂 赵丽娜 《计算机科学与探索》 CSCD 北大核心 2024年第6期1383-1403,共21页
U-Net及其变体模型在乳腺医学图像分割领域展现了卓越的性能,U-Net采用全卷积网络(FCN)结构进行语义分割,U-Net对称结构的高度灵活性和适应性可以通过调整网络深度、引入新的模块来适应不同的图像分割任务和挑战,这种创新结构对后续网... U-Net及其变体模型在乳腺医学图像分割领域展现了卓越的性能,U-Net采用全卷积网络(FCN)结构进行语义分割,U-Net对称结构的高度灵活性和适应性可以通过调整网络深度、引入新的模块来适应不同的图像分割任务和挑战,这种创新结构对后续网络设计产生了深远影响。深入探讨了基于U型卷积网络在乳腺医学图像分割中的应用,并对近年来用于乳腺医学图像分割的U型卷积网络进行了分类与归纳。针对U-Net网络结构改进的乳腺医学图像分割技术进行了如下总结。阐述了目前广泛使用的乳腺医学图像数据集及评价指标,陈述了常用的数据增强方法;详细介绍了U-Net模型的网络结构以及用于乳腺医学图像的传统分割方法;对用于乳腺医学图像分割方法的U型网络结构按照残差结构、多尺度特征、膨胀机制、注意力机制、跳跃连接机制、结合Transformer等方面改进进行归纳总结。讨论了当下乳腺医学图像分割所遇到的问题与挑战,对未来的研究走向做出了展望。 展开更多
关键词 医学图像分割 U型卷积网络 深度学习 乳腺疾病 图像处理
下载PDF
虹膜与眼周深度特征融合网络模型 被引量:1
12
作者 雷松泽 李永刚 +1 位作者 单奥奎 张文娟 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第3期240-248,共9页
虹膜识别的识别率虽然很高,但单模态识别时受环境、欺骗攻击等影响,并且在远距离或移动端、较少约束等场景下,识别率会大大下降。利用位置与虹膜相近并且被研究证明鉴别性很强的眼周生物特征,将虹膜和眼周进行双模态融合识别是较好的思... 虹膜识别的识别率虽然很高,但单模态识别时受环境、欺骗攻击等影响,并且在远距离或移动端、较少约束等场景下,识别率会大大下降。利用位置与虹膜相近并且被研究证明鉴别性很强的眼周生物特征,将虹膜和眼周进行双模态融合识别是较好的思路。为实现精确自适应的融合识别,本文提出新颖的虹膜与眼周深度特征融合网络模型(MultipleFusionNet)。根据特征通道注意力和通道分组注意力的思想,设计自动权值生成网络,通过网络学习自动获得虹膜与眼周的权值。权值与卷积神经网络(CNN)生成的虹膜与眼周深度特征加权计算,可实现两个模态的深度特征动态精确融合,从而提高识别准确率。本文网络模型中融合部分可作为通用的深度特征融合模块使用,该模块可灵活地嵌入在任何CNN主干网络中,轻便且易于实现。在中国科学院公开的远距离虹膜库图像库CASIA-Iris-Distance和近距离光照变化虹膜图像库CASIA-Iris-Lamp上进行了实验验证,多种方法的对比实验和距离度量实验结果显示:本文的特征融合模型准确率最高为99.56%,采用余弦距离度量的等误率(EER)最低为0.002 7,优于单模态方法和相关的特征融合方法;计算复杂度方面,参数量和计算量比单模型的两倍少1.5%,计算量只比基准融合方法高1%,这表明该融合模型计算复杂度低,具有良好的性能。 展开更多
关键词 双模态融合 虹膜识别 眼周识别 深度特征融合
下载PDF
基于改进SegNet的鸡只检测算法 被引量:1
13
作者 吉训生 孙贝贝 夏圣奎 《计算机工程与设计》 北大核心 2024年第1期102-109,共8页
为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器... 为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器间,丰富解码器信息。利用多层深度可分离卷积替代标准卷积,提取深层次语义信息,减少计算量提高实时性。将鸡群图像分割结果交并比与阈值对比判别鸡只状态。实验结果表明,改进的AT-SegNet较原算法的检测精度提高了25.17%,能够在复杂鸡群环境中准确、高效地发现死亡鸡只。 展开更多
关键词 深度学习 鸡只检测 语义分割 编码解码结构 注意力机制 软池化 深度可分离卷积
下载PDF
基于ATO-YOLO的小目标检测算法 被引量:1
14
作者 苏佳 秦一畅 +1 位作者 贾泽 王静 《计算机工程与应用》 CSCD 北大核心 2024年第6期68-77,共10页
小目标检测在计算机视觉领域具有重要意义,但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题,提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力,提出一种结... 小目标检测在计算机视觉领域具有重要意义,但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题,提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力,提出一种结合注意力机制的自适应特征提取模块(adaptive feature extraction,AFE),通过动态调整权重分配突出关键目标的特征表示,提高目标检测任务在不同场景下的准确性和鲁棒性。设计一种三重特征融合机制(triple feature fusion,TFF),能够在不同尺度下充分利用多尺度信息,将多个尺度的特征图融合,以获取更全面的目标特征,提升对小目标的检测效果。引入一种输出重构模块(output reconstruction,ORS),通过去除大目标检测层并增加小目标检测层,实现精确定位和识别小目标,并且相对于原模型复杂度更低,检测速度更快。实验结果表明,ATO-YOLO算法在VisDrone数据集上的mAP@0.5达到了38.2%,较原YOLOv5提升了6.1个百分点,且FPS较改进前提升了4.4%,能够快速准确地对小目标进行检测。 展开更多
关键词 YOLOv5 多尺度特征融合 自适应特征提取 小目标检测
下载PDF
基于特征优化的Census立体匹配方法 被引量:1
15
作者 游达章 周宏耀 张业鹏 《湖北工业大学学报》 2024年第1期41-45,共5页
针对传统Census立体匹配算法在弱纹理和边缘区域匹配精度较差的问题,提出一种基于特征信息优化的代价计算方法,在窗口中融入更多的差异信息以获得更精确的像素视差值。随后采用多方向路径独立的线扫描优化计算聚合代价以进一步提高匹配... 针对传统Census立体匹配算法在弱纹理和边缘区域匹配精度较差的问题,提出一种基于特征信息优化的代价计算方法,在窗口中融入更多的差异信息以获得更精确的像素视差值。随后采用多方向路径独立的线扫描优化计算聚合代价以进一步提高匹配精度。为获得更好的遮挡区域匹配效果,提出一种基于差异填充的视差优化方法,对遮挡像素进行识别和视差填充。为提高算法的效率,提出一种基于降采样策略的算法运行模式,通过缩小视差搜索范围以减少硬件负荷。最后以五组标准图像为输入进行改进Census算法性能检验,结果显示,平均误匹配率为6.12%,较改进前降低了2.45%,算法效率平均提升17.7%。 展开更多
关键词 立体匹配 CENSUS 特征信息优化 降采样策略
下载PDF
基于改进VGG16的自编码器视频异常检测算法 被引量:1
16
作者 杨大为 刘志权 《计算机技术与发展》 2024年第4期95-100,共6页
在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像... 在使用自编码器结构的神经网络处理视频异常检测任务时,U-Net风格的自编码器由于编码器层数深度过浅,导致在面对复杂的数据集时,不能充分抽取更多有用的特征信息。同时,在训练模型时使用MSE(均方误差),仅考虑了预测帧与真实帧之间的像素级相似性,对于复杂场景,像素级相似性可能无法准确判断预测帧与真实帧之间的相似性。针对以上问题,对基于U-Net风格的自编码器进行改进,提出了一种使用改进的VGG16作为编码器的视频异常检测算法,同时在均方误差的基础上添加结构相似性(SSIM)损失函数。改进的VGG16去掉了全连接层,并加入了残差连接防止特征退化,添加SSIM在计算像素级相似性的同时计算图像的亮度、对比度和结构等方面的相似性来优化网络。实验结果表明,改进后的算法,在Ped2数据集上检测效果达到95.91%,在Avenue数据集上检测效果达到84.89%,与改进前的方法相比分别提高了0.80%和0.19%,验证了所提方法的有效性。 展开更多
关键词 自编码器 U-Net 特征提取 VGG16 残差连接 结构相似性
下载PDF
基于空间注意力机制的Mask R-CNN致密储层岩石薄片图像鉴定
17
作者 李春生 刘涛 +7 位作者 刘宗堡 张可佳 刘芳 刘晓文 田梦晴 白玉磊 尹靖淞 卢羿州 《中国石油大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期24-32,共9页
针对陆相致密储层岩石薄片鉴定识别难、制片成本高、时间消耗长和人为主观强等难题,选取鄂尔多斯盆地临兴区块上古生界和松辽盆地三肇凹陷扶余油层为靶区,提出一种基于深度学习的致密油储层岩石薄片人工智能鉴定方法,引入图像预处理技... 针对陆相致密储层岩石薄片鉴定识别难、制片成本高、时间消耗长和人为主观强等难题,选取鄂尔多斯盆地临兴区块上古生界和松辽盆地三肇凹陷扶余油层为靶区,提出一种基于深度学习的致密油储层岩石薄片人工智能鉴定方法,引入图像预处理技术去除岩石薄片图像噪声并统一图像像素大小,构建空间几何增广机制,基于空间注意力机制改进Mask R-CNN算法,并将上述方法应用于实例靶区进行有效性验证。结果表明:图像预处理技术能够在保障图像特征的前提下,有效提高图像质量,减少噪声干扰;空间几何图像增广机制能够在在一定程度上增加可用样本的数量;基于空间注意力机制的Mask R-CNN算法可以同时完成复杂岩石薄片成分的分割与智能识别工作,分割精度在不同数据集情况下的平均精度为89.2%,整体识别准确率为93%,适用于致密油储层岩石薄片特征鉴定。 展开更多
关键词 致密储层 岩石薄片 深度学习 Mask R-CNN算法 分割与识别
下载PDF
基于改进残差和注意力的CT肺癌辅助诊断
18
作者 谷宇 迟靖千 +3 位作者 张宝华 杨立东 李建军 唐思源 《传感器与微系统》 CSCD 北大核心 2024年第9期30-34,共5页
为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和... 为了提高结节检测和肺癌诊断的性能,本文提出一种改进的卷积神经网络(CNN)模型用于这2个步骤的结节特征提取。该模型以一种改进U-Net网络作为基础网络,并引入了ResNeXt模块和注意力机制,在保持模型复杂度的同时,提高网络学习多种形状和大小的结节特征的能力。实验结果表明:该模型在DSB数据集上表现良好,结节检测的灵敏度和特异性分别达到了99.15%和99.99%,肺癌诊断的准确率和AUC值分别达到了80.43%和0.86。可见,本文方法对于多种多样的结节特征具有高度敏感性,具有一定的临床价值。 展开更多
关键词 肺结节辅助检测 肺癌辅助诊断 CT图像 卷积神经网络 ResNeXt模块 注意力机制
下载PDF
智能行车记录仪图像去雾系统的FPGA设计
19
作者 黄鹤 胡凯益 +3 位作者 杨澜 王浩 高涛 王会峰 《上海交通大学学报》 EI CAS CSCD 北大核心 2024年第4期565-578,共14页
雾霾天气下,交通道路能见度低,导致所采集到的视频画面退化、图像信息模糊,同时考虑传统系统处理实时性不高等问题,基于ZYNQ平台设计了一种图像去雾系统,并应用于智能行车记录仪系统中.首先,针对传统暗通道去雾算法在天空区域存在失真... 雾霾天气下,交通道路能见度低,导致所采集到的视频画面退化、图像信息模糊,同时考虑传统系统处理实时性不高等问题,基于ZYNQ平台设计了一种图像去雾系统,并应用于智能行车记录仪系统中.首先,针对传统暗通道去雾算法在天空区域存在失真等问题,提出了一种分割天空区域的策略来修正图像复原参数;然后,针对计算全局大气光值时,需对整幅图像的像素排序消耗大量资源的问题,利用现场可编程门阵列(FPGA)并行运算的优势,提出一种帧迭代方法优化求取大气光值,同时优化了引导滤波的硬件设计;最后,将双路高清多媒体接口(HDMI)资源中,一路作为视频输入,另一路作为视频处理输出,搭建实时交通图像视频处理试验平台.试验结果表明,系统针对雾霾天气下的交通视频具有较好的去雾效果,尤其是可以解决天空区域去雾的失真问题.在对分辨率为1280像素×720像素的交通视频去雾时,可以达到30帧/s的处理速度,满足实时性要求. 展开更多
关键词 交通视频 图像去雾 ZYNQ平台 实时处理
下载PDF
高阶深度可分离无人机图像小目标检测算法 被引量:1
20
作者 郭伟 王珠颖 金海波 《计算机系统应用》 2024年第5期144-153,共10页
当前无人机图像中存在小目标数量众多、背景复杂的特点,目标检测中易造成漏检误检率较高的问题,针对这些问题,提出一种高阶深度可分离无人机图像小目标检测算法.首先,结合CSPNet结构与ConvMixer网络,深度可分离卷积核,获取梯度结合信息... 当前无人机图像中存在小目标数量众多、背景复杂的特点,目标检测中易造成漏检误检率较高的问题,针对这些问题,提出一种高阶深度可分离无人机图像小目标检测算法.首先,结合CSPNet结构与ConvMixer网络,深度可分离卷积核,获取梯度结合信息,并引入递归门控卷积C3模块,提升模型的高阶空间交互能力,增强网络对小目标的敏感度;其次,检测头采用两个头部进行解耦,分别输出特征图分类和位置信息,加快模型收敛速度;最后,使用边框损失函数EIoU,提高检测框精准度.在VisDrone2019数据集上的实验结果表明,该模型检测精度达到了35.1%,模型漏检率和误检率有明显下降,能够有效地应用于无人机图像小目标检测任务.在DOTA 1.0数据集和HRSID数据集上进行模型泛化能力测试,实验结果表明,该模型具有良好的鲁棒性. 展开更多
关键词 小目标检测 递归门控卷积 解耦头 无人机图像 YOLOv5
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部