期刊文献+
共找到140,356篇文章
< 1 2 250 >
每页显示 20 50 100
基于5G多接入边缘计算的云化PLC系统架构设计与应用 被引量:3
1
作者 冯毅雄 杨晨 +5 位作者 胡炳涛 赖颢善 石莹 宋光敏 汪勇 谭建荣 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第1期33-46,共14页
随着工业控制系统对柔性化、扁平化的要求不断提升,以PLC为构建基础的传统工业控制网络在大规模接入、算力提升和部署灵活性方面均受到限制.针对这些问题,融合5G网络和边缘计算技术,设计了基于5G多接入边缘计算的云化PLC系统架构,阐述... 随着工业控制系统对柔性化、扁平化的要求不断提升,以PLC为构建基础的传统工业控制网络在大规模接入、算力提升和部署灵活性方面均受到限制.针对这些问题,融合5G网络和边缘计算技术,设计了基于5G多接入边缘计算的云化PLC系统架构,阐述了该架构的运行机制和所涉及的关键技术;在此基础上,进行PLC系统的云化部署和调试,实现了工业现场、企业数据中心、5G网络和边缘网络的集成;最后,通过在某汽车制造公司产线改造过程中的应用,验证了所提架构的有效性. 展开更多
关键词 5G 边缘计算 云化PLC(可编程逻辑控制器) 架构设计
下载PDF
基于CRV-YOLO的苹果中心花和边花识别方法 被引量:2
2
作者 司永胜 孔德浩 +2 位作者 王克俭 刘丽星 杨欣 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期278-286,共9页
苹果树疏花是果园生产管理中的重要环节。准确高效地识别苹果中心花和边花,是研发智能疏花机器人的前提。针对苹果疏花作业中的实际需求,提出了一种基于CRV-YOLO的苹果中心花和边花识别方法。本文基于YOLO v5s模型进行了如下改进:将C-Co... 苹果树疏花是果园生产管理中的重要环节。准确高效地识别苹果中心花和边花,是研发智能疏花机器人的前提。针对苹果疏花作业中的实际需求,提出了一种基于CRV-YOLO的苹果中心花和边花识别方法。本文基于YOLO v5s模型进行了如下改进:将C-CoTCSP结构融入Backbone,更好地学习上下文信息并提高了模型特征提取能力,提高了模型对外形相似和位置关系不明显的中心花和边花的检测性能。在Backbone中添加改进RFB结构,扩大特征提取感受野并对分支贡献度进行加权,更好地利用了不同尺度特征。采用VariFocal Loss损失函数,提高了模型对遮挡等场景下难识别样本检测能力。在3个品种1837幅图像数据集上进行了实验,结果表明,CRV-YOLO的精确率、召回率和平均精度均值分别为95.6%、92.9%和96.9%,与原模型相比,分别提高3.7、4.3、3.9个百分点,模型受光照变化和苹果品种影响较小。与Faster R-CNN、SSD、YOLOX、YOLO v7模型相比,CRV-YOLO的精确率、平均精度均值、模型内存占用量和复杂度性能最优,召回率接近最优。研究成果可为苹果智能疏花提供技术支持。 展开更多
关键词 苹果花识别 YOLO v5s 上下文信息 中心花 边花
下载PDF
用于多通道单分子定位的高精度图像配准方法 被引量:1
3
作者 林丹樱 龚振权 +3 位作者 黄黎琳 聂梦娇 于斌 屈军乐 《物理学报》 SCIE EI CAS CSCD 北大核心 2024年第6期374-385,共12页
单分子定位技术可以绕过光学系统的衍射限制,在生物样品的单粒子追踪和超分辨显微成像中得到了广泛应用.多通道单分子定位采用多个成像通道,可以实现对不同目标的同时追踪或多色超分辨成像,也可以提升单粒子追踪的轴向深度或实现更高的... 单分子定位技术可以绕过光学系统的衍射限制,在生物样品的单粒子追踪和超分辨显微成像中得到了广泛应用.多通道单分子定位采用多个成像通道,可以实现对不同目标的同时追踪或多色超分辨成像,也可以提升单粒子追踪的轴向深度或实现更高的定位精度和密度.但各通道图像间的差异会影响协同定位或定量分析,因此图像配准是其图像数据预处理的关键环节;且由于单分子定位精度高,其对多通道图像配准精度的要求也很高.现有技术一般采用基于控制点的配准方法,且多采用复杂而精密的方式来获取基准物网格图像用于定位得到控制点对,以实现高精度图像配准,对样品或实验设备要求高,难以直接推广.为此,本文基于局部非线性变换和误匹配点剔除,发展了一种可以直接采用随机分布荧光珠样品作为基准物的高精度图像配准方法,通过在特征匹配和变换模型参数估计的过程中对控制点进行监测和迭代筛选,以剔除因单分子定位不准确或精度差而导致未精确匹配的控制点对,从而消除以随机分布荧光珠样品作为基准物时对于控制点准确获取和精确匹配所带来的不良影响,同时采用基于局部加权平均的二阶多项式拟合进行变换模型参数估计,以更好地适用于不同通道间存在局部非线性形变的情形.结果表明,采用该方法只需要3次迭代,就可以将未准确定位和精确匹配的控制点对找到并剔除,从而实现更准确的变换模型参数估计,将配准精度提高一个数量级,在图像局部非线性形变情况严重的正交像散双通道单分子定位成像系统中实现了约6 nm的配准精度. 展开更多
关键词 单分子定位 多通道成像 图像配准 误匹配点剔除
下载PDF
数字图像多功能水印综述 被引量:1
4
作者 赵蕾 桂小林 +1 位作者 邵屹杨 戴慧珺 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期195-222,共28页
数字图像多功能水印技术通过将多种类型的水印嵌入到同一图像,以实现2种及以上的图像保护功能(版权保护、内容认证、篡改恢复等).当前,数字图像多功能水印算法仍面临着性能和应用场景等方面的挑战.为促进图像多功能水印的进一步发展,首... 数字图像多功能水印技术通过将多种类型的水印嵌入到同一图像,以实现2种及以上的图像保护功能(版权保护、内容认证、篡改恢复等).当前,数字图像多功能水印算法仍面临着性能和应用场景等方面的挑战.为促进图像多功能水印的进一步发展,首先系统地梳理了数字图像水印技术,包括其系统特性、常见分类、关键技术与成果,以及其可实现的功能与应用场景;在此基础上,对近10年来不同类别的多功能水印嵌入模型(融合水印嵌入、零水印嵌入、水印串行嵌入、水印并行嵌入)的相关工作进行归纳与分析;最后,总结了当前数字图像多功能水印技术的不足,展望了后续研究与发展趋势.综合分析发现,多水印的嵌入难免对水印综合性能造成损失,且多功能水印在真实应用场景中的效果仍待改善.人工智能等新技术在数字图像多功能水印中的应用有望提升算法性能. 展开更多
关键词 数字图像水印 多功能水印 版权保护 内容认证 篡改恢复
下载PDF
基于双节点-双边图神经网络的茶叶病害分类方法 被引量:1
5
作者 张艳 车迅 +2 位作者 汪芃 汪玉凤 胡根生 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期252-262,共11页
传统茶叶病害分类主要依赖人工方法,此类方法费工费时,同时茶叶病害样本较少使得现有的机器学习方法的模型训练不充分,病害分类准确率不够高。针对茶炭疽病、茶黑煤病、茶饼病和茶白星病4类病害,提出一种基于双节点-双边图神经网络的茶... 传统茶叶病害分类主要依赖人工方法,此类方法费工费时,同时茶叶病害样本较少使得现有的机器学习方法的模型训练不充分,病害分类准确率不够高。针对茶炭疽病、茶黑煤病、茶饼病和茶白星病4类病害,提出一种基于双节点-双边图神经网络的茶叶病害分类方法。首先通过两分支卷积神经网络提取RGB茶叶病害特征和灰度茶叶病害特征,两分支均采用ResNet12作为骨干网络,参数独立不共享,两类特征作为图神经网络的两个子节点,以获得不同域样本所包含的病害信息;其次构建相对度量边和相似性边两类边,从而强化节点对相邻节点所含病害特征的聚合能力。最后,经过双节点特征和双边特征更新模块,实现双节点和双边交替更新,提高边特征对节点距离度量的准确性,从而实现训练样本较少条件下对茶叶病害的准确分类。本文方法和小样本学习方法进行了对比实验,结果表明,本文方法获得更高的准确率,在miniImageNet和PlantVillage数据集上5way-1shot的准确率分别达到69.30%和88.42%,5way-5shot准确率分别为82.48%和93.04%。同时在茶叶数据集TeaD-5上5way-1shot和5way-5shot准确率分别达到84.74%和86.34%。 展开更多
关键词 茶叶 病害分类 图神经网络 双节点 相对度量边 相似性边
下载PDF
基于改进YOLOv5l的轻量化鸭蛋裂纹检测算法 被引量:1
6
作者 殷建军 康俊琪 肖德琴 《农业工程学报》 EI CAS CSCD 北大核心 2024年第5期216-223,共8页
鸭蛋裂纹检测技术对于禽蛋加工工厂实现智能化蛋品检测、分级具有重要意义。该研究针对鸭蛋裂纹检测流程复杂、计算量大、模型尺寸大等问题,提出了一种基于改进YOLOv5l(you only look once version5 large)的轻量裂纹检测算法,通过在黑... 鸭蛋裂纹检测技术对于禽蛋加工工厂实现智能化蛋品检测、分级具有重要意义。该研究针对鸭蛋裂纹检测流程复杂、计算量大、模型尺寸大等问题,提出了一种基于改进YOLOv5l(you only look once version5 large)的轻量裂纹检测算法,通过在黑暗条件下使用LED灯照射鸭蛋,根据裂纹蛋壳与完好蛋壳透光性不同产生的图像差异进行检测。通过在YOLOv5中引入Ghost_conv模块,大大减少了模型的浮点计算量和参数量,并在模型的骨干网络中加入ECA(efficient channel attention)注意力机制以及使用多尺度特征融合方法 BIFPN(bi-directional feature pyramid network),增加模型对有效信息的关注度,以提高算法检测精度。同时使用CIoU与α-IoU损失函数融合后替代YOLOv5原始GIoU函数加速回归预测。利用自建的鸭蛋裂纹数据集验证改进后模型的性能,结果表明,本研究提出的改进YOLOv5l网络模型检测精准率为93.8%,与原始YOLOv5l模型相比,检测精度提高了6.3个百分点,参数量和浮点计算量分别减少了30.6%、39.4%。检测帧速率为28.954帧/s,较原始YOLOv5l模型仅下降3.824帧/s。与其他的目标检测常用网络SSD(single shot multibox detector)、YOLOv4、Faster-RCNN(faster region convolutional neural networks)相比,精度分别提高了13.1、12.5、8.2个百分点。本研究提出的方法能够在低硬件资源条件下进行高精度检测,可为实际场景应用提供解决方案和技术支持。 展开更多
关键词 计算机视觉 图像识别 裂纹检测 注意力机制 鸭蛋
下载PDF
基于改进FasterNet的轻量化小麦生育期识别模型 被引量:1
7
作者 时雷 雷镜楷 +4 位作者 王健 杨程凯 刘志浩 席磊 熊蜀峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第5期226-234,共9页
针对现阶段小麦生育期信息获取需依靠人工观测,效率低、主观性强等问题,本文构建包含冬小麦越冬期、返青期、拔节期和抽穗期4个生育期共计4599幅小麦图像数据集,并提出一种基于FasterNet的轻量化网络模型FSST(Fast shuffle swin transfo... 针对现阶段小麦生育期信息获取需依靠人工观测,效率低、主观性强等问题,本文构建包含冬小麦越冬期、返青期、拔节期和抽穗期4个生育期共计4599幅小麦图像数据集,并提出一种基于FasterNet的轻量化网络模型FSST(Fast shuffle swin transformer),开展4个关键生育期的智能识别。在FasterNet部分卷积的基础上引入Channel Shuffle机制,以提升模型计算速度。引入Swin Transformer模块来实现特征融合和自注意力机制,用来提升小麦关键生育期识别准确率。调整整个模型结构,进一步降低网络复杂度,并在训练中引入Lion优化器,加快网络模型收敛速度。在自建的数据集上进行模型验证,结果表明,FSST模型参数量仅为1.22×10^(7),平均识别准确率、F1值和浮点运算量分别为97.22%、78.54%和3.9×10^(8),与FasterNet、GhostNet、ShuffleNetV2和MobileNetV34种模型相比,FSST模型识别精度更高,运算速度更快,并且识别时间分别减少84.04%、73.74%、72.22%和77.01%。提出的FSST模型能够较好地进行小麦关键生育期识别,并且具有识别快速精准和轻量化的特点,可以为大田作物生长实时监测提供信息技术支持。 展开更多
关键词 小麦 生育期识别 FasterNet 轻量化 Lion优化器
下载PDF
基于旋转等变卷积的航拍红外图像目标识别算法 被引量:1
8
作者 肖锋 卢浩 +4 位作者 张文娟 黄姝娟 焦雨林 卢昭廷 李照山 《兵工学报》 EI CAS CSCD 北大核心 2024年第8期2817-2827,共11页
为提高传统无人机红外目标识别算法对输入图像的旋转鲁棒性,提出一种具有旋转等变性的红外图像目标识别算法。参照可见光三通道结构,将红外图像扩张为三通道以丰富输入图像的细节及边缘信息;以旋转等变卷积为基础,设计并实现能够高度保... 为提高传统无人机红外目标识别算法对输入图像的旋转鲁棒性,提出一种具有旋转等变性的红外图像目标识别算法。参照可见光三通道结构,将红外图像扩张为三通道以丰富输入图像的细节及边缘信息;以旋转等变卷积为基础,设计并实现能够高度保留图像旋转特征的标准旋转等变卷积模块和旋转残差模块,使得所设计模型FC-YOLOv5对图像及图像中目标旋转具有鲁棒性;加入压缩和激励注意力机制自适应地学习到每个通道的重要性,并且根据任务的需要加权调整特征图中的通道贡献,提取重要的特征信息并抑制不重要的特征信息。在航拍行人车辆数据集和海上船舶数据集上验证模型的性能,以基准模型YOLOv5s及常见轻量级目标识别任务所用模型YOLOv8s、NanoDet作为对照组模型。实验结果表明,所提算法的平均精度均值相较于基准模型能够提升2%~4%,且当输入图像具有不同角度的旋转时,能够比对照组模型识别到更多旋转目标,且识别错误更少。 展开更多
关键词 低空航拍 红外图像 多角度目标识别 旋转等变卷积
下载PDF
基于特征融合Transformer的EfficientNet v2网络对马铃薯叶片病害的识别 被引量:1
9
作者 孙剑明 毕振宇 牛连丁 《江苏农业科学》 北大核心 2024年第8期166-176,共11页
马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络... 马铃薯叶片病害是影响马铃薯质量和产量的主要因素,为了能够快速准确地识别马铃薯叶片病害并采取对应的防控和救治措施,本研究提出一种新型马铃薯叶片病害识别方法。该方法利用EfficientNet v2网络提取图像特征,通过4个不同尺度的网络层进行金字塔融合,从而捕捉不同尺度下的图像细节和上下文信息,并在金字塔融合中的每个下采样环节都添加1个CBAM注意力机制模块,且每个CBAM模块后都加入Vision Transformer的Encoder模块进行特征增强,帮助提升所提取特征的丰富性和抽象能力,最后使用softmax进行分类。研究提出的模型识别准确率达到98.26%,相比改进之前提升3.47百分点,且其loss收敛更快,宏平均值与加权平均值都有明显提升。消融试验表明,该模型在各项指标上的表现最优,超过基线模型和融合模型,大幅提高图像分类识别任务模型的性能表现。该方法可有效提高病害区域的识别能力和检测准确率,且能在强干扰的环境下做到高精度识别,具有良好的鲁棒性和适应性,同时能解决病害识别中泛化能力弱、精度低、计算效率低等问题。 展开更多
关键词 农业 马铃薯叶片病害 图像识别 卷积神经网络 特征融合 Transformer模型
下载PDF
基于改进YOLOX与多级数据关联的行人多目标跟踪算法研究 被引量:2
10
作者 韩锟 彭晶莹 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第1期94-105,共12页
目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的... 目标跟踪是计算机视觉领域的基本问题,行人多目标跟踪在智能监控、智慧交通等多个领域有着广泛的应用前景。然而实际跟踪场景中存在频繁遮挡、尺度变化等情况,给多目标跟踪算法带来了极大的挑战。为了进一步提升跟踪精度,在DeepSORT的基础上,提出一种基于改进YOLOX与多级数据关联的行人多目标跟踪算法。对于检测器,为了增强网络的特征表达能力,提高检测精度,在YOLOX骨架网络与颈部网络分别引入ECA通道注意力模块与ASFF自适应特征融合模块。对于身份识别特征,为了减少数据关联步骤的错误匹配数量,提高跟踪效率,使用轻量的OSNet重识别网络与NSA卡尔曼滤波获取目标特征。对于数据关联,为了减少身份切换次数,避免目标丢失,将检测与跟踪都进行分类处理,使用不同的相似性计算方法,实现基于检测置信度与轨迹状态的多级数据关联。实验结果表明:与改进前YOLOX与DeepSORT简单结合的算法相比,在YOLOX中引入ECA模块与ASFF模块使误检数量大幅降低,使用YOLOX-s模型时降幅可达17%;结合OSNet模型与NSA卡尔曼滤波的特征提取方法能提高跟踪稳定性,IDF1指标提高0.77%,IDSW减少947;基于检测置信度与轨迹状态的多级数据关联算法可以明显改善跟踪性能,MOTA指标提升3.36%。算法最终在MOT17与MOT20测试集上的MOTA达80.4%与77.7%,IDF1达78.4%与76.7%。提出的行人多目标跟踪方法相较于其他先进算法在跟踪精度与跟踪速度上达到更好的平衡,可为工业上在线行人多目标跟踪应用提供参考。 展开更多
关键词 多目标跟踪 目标检测 注意力机制 数据关联 计算机视觉
下载PDF
基于改进YOLOv8的嵌入式道路裂缝检测算法 被引量:2
11
作者 耿焕同 刘振宇 +2 位作者 蒋骏 范子辰 李嘉兴 《计算机应用》 CSCD 北大核心 2024年第5期1613-1618,共6页
在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替... 在边缘端设备部署YOLOv8L模型进行道路裂缝检测可以实现较高的精度,但难以保证实时检测。针对此问题,提出一种可部署到边缘计算设备Jetson AGX Xavier上的基于改进YOLOv8模型的目标检测算法。首先,利用部分卷积设计Faster Block结构以替换YOLOv8 C2f模块中的Bottleneck结构,并将改进后的C2f模块记为C2f-Faster;其次,在YOLOv8主干网络中的每个C2f-Faster模块之后接一个SE(Squeeze-and-Excitation)通道注意力层,进一步提高检测的精度。在开源道路损害数据集RDD20(Road Damage Detection 20)上的实验结果表明:所提方法的平均F1得分为0.573,每秒检测帧数(FPS)为47,模型大小为55.5MB,相较于GRDDC2020(GlobalRoadDamageDetection Challenge 2020)的SOTA(State-Of-The-Art)模型,F1得分提高了0.8个百分点,FPS提高了291.7%,模型大小减小了41.8%,实现了在边缘设备上对道路裂缝实时且准确的检测。 展开更多
关键词 YOLOv8 目标检测 轻量化 注意力机制 道路裂缝
下载PDF
基于VGG-UNet的食用菌菌丝体表型参数自动测量方法 被引量:1
12
作者 陈燕 陆嘉豪 +1 位作者 胡小春 祁亮亮 《农业机械学报》 EI CAS CSCD 北大核心 2024年第1期233-240,共8页
食用菌菌丝体表型特征是食用菌种质资源评价和科学育种的重要依据。针对传统阈值分割方法提取菌丝体区域易受到光照不均、菌丝体不规则生长和培养皿内产生代谢物等因素干扰的问题,制作食用菌菌丝体图像数据集,并提出一种基于深度学习的... 食用菌菌丝体表型特征是食用菌种质资源评价和科学育种的重要依据。针对传统阈值分割方法提取菌丝体区域易受到光照不均、菌丝体不规则生长和培养皿内产生代谢物等因素干扰的问题,制作食用菌菌丝体图像数据集,并提出一种基于深度学习的食用菌菌丝体表型参数自动测量方法。将U-Net网络编码器部分替换为VGG16的前13个卷积层,引入预训练权重,构建适用于菌丝体分割的VGG-UNet模型。测试集上对比实验表明,该模型的平均交并比达到98.18%,比原始U-Net模型高0.93个百分点。经该模型获取菌丝体分割图像后,利用OpenCV相关函数计算菌丝体的半径、周长、面积、覆盖度、圆整度这5个表型参数。将人工测量方法与本文方法进行线性回归分析,得出菌丝体半径、周长、面积和覆盖度的决定系数分别为0.979 5、0.991 5、0.975 0和0.975 0,均方根误差分别为2.20 mm、4.73 mm、176.74 mm^(2)和3.16%。经测试,本文方法能准确地完成食用菌菌丝体表型参数自动测量任务,为食用菌表型分析研究提供理论基础。 展开更多
关键词 食用菌菌丝体 表型参数 深度学习 图像处理 语义分割 VGG-UNet
下载PDF
一种道路裂缝检测的变尺度VS-UNet模型 被引量:1
13
作者 赵志宏 何朋 郝子晔 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期63-72,共10页
为解决目前现有的图像分割算法存在检测精度低、对裂缝检测缺乏针对性等问题,采用多尺度特征融合方法,提出一种扩展LG Block模块Extend-LG Block,其由多个并行不同膨胀率的空洞卷积组成.通过参数可调节分支数量和空洞卷积膨胀率,从而改... 为解决目前现有的图像分割算法存在检测精度低、对裂缝检测缺乏针对性等问题,采用多尺度特征融合方法,提出一种扩展LG Block模块Extend-LG Block,其由多个并行不同膨胀率的空洞卷积组成.通过参数可调节分支数量和空洞卷积膨胀率,从而改变其感受野大小,进而提取和融合不同尺度的裂缝特征.对比在深层使用多尺度特征融合模块的网络以及使用固定尺度结构进行多尺度特征融合的网络的优劣,提出一种变尺度结构的UNet模型VS-UNet,使用多个不同参数的Extend-LG Block替换UNet网络中的基本卷积块.该结构在网络浅层进行多尺度特征融合,多尺度特征融合模块提取的尺度随网络层加深逐渐减少.此结构在加强图像的细节特征提取能力的同时保持原有的抽象特征提取能力,还可避免网络参数的增加.在DeepCrack数据集以及CFD数据集上进行实验验证,结果表明,相较于其他两种结构和方法,提出的变尺度结构的网络在有更高检测精度的同时,在可视化实验对比上对各种大小的裂缝有更好的分割效果.最后与其他图像分割算法进行对比,各项指标与UNet相比均有一定程度提升,证明了网络改进的有效性.研究结果可为进一步提升道路裂缝检测效果提供参考. 展开更多
关键词 U-Net 多尺度 裂缝检测 空洞卷积 深度学习
下载PDF
双路径合作的原型矫正小样本分类模型 被引量:1
14
作者 吕佳 曾梦瑶 董保森 《计算机科学与探索》 CSCD 北大核心 2024年第3期693-706,共14页
基于度量的元学习在学习过程中存在由于稀缺数据分布导致习得的先验知识不足、从样本中提取到的单一视图特征易受弱相关或无关特征的干扰以及因分类造成的代表性特征偏差的问题。针对这些问题,提出了一种双路径合作的原型矫正小样本分... 基于度量的元学习在学习过程中存在由于稀缺数据分布导致习得的先验知识不足、从样本中提取到的单一视图特征易受弱相关或无关特征的干扰以及因分类造成的代表性特征偏差的问题。针对这些问题,提出了一种双路径合作的原型矫正小样本分类模型。首先,通过双路径合作模块从多视图角度自适应地突出关键特征和弱化弱相关特征,充分利用特征信息获得先验知识来提升特征的表达能力;其次,通过基于查询集样本特征信息的原型矫正分类策略来解决类内原型的偏差问题;最后,通过损失函数反向更新模型参数,模型分类准确率得以提升。在五个公开的数据集上进行了5-way 1-shot和5-way 5-shot对比实验,较基准模型而言,在miniImageNet数据集上,准确率提升了5.57个百分点和3.90个百分点;在tieredImageNet数据集上,准确率提升了5.68个百分点和3.93个百分点;在CUB数据集上,准确率提升了6.93个百分点和3.13个百分点;在CIFAR-FS数据集上,准确率提升了8.03个百分点和1.65个百分点;在FC-100数据集上,准确率提升了4.25个百分点和4.89个百分点。实验结果表明,提出的双路径合作的原型矫正小样本分类模型能在小样本学习领域有良好的性能,且模型中的模块可迁移到其他模型中使用。 展开更多
关键词 小样本学习 元学习 度量学习 自适应双路径合作学习 原型矫正
下载PDF
基于跨模态交叉注意力网络的多模态情感分析方法 被引量:1
15
作者 王旭阳 王常瑞 +1 位作者 张金峰 邢梦怡 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第2期84-93,共10页
挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映... 挖掘不同模态内信息和模态间信息有助于提升多模态情感分析的性能,本文为此提出一种基于跨模态交叉注意力网络的多模态情感分析方法。首先,利用VGG-16网络将多模态数据映射到全局特征空间;同时,利用Swin Transformer网络将多模态数据映射到局部特征空间;其次,构造模态内自注意力和模态间交叉注意力特征;然后,设计一种跨模态交叉注意力融合模块实现不同模态内和模态间特征的深度融合,提升多模态特征表达的可靠性;最后,通过Softmax获得最终预测结果。在2个开源数据集CMU-MOSI和CMU-MSOEI上进行测试,本文模型在七分类任务上获得45.9%和54.1%的准确率,相比当前MCGMF模型,提升了0.66%和2.46%,综合性能提升显著。 展开更多
关键词 情感分析 多模态 跨模态交叉注意力 自注意力 局部和全局特征
下载PDF
U型卷积网络在乳腺医学图像分割中的研究综述 被引量:1
16
作者 蒲秋梅 殷帅 +1 位作者 李正茂 赵丽娜 《计算机科学与探索》 CSCD 北大核心 2024年第6期1383-1403,共21页
U-Net及其变体模型在乳腺医学图像分割领域展现了卓越的性能,U-Net采用全卷积网络(FCN)结构进行语义分割,U-Net对称结构的高度灵活性和适应性可以通过调整网络深度、引入新的模块来适应不同的图像分割任务和挑战,这种创新结构对后续网... U-Net及其变体模型在乳腺医学图像分割领域展现了卓越的性能,U-Net采用全卷积网络(FCN)结构进行语义分割,U-Net对称结构的高度灵活性和适应性可以通过调整网络深度、引入新的模块来适应不同的图像分割任务和挑战,这种创新结构对后续网络设计产生了深远影响。深入探讨了基于U型卷积网络在乳腺医学图像分割中的应用,并对近年来用于乳腺医学图像分割的U型卷积网络进行了分类与归纳。针对U-Net网络结构改进的乳腺医学图像分割技术进行了如下总结。阐述了目前广泛使用的乳腺医学图像数据集及评价指标,陈述了常用的数据增强方法;详细介绍了U-Net模型的网络结构以及用于乳腺医学图像的传统分割方法;对用于乳腺医学图像分割方法的U型网络结构按照残差结构、多尺度特征、膨胀机制、注意力机制、跳跃连接机制、结合Transformer等方面改进进行归纳总结。讨论了当下乳腺医学图像分割所遇到的问题与挑战,对未来的研究走向做出了展望。 展开更多
关键词 医学图像分割 U型卷积网络 深度学习 乳腺疾病 图像处理
下载PDF
虹膜与眼周深度特征融合网络模型 被引量:1
17
作者 雷松泽 李永刚 +1 位作者 单奥奎 张文娟 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第3期240-248,共9页
虹膜识别的识别率虽然很高,但单模态识别时受环境、欺骗攻击等影响,并且在远距离或移动端、较少约束等场景下,识别率会大大下降。利用位置与虹膜相近并且被研究证明鉴别性很强的眼周生物特征,将虹膜和眼周进行双模态融合识别是较好的思... 虹膜识别的识别率虽然很高,但单模态识别时受环境、欺骗攻击等影响,并且在远距离或移动端、较少约束等场景下,识别率会大大下降。利用位置与虹膜相近并且被研究证明鉴别性很强的眼周生物特征,将虹膜和眼周进行双模态融合识别是较好的思路。为实现精确自适应的融合识别,本文提出新颖的虹膜与眼周深度特征融合网络模型(MultipleFusionNet)。根据特征通道注意力和通道分组注意力的思想,设计自动权值生成网络,通过网络学习自动获得虹膜与眼周的权值。权值与卷积神经网络(CNN)生成的虹膜与眼周深度特征加权计算,可实现两个模态的深度特征动态精确融合,从而提高识别准确率。本文网络模型中融合部分可作为通用的深度特征融合模块使用,该模块可灵活地嵌入在任何CNN主干网络中,轻便且易于实现。在中国科学院公开的远距离虹膜库图像库CASIA-Iris-Distance和近距离光照变化虹膜图像库CASIA-Iris-Lamp上进行了实验验证,多种方法的对比实验和距离度量实验结果显示:本文的特征融合模型准确率最高为99.56%,采用余弦距离度量的等误率(EER)最低为0.002 7,优于单模态方法和相关的特征融合方法;计算复杂度方面,参数量和计算量比单模型的两倍少1.5%,计算量只比基准融合方法高1%,这表明该融合模型计算复杂度低,具有良好的性能。 展开更多
关键词 双模态融合 虹膜识别 眼周识别 深度特征融合
下载PDF
基于改进SegNet的鸡只检测算法 被引量:1
18
作者 吉训生 孙贝贝 夏圣奎 《计算机工程与设计》 北大核心 2024年第1期102-109,共8页
为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器... 为实现智能化检测出鸡场中死亡鸡只,提出一种基于改进语义分割模型AT-SegNet的鸡只检测算法。基于对称编码解码结构SegNet,利用空洞卷积在解码前聚合不同感受野的上下文信息,设计一种三尺度注意力级联融合模块,以并联方式嵌入编、解码器间,丰富解码器信息。利用多层深度可分离卷积替代标准卷积,提取深层次语义信息,减少计算量提高实时性。将鸡群图像分割结果交并比与阈值对比判别鸡只状态。实验结果表明,改进的AT-SegNet较原算法的检测精度提高了25.17%,能够在复杂鸡群环境中准确、高效地发现死亡鸡只。 展开更多
关键词 深度学习 鸡只检测 语义分割 编码解码结构 注意力机制 软池化 深度可分离卷积
下载PDF
基于ATO-YOLO的小目标检测算法 被引量:1
19
作者 苏佳 秦一畅 +1 位作者 贾泽 王静 《计算机工程与应用》 CSCD 北大核心 2024年第6期68-77,共10页
小目标检测在计算机视觉领域具有重要意义,但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题,提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力,提出一种结... 小目标检测在计算机视觉领域具有重要意义,但现有方法在应对小目标的尺度变化、目标密集和无规则排列等挑战时经常出现漏检和误检的问题。为解决这些问题,提出基于改进YOLOv5算法的ATO-YOLO。为提升检测模型的特征表达能力,提出一种结合注意力机制的自适应特征提取模块(adaptive feature extraction,AFE),通过动态调整权重分配突出关键目标的特征表示,提高目标检测任务在不同场景下的准确性和鲁棒性。设计一种三重特征融合机制(triple feature fusion,TFF),能够在不同尺度下充分利用多尺度信息,将多个尺度的特征图融合,以获取更全面的目标特征,提升对小目标的检测效果。引入一种输出重构模块(output reconstruction,ORS),通过去除大目标检测层并增加小目标检测层,实现精确定位和识别小目标,并且相对于原模型复杂度更低,检测速度更快。实验结果表明,ATO-YOLO算法在VisDrone数据集上的mAP@0.5达到了38.2%,较原YOLOv5提升了6.1个百分点,且FPS较改进前提升了4.4%,能够快速准确地对小目标进行检测。 展开更多
关键词 YOLOv5 多尺度特征融合 自适应特征提取 小目标检测
下载PDF
基于特征优化的Census立体匹配方法 被引量:1
20
作者 游达章 周宏耀 张业鹏 《湖北工业大学学报》 2024年第1期41-45,共5页
针对传统Census立体匹配算法在弱纹理和边缘区域匹配精度较差的问题,提出一种基于特征信息优化的代价计算方法,在窗口中融入更多的差异信息以获得更精确的像素视差值。随后采用多方向路径独立的线扫描优化计算聚合代价以进一步提高匹配... 针对传统Census立体匹配算法在弱纹理和边缘区域匹配精度较差的问题,提出一种基于特征信息优化的代价计算方法,在窗口中融入更多的差异信息以获得更精确的像素视差值。随后采用多方向路径独立的线扫描优化计算聚合代价以进一步提高匹配精度。为获得更好的遮挡区域匹配效果,提出一种基于差异填充的视差优化方法,对遮挡像素进行识别和视差填充。为提高算法的效率,提出一种基于降采样策略的算法运行模式,通过缩小视差搜索范围以减少硬件负荷。最后以五组标准图像为输入进行改进Census算法性能检验,结果显示,平均误匹配率为6.12%,较改进前降低了2.45%,算法效率平均提升17.7%。 展开更多
关键词 立体匹配 CENSUS 特征信息优化 降采样策略
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部