期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
Visualization for Explanation of Deep Learning-Based Defect Detection Model Using Class Activation Map 被引量:1
1
作者 Hyunkyu Shin Yonghan Ahn +3 位作者 Mihwa Song Heungbae Gil Jungsik Choi Sanghyo Lee 《Computers, Materials & Continua》 SCIE EI 2023年第6期4753-4766,共14页
Recently,convolutional neural network(CNN)-based visual inspec-tion has been developed to detect defects on building surfaces automatically.The CNN model demonstrates remarkable accuracy in image data analysis;however... Recently,convolutional neural network(CNN)-based visual inspec-tion has been developed to detect defects on building surfaces automatically.The CNN model demonstrates remarkable accuracy in image data analysis;however,the predicted results have uncertainty in providing accurate informa-tion to users because of the“black box”problem in the deep learning model.Therefore,this study proposes a visual explanation method to overcome the uncertainty limitation of CNN-based defect identification.The visual repre-sentative gradient-weights class activation mapping(Grad-CAM)method is adopted to provide visually explainable information.A visualizing evaluation index is proposed to quantitatively analyze visual representations;this index reflects a rough estimate of the concordance rate between the visualized heat map and intended defects.In addition,an ablation study,adopting three-branch combinations with the VGG16,is implemented to identify perfor-mance variations by visualizing predicted results.Experiments reveal that the proposed model,combined with hybrid pooling,batch normalization,and multi-attention modules,achieves the best performance with an accuracy of 97.77%,corresponding to an improvement of 2.49%compared with the baseline model.Consequently,this study demonstrates that reliable results from an automatic defect classification model can be provided to an inspector through the visual representation of the predicted results using CNN models. 展开更多
关键词 Defect detection VISUALIZATION class activation map deep learning EXPLANATION visualizing evaluation index
下载PDF
Continuous gradient fusion class activation mapping: segmentation of laser-induced damage on large-aperture optics in dark-field images 被引量:1
2
作者 Yueyue Han Yingyan Huang +5 位作者 Hangcheng Dong Fengdong Chen Fa Zeng Zhitao Peng Qihua Zhu Guodong Liu 《High Power Laser Science and Engineering》 SCIE CAS CSCD 2024年第1期30-41,共12页
Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supe... Segmenting dark-field images of laser-induced damage on large-aperture optics in high-power laser facilities is challenged by complicated damage morphology, uneven illumination and stray light interference. Fully supervised semantic segmentation algorithms have achieved state-of-the-art performance but rely on a large number of pixel-level labels, which are time-consuming and labor-consuming to produce. LayerCAM, an advanced weakly supervised semantic segmentation algorithm, can generate pixel-accurate results using only image-level labels, but its scattered and partially underactivated class activation regions degrade segmentation performance. In this paper, we propose a weakly supervised semantic segmentation method, continuous gradient class activation mapping(CAM) and its nonlinear multiscale fusion(continuous gradient fusion CAM). The method redesigns backpropagating gradients and nonlinearly activates multiscale fused heatmaps to generate more fine-grained class activation maps with an appropriate activation degree for different damage site sizes. Experiments on our dataset show that the proposed method can achieve segmentation performance comparable to that of fully supervised algorithms. 展开更多
关键词 class activation maps laser-induced damage semantic segmentation weakly supervised learning
原文传递
Deep Stacked Ensemble Learning Model for COVID-19 Classification
3
作者 G.Madhu B.Lalith Bharadwaj +5 位作者 Rohit Boddeda Sai Vardhan K.Sandeep Kautish Khalid Alnowibet Adel F.Alrasheedi Ali Wagdy Mohamed 《Computers, Materials & Continua》 SCIE EI 2022年第3期5467-5486,共20页
COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is requ... COVID-19 is a growing problem worldwide with a high mortality rate.As a result,the World Health Organization(WHO)declared it a pandemic.In order to limit the spread of the disease,a fast and accurate diagnosis is required.A reverse transcript polymerase chain reaction(RT-PCR)test is often used to detect the disease.However,since this test is time-consuming,a chest computed tomography(CT)or plain chest X-ray(CXR)is sometimes indicated.The value of automated diagnosis is that it saves time and money by minimizing human effort.Three significant contributions are made by our research.Its initial purpose is to use the essential finetuning methodology to test the action and efficiency of a variety of vision models,ranging from Inception to Neural Architecture Search(NAS)networks.Second,by plotting class activationmaps(CAMs)for individual networks and assessing classification efficiency with AUC-ROC curves,the behavior of these models is visually analyzed.Finally,stacked ensembles techniques were used to provide greater generalization by combining finetuned models with six ensemble neural networks.Using stacked ensembles,the generalization of the models improved.Furthermore,the ensemble model created by combining all of the finetuned networks obtained a state-of-the-art COVID-19 accuracy detection score of 99.17%.The precision and recall rates were 99.99%and 89.79%,respectively,highlighting the robustness of stacked ensembles.The proposed ensemble approach performed well in the classification of the COVID-19 lesions on CXR according to the experimental results. 展开更多
关键词 COVID-19 classification class activation maps(CAMs)visualization finetuning stacked ensembles automated diagnosis deep learning
下载PDF
多视野精细分析下的弱监督目标定位算法
4
作者 张英俊 贾聪聪 谢斌红 《计算机工程与设计》 北大核心 2024年第6期1750-1756,共7页
针对多尺度目标定位精度较差,难以捕获完整目标边界的问题,设计一种多视野精细分析模块并融入通道与空间注意力机制抑制背景噪声的干扰,获取多尺度目标的高分辨率特征。利用随机特征选取模块获取特征图随机位置的组合,聚合多个位置图获... 针对多尺度目标定位精度较差,难以捕获完整目标边界的问题,设计一种多视野精细分析模块并融入通道与空间注意力机制抑制背景噪声的干扰,获取多尺度目标的高分辨率特征。利用随机特征选取模块获取特征图随机位置的组合,聚合多个位置图获取最具辨别性的位置及其它位置的信息,融合浅层生成的类激活图与聚合类激活图获取细粒度位置信息,捕获完整的目标边界。与现有的弱监督定位方法相比,在解决多尺度目标定位效果差和局部最优问题上具有一定的优势。 展开更多
关键词 弱监督学习 目标定位 多尺度特征融合 注意力机制 全局平均池化 类激活图 正则化
下载PDF
基于深度学习算法联合Grad-CAM的宫腔镜子宫内膜病变诊断模型研究 被引量:1
5
作者 曹明亮 尹蜜 +9 位作者 王庆彬 朱汉峰 李星 张珺 毛林 穆雪峰 曹敏 马于涛 王健 张燕 《实用妇产科杂志》 CAS CSCD 北大核心 2024年第5期409-413,共5页
目的:探讨基于深度学习(DL)算法联合可视化技术梯度加权类激活热图(Grad-CAM)开发的宫腔镜子宫内膜病变诊断模型的有效性。方法:选择2021年6月1日至2022年12月31日在武汉大学人民医院妇科行宫腔镜检查的291例患者的303段宫腔镜视频(478... 目的:探讨基于深度学习(DL)算法联合可视化技术梯度加权类激活热图(Grad-CAM)开发的宫腔镜子宫内膜病变诊断模型的有效性。方法:选择2021年6月1日至2022年12月31日在武汉大学人民医院妇科行宫腔镜检查的291例患者的303段宫腔镜视频(4781张图像),采用权重采样的方法,将数据集划分为训练集(3703张)和测试集(1078张)。在对训练集用于模型学习与训练后,选择残差神经网络(ResNet18)和高效神经网络(EfficientNet-B0)两种模型架构对测试集分别采用五类和二类分类任务进行模型验证。以病理组织学为金标准,评估其诊断效能,从而选出最优模型,并将Grad-CAM层嵌入最优模型中,输出宫腔镜图像Grad-CAM。结果:①在五类分类任务中,EfficientNet-B0模型的准确度(93.23%)高于ResNet18模型(84.23%);EfficientNet-B0模型在诊断无不典型性子宫内膜增生、子宫内膜息肉、子宫内膜癌、子宫内膜非典型增生、黏膜下肌瘤5种疾病的曲线下面积(AUC)均稍高于ResNet18模型,两者的AUC几乎都在0.980以上。②在准确度的二类分类任务中和对特异度的评估中,两种模型相似,均在93.00%以上,而EfficientNet-B0模型敏感度(91.14%)明显优于ResNet18模型(77.22%)。③EfficientNet-B0模型联合Grad-CAM算法可识别出图像中异常区域,取活检经病理检查证实,模型输出热力图中标记区域约95%为病灶区域。结论:EfficientNet-B0模型联合Grad-CAM研发的宫腔镜诊断模型具有较高的诊断准确度、敏感度和特异度,在诊断子宫内膜病变方面具有应用价值。 展开更多
关键词 宫腔镜 子宫内膜癌 卷积神经网络 梯度加权类激活热图 深度学习
下载PDF
面向SAR图像目标分类的CNN模型可视化方法 被引量:2
6
作者 李妙歌 陈渤 +1 位作者 王东升 刘宏伟 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期359-373,共15页
卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在... 卷积神经网络(CNN)在合成孔径雷达(SAR)图像目标分类任务中应用广泛。由于网络工作机理不透明,CNN模型难以满足高可靠性实际应用的要求。类激活映射方法常用于可视化CNN模型的决策区域,但现有方法主要基于通道级或空间级类激活权重,且在SAR图像数据集上的应用仍处于起步阶段。基于此,该文从神经元特征提取能力和网络决策依据两个层面出发,提出了一种面向SAR图像的CNN模型可视化方法。首先,基于神经元的激活值,对神经元在其感受野范围内的目标结构学习能力进行可视化,然后提出一种通道-空间混合的类激活映射方法,通过对SAR图像中的重要区域进行定位,为模型的决策过程提供依据。实验结果表明,该方法给出了模型在不同设置下的可解释性分析,有效拓展了卷积神经网络在SAR图像上的可视化应用。 展开更多
关键词 合成孔径雷达 可视化分析 卷积神经网络 类激活映射 神经元
下载PDF
基于MobileNetV3网络的龋病和根尖周炎根尖片的诊断 被引量:1
7
作者 王凯欣 刘丰 +1 位作者 曾令芳 刘超 《口腔疾病防治》 2024年第1期43-49,共7页
目的研究深度学习技术智能诊断龋齿和根尖周炎的效果,初步探讨深度学习在口腔疾病诊断中的应用价值。方法以2298张包含健康牙齿、龋病、根尖周炎的根尖片数据集为研究对象,随机划分为1573张训练集图像,233张验证集图像以及492张测试集... 目的研究深度学习技术智能诊断龋齿和根尖周炎的效果,初步探讨深度学习在口腔疾病诊断中的应用价值。方法以2298张包含健康牙齿、龋病、根尖周炎的根尖片数据集为研究对象,随机划分为1573张训练集图像,233张验证集图像以及492张测试集图像。通过多种神经网络对比验证,选择性能较好的MobileNetV3网络模型应用于牙病诊断,并通过调整网络超参数优化模型。采用精确率、准确率、召回率和F1分数评估模型识别龋齿和根尖周炎的能力,并使用类激活热力图对网络模型性能进行可视化分析。结果基于MobileNetV3网络模型的牙齿病变检测算法对健康牙齿、龋病和根尖周炎进行分类的精确率、召回率和准确率分别为99.42%、99.73%和99.60%,F1分数为99.57%,达到了较为理想的智能诊断效果。可视化类激活热力图也显示出网络模型能够较为准确地提取牙科病变的特征。结论基于MobileNetV3网络模型的牙齿病变检测算法能够排除图像质量和人为因素的干扰,具有较高的诊断准确率,可满足口腔医学教学和临床应用需求。 展开更多
关键词 牙科病变 龋病 根尖周炎 根尖片 智能诊断 图像处理 深度学习 MobileNetV3网络 类激活图 可视化分析
下载PDF
多级对比学习下的弱监督高分遥感影像城市固废堆场提取
8
作者 王继成 郭安嵋 +3 位作者 慎利 蓝天 徐柱 李志林 《测绘学报》 EI CSCD 北大核心 2024年第6期1212-1223,共12页
城市固体废物是城市化进程中的重要污染源,对城市生态环境和公共健康造成了巨大危害。高分影像固废堆场智能解译是实现自动排查,提升监测效率的核心和关键技术。基于深度学习的固废堆场自动提取方法严重依赖于获取成本高、制作难度大的... 城市固体废物是城市化进程中的重要污染源,对城市生态环境和公共健康造成了巨大危害。高分影像固废堆场智能解译是实现自动排查,提升监测效率的核心和关键技术。基于深度学习的固废堆场自动提取方法严重依赖于获取成本高、制作难度大的高质量像素级标注。为此,本文提出使用更易获取的影像级标注,利用影像自监督学习实现像素级固废堆场提取。围绕固废堆场的影像特征,本文方法在尺度对比约束下综合像素、影像两个层次的对比学习方法,对固废堆场的类别激活图细化和完善,并基于此生成高质量的固废堆场伪像素级标注,用于训练固废堆场提取模型。试验结果表明,本文方法在固废堆场提取的F 1值和IoU分数方面分别达到了71.58%和55.74%,显著优于所有对比方法。这说明利用多级对比学习的弱监督方法能够获得更加完整且准确的类别激活图,从而取得更高的固废堆场提取精度。 展开更多
关键词 城市固废堆场 高分辨率遥感影像 对比学习 弱监督信息提取 类别激活图
下载PDF
基于逐层增量分解的深度网络神经元相关性解释方法
9
作者 陈艺元 李建威 +1 位作者 邵文泽 孙玉宝 《自动化学报》 EI CAS CSCD 北大核心 2024年第10期2049-2062,共14页
神经网络的黑箱特性严重阻碍了人们关于网络决策的直观分析与理解.尽管文献报道了多种基于神经元贡献度分配的决策解释方法,但是现有方法的解释一致性难以保证,鲁棒性更是有待改进.本文从神经元相关性概念入手,提出一种基于逐层增量分... 神经网络的黑箱特性严重阻碍了人们关于网络决策的直观分析与理解.尽管文献报道了多种基于神经元贡献度分配的决策解释方法,但是现有方法的解释一致性难以保证,鲁棒性更是有待改进.本文从神经元相关性概念入手,提出一种基于逐层增量分解的神经网络解释新方法LID-Taylor(Layer-wise increment decomposition),且在此基础上先后引入针对顶层神经元相关性的对比提升策略,以及针对所有层神经元相关性的非线性提升策略,最后利用交叉组合策略得到最终方法SIG-LID-IG,实现了决策归因性能的鲁棒跃升.通过热力图对现有工作与提出方法的决策归因性能做了定性定量评估.结果显示,SIG-LID-IG在神经元的正、负相关性的决策归因合理性上均可媲美甚至优于现有工作.SIG-LID-IG在多尺度热力图下同样取得了精确性更高、鲁棒性更强的决策归因. 展开更多
关键词 神经网络 可解释性 决策相关性 逐层相关性传播 类激活图 积分梯度
下载PDF
基于掩码一致性机制的弱监督图像语义分割研究
10
作者 胡捷 赵海涛 《应用光学》 CAS 北大核心 2024年第4期741-750,共10页
语义分割是一项广泛应用于无人驾驶、缺陷检测等场景的计算机视觉技术,但像素级的细粒度标注需要极大的标注成本,所以如何利用易获取的图像级标签进行弱监督语义分割是长期以来的研究重点。相较于仅依靠类激活映射图(class activation m... 语义分割是一项广泛应用于无人驾驶、缺陷检测等场景的计算机视觉技术,但像素级的细粒度标注需要极大的标注成本,所以如何利用易获取的图像级标签进行弱监督语义分割是长期以来的研究重点。相较于仅依靠类激活映射图(class activation maps,CAM)实现像素级分割,提出掩码一致性机制(masked consistency mechanism,MCM)来提供额外的监督信号,以此来缩小全监督和弱监督之间的差距。在全监督语义分割中,网络对图像每一块的掩码预测都具有一致的像素级分割监督,因此在ViT(vision transformer)中屏蔽掉一部分图像块,并要求仅依靠保留的图像块生成的类激活映射图与依靠完整图像生成的类激活映射图一致,以此为网络训练提供额外的自监督信号。在PASCAL VOC 2012和MS COCO上进行的实验表明,本文方法在使用相同监督水平的情况下优于最先进的方法。 展开更多
关键词 语义分割 弱监督 掩码一致性 类激活映射图
下载PDF
DRSTN:深度残差软阈值化网络
11
作者 曹岩 朱真峰 《计算机科学》 CSCD 北大核心 2024年第S01期81-87,共7页
在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间... 在采用深度残差等神经网络模型解决图像分类任务时,特征提取过程损失的一些重要特征会影响模型的分类性能。神经网络“端到端”的学习模式带来的黑盒问题,也会限制其在诸多领域的应用和发展。另外,神经网络模型往往需要较长的训练时间。为了提高深度残差网络模型的分类效果和训练效率,引入了模型迁移方法和软阈值化方法,提出了DRSTN(Deep Residual Soft Thresholding Network)网络,并对此网络结构进行微调,生成了不同版本的DRSTN网络。DRSTN网络的性能得益于3个方面的有机整合:1)通过梯度加权类激活映射(Gradients-weighted Class Activation Mapping,Grad-CAM)方法对网络的特征提取进行可视化,根据可视化结果挑选进一步优化的模型;2)基于模型迁移,研究人员不必全新地搭建模型,可以直接在已有的模型上进行优化,能够节省大量训练时间;3)软阈值化作为非线性变换层嵌入到深度残差网络体系结构中,以消除样本中不相关的特征。实验结果表明,在相同训练条件下,DRSTN_KS(3*3)_RB(2:2:2)网络在CIFAR-10数据集上的分类精度相比SKNet-18,ResNet18和ConvNeXt_tiny网络分别提高了15.5%,8.8%和10.9%;该网络也具有一定的泛化性,在MNIST和Fashion MNIST数据集上能够达到快速的迁移效果,分类精度分别达到99.06%和93.15%。 展开更多
关键词 迁移学习 残差网络 梯度加权类激活映射 软阈值化方法 图像分类
下载PDF
基于深度学习的DRFM信号识别
12
作者 房津辉 宋宝军 朱明哲 《现代雷达》 CSCD 北大核心 2024年第3期54-58,共5页
针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处... 针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处理中无法有效区分回波信号和DRFM欺骗信号以及在雷达干扰识别中基于DRFM的欺骗干扰难以识别的问题。为了验证深度学习过程的可靠性,通过神经网络可解释性算法对训练结果进行了验证和分析。实验结果表明,相比于识别原始信号,识别DRFM信号神经网络需要用到更多的特征,神经网络判断准确率达到了96.33%,识别精度良好。 展开更多
关键词 干扰识别 时频变换 梯度加权类激活映射 导向反向传播 深度学习
下载PDF
面向智能航道巡检的水面目标检测算法
13
作者 任思羽 黄琦麟 +2 位作者 左良栋 吴瑞 蔡枫林 《重庆大学学报》 CAS CSCD 北大核心 2024年第4期114-126,共13页
为解决多场景复杂内河背景下水面目标检测存在环境噪声大、水面目标分布情况繁杂、特征微小模糊等问题,提出一种融合多尺度特征和注意力机制,增强类激活映射的水面目标检测算法,称UltraWS水面目标检测算法。在典型检测网络上设计空间注... 为解决多场景复杂内河背景下水面目标检测存在环境噪声大、水面目标分布情况繁杂、特征微小模糊等问题,提出一种融合多尺度特征和注意力机制,增强类激活映射的水面目标检测算法,称UltraWS水面目标检测算法。在典型检测网络上设计空间注意力模块与多头策略,融合多尺度特征,提高对微小目标的检测能力。其次,提出UltraLU模块增强类激活映射,减小环境因素与分布因素对检测目标的影响。最后,设计对模型进行Tucker张量分解,实现模型轻量化,增强模型的可解释性与推理速度。实验结果表明,所提出的UltraWS算法提高了对背景噪声的抗干扰能力,更好捕捉微小目标,满足边缘化部署的检测速度和准确率均衡性需求。在WSODD数据集上,算法的mAP值取得了最高的84.5%,相较于其他主流方法存在较大提升。基于提出的算法建立航道安全巡检体系与评估方法,有利于推动内河智慧航运的发展。 展开更多
关键词 水面目标检测 注意力机制 类激活映射 张量分解
下载PDF
融合多层次决策信息的视觉解释方法
14
作者 杨传栋 钱立志 +2 位作者 孙子文 陈栋 凌冲 《计算机工程与应用》 CSCD 北大核心 2024年第3期246-254,共9页
视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果... 视觉解释方法是深度神经网络可解释领域的热门研究课题,但现有方法未能有效利用多层次决策信息导致视觉解释效果差。针对此问题,提出一种融合多层次决策信息的视觉解释方法。挖掘特征图中高细粒度局部层次的决策信息生成一组与决策结果相关性强的加权特征图,采用定序分组方式对其合并,获取一组低冗余度掩码;采取模糊边界和积分方法对掩码进行处理,基于全局层次的决策贡献并行计算分组掩码重要度分数,提高了算法对全局决策信息的敏感性和算法速度。通过消融实验确定了算法的最优参数组合,并在ImageNet数据集上与现有的先进视觉解释方法进行了定性和定量比较。实验结果表明:该方法通过结合多层次决策信息,在置信度测试和定位测试中取得了更好的视觉解释结果,且耗时达到68 ms。 展开更多
关键词 视觉解释 多层次信息 全局决策贡献 类激活映射(CAM) 积分方法
下载PDF
基于改进类激活映射的织物疵点检测
15
作者 李飞龙 李敏 +1 位作者 何儒汉 崔树芹 《计算机应用与软件》 北大核心 2024年第1期246-252,共7页
为实现弱监督条件下的织物疵点检测,提出一种基于改进类激活映射(Class activation mapping,CAM)的疵点检测方法。在卷积神经网络中加入SE模块,并将深层和浅层卷积层进行结合,以此提高网络的分类性能;为了提高疵点定位的准确性,将两种... 为实现弱监督条件下的织物疵点检测,提出一种基于改进类激活映射(Class activation mapping,CAM)的疵点检测方法。在卷积神经网络中加入SE模块,并将深层和浅层卷积层进行结合,以此提高网络的分类性能;为了提高疵点定位的准确性,将两种分辨率的类激活图进行融合来生成改进的类激活图。实验结果表明,该算法对无疵点、孔、污渍和纱疵四个类别织物图像的识别准确率达到了96.88%,并且在数据集只有图像级标注的情况下,实现了织物疵点的定位。 展开更多
关键词 疵点检测 弱监督 织物 类激活映射 卷积神经网络
下载PDF
基于弱监督学习的双分支结直肠病理图像腺体分割
16
作者 李子成 贾伟 +1 位作者 赵雪芬 高宏娟 《中国医学物理学杂志》 CSCD 2024年第9期1104-1114,共11页
现有弱监督分割方法难以获得结直肠病理图像的细粒度腺体特征,导致无法生成高质量伪标签的问题,影响腺体分割的效果。为了解决上述问题,提出一种基于弱监督学习的双分支结直肠病理图像腺体分割方法。首先,将patch级结直肠病理图像输入... 现有弱监督分割方法难以获得结直肠病理图像的细粒度腺体特征,导致无法生成高质量伪标签的问题,影响腺体分割的效果。为了解决上述问题,提出一种基于弱监督学习的双分支结直肠病理图像腺体分割方法。首先,将patch级结直肠病理图像输入到第一个分支网络中,通过特征交互模块和亲和度注意力融合模块实现patch级图像的局部和全局特征的交互和融合,并获得细粒度腺体特征。然后,将图像级结直肠病理图像输入到第二个分支网络中,利用局部类激活注意力模块定位腺体位置,并获得粗粒度类激活图。最后,通过细粒度腺体特征和粗粒度类激活图,得到高质量伪标签,并在分割网络中经过跨尺度连接空间感知模块,实现腺体分割。实验结果表明,将所提方法在GlaS和CRAG两个结直肠病理图像数据集中进行实验,与其他分割方法相比取得较好的分割效果,验证所提方法的有效性。 展开更多
关键词 弱监督学习 结直肠病理图像 腺体分割 伪标签 类激活图
下载PDF
面向SAR目标识别深度网络可理解的类激活映射方法
17
作者 崔宗勇 杨致远 +2 位作者 蒋阳 曹宗杰 杨建宇 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第2期428-442,共15页
随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一... 随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一种事后解释的方法,其只能静态展示当次识别过程中的显著性区域,无法动态展示当输入发生变化时显著性区域的变化规律。该文将扰动的思想引入类激活映射,提出了一种基于SAR背景杂波特性类激活映射方法(SCC-CAM),通过对输入图像引入同分布的全局扰动,逐步向SAR识别深度网络施加干扰,使得网络判决发生翻转,并在此刻计算网络神经元输出激活值的变化程度。该方法既能解决添加扰动可能带来的扰动传染问题,又能够动态观察和度量目标识别网络在识别过程中显著性区域的变化规律,从而增强深度网络的可理解性。在MSTAR数据集和OpenSARShip-1.0数据集上的试验表明,该文提出的算法具有更加精确的定位显著性区域的能力,相比于传统方法,在平均置信度下降率、置信度上升比例、信息量等评估指标上,所提算法具有更强的可理解性,能够作为通用的增强网络可理解性的方法。 展开更多
关键词 SAR目标识别 网络可理解性 SAR杂波特性 类激活映射 面积约束置信度下降率
下载PDF
面向掌纹掌静脉识别网络轻量化的非对称双模态融合方法
18
作者 林孙旗 徐家梦 +2 位作者 郑瑜杰 王翀 王军 《智能系统学报》 CSCD 北大核心 2024年第5期1190-1198,共9页
深度学习已在掌纹掌静脉领域广泛应用,但随着任务使用场景的不断微型化、终端化,现有的深度学习模型往往难以在算力匮乏、内存有限的边缘设备上顺利部署。本文基于知识蒸馏方法提出了轻量化的掌纹掌静脉识别网络。根据模态特征提取复杂... 深度学习已在掌纹掌静脉领域广泛应用,但随着任务使用场景的不断微型化、终端化,现有的深度学习模型往往难以在算力匮乏、内存有限的边缘设备上顺利部署。本文基于知识蒸馏方法提出了轻量化的掌纹掌静脉识别网络。根据模态特征提取复杂程度,为掌纹与掌静脉模态分别选用不同的网络深度。在常规知识蒸馏方法中引入新设计的模态特征损失函数,强化教师模型对各模态特征提取的指导作用。实验结果表明,该方法有效协调了模型大小与性能,为边缘计算环境下的生物特征识别技术提供了一种有效的解决方案。 展开更多
关键词 深度学习 生物特征识别 掌纹掌脉识别 多模态网络 知识蒸馏 模型压缩 卷积神经网络 类激活图
下载PDF
基于高分辨率类激活映射算法的弱监督目标实时检测
19
作者 孙辉 史玉龙 +2 位作者 张健一 王蕊 王羽玥 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第3期1051-1059,共9页
受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映... 受益于深度学习的发展,目标检测技术在各类视觉任务中得到广泛关注。然而,获取目标的边框标注需要高昂的时间和人工成本,阻碍了目标检测技术在实际场景中的应用。为此,该文在仅使用图像类别标签的基础上,提出一种基于高分辨率类激活映射算法的弱监督目标实时检测方法,降低网络对目标实例标注的依赖。该方法将目标检测细划分为弱监督目标定位和目标实时检测两个子任务。在弱监督定位任务中,该文利用对比层级相关性传播理论设计了一种新颖的高分辨率类激活映射算法(HR-CAM),用于获取高质量目标类激活图,生成目标伪检测标注框。在实时检测任务中,该文选取单镜头多盒检测器(SSD)作为目标检测网络,并基于类激活图设计目标感知损失函数(OA-Loss),与目标伪检测标注框共同监督SSD网络的训练过程,提高网络对目标的检测性能。实验结果表明,该文方法在CUB200和TJAB52数据集上实现了对目标准确高效的检测,验证了该文方法的有效性和优越性。 展开更多
关键词 弱监督定位 目标检测 对比层级相关性传播理论 类激活映射算法 目标感知损失函数
下载PDF
基于深度学习的液压支架支护质量评价方法研究
20
作者 王东亮 常亚军 陈文昱 《煤矿机械》 2024年第4期196-200,共5页
为提高液压支架支护质量评价方法的操作效率和精度,提出一种基于深度学习模型的评价方法,将液压支架支护质量的评价问题转化为图像分类问题。结果表明,该评价方法在计算复杂度降低1/2的条件下取得了出色的分类精度(82.74%)和准确的定位... 为提高液压支架支护质量评价方法的操作效率和精度,提出一种基于深度学习模型的评价方法,将液压支架支护质量的评价问题转化为图像分类问题。结果表明,该评价方法在计算复杂度降低1/2的条件下取得了出色的分类精度(82.74%)和准确的定位精度(81.67%),具有明显的计算优势。 展开更多
关键词 液压支架 支护质量 深度学习 评价方法 类激活映射
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部