期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于时频Grad-CAM的调制识别网络可解释分析
1
作者 梁先明 倪帆 +1 位作者 陈文洁 张家树 《西南交通大学学报》 EI CSCD 北大核心 2024年第5期1215-1224,共10页
针对时频深度学习调制识别方法存在可解释性差的问题,提出一种基于时频梯度加权类激活映射(GradCAM)的调制识别网络可解释框架.该框架通过时频Grad-CAM可视化深度模型中隐含层的关键特征,从视觉上解释网络隐含层提取的时频深度特征对于... 针对时频深度学习调制识别方法存在可解释性差的问题,提出一种基于时频梯度加权类激活映射(GradCAM)的调制识别网络可解释框架.该框架通过时频Grad-CAM可视化深度模型中隐含层的关键特征,从视觉上解释网络隐含层提取的时频深度特征对于正确与错误识别中的作用,揭示低信噪比环境下网络性能下降的内在机理,并通过量化和排序网络中每层不同卷积核的贡献值来判断网络的冗余程度.仿真实验结果验证了基于时频Grad-CAM的调制识别网络可解释性框架的有效性;可解释分析结果表明,在低信噪比环境下,网络特征提取区域有大量噪声存在,且本文所测试的调制识别网络冗余程度较为严重. 展开更多
关键词 可解释深度学习 梯度类加权激活映射 调制识别 时频分析
下载PDF
基于Grad-CAM可视化与特征识别率结合的草地贪夜蛾及近缘种成虫识别模型评估
2
作者 魏靖 季英超 《现代农业科技》 2024年第8期163-169,共7页
为提升草地贪夜蛾及其近缘种成虫识别模型的泛化能力,除识别准确率外,额外引入特征识别率对模型的泛化能力进行评估。将VGG-16-bn模型的全连接层以全局平均值池化层取代,并在模型训练阶段引入了Grad-CAM可视化结果进行训练指导,共构建了... 为提升草地贪夜蛾及其近缘种成虫识别模型的泛化能力,除识别准确率外,额外引入特征识别率对模型的泛化能力进行评估。将VGG-16-bn模型的全连接层以全局平均值池化层取代,并在模型训练阶段引入了Grad-CAM可视化结果进行训练指导,共构建了4种改进模型识别草地贪夜蛾及其近缘种成虫。结果表明,改进后的模型的识别准确率均在99.22%以上,VGG-16-bn-GAP模型参数内存需求仅为原始模型的10.98%。为评估模型的泛化能力,利用导向反向传播梯度值、Grad-CAM及Grad-CAM++对模型习得的特征进行可视化,并与专家进行人工识别的关键视觉特征进行比较。结果表明,改进的VGG-16-bn-GAP模型和VGG-16-bn-GAIN模型获得的草地贪夜蛾平均特征识别率比原始模型分别提高12.25%和13.42%。本文提出的以特征识别率评估模型泛化能力的方法,可为特征识别率和识别准确率的提升提供参考。 展开更多
关键词 草地贪夜蛾 grad-cam 全局平均值池化 泛化能力 特征识别率
下载PDF
A Grad-CAM and capsule network hybrid method for remote sensing image scene classification
3
作者 Zhan HE Chunju ZHANG +5 位作者 Shu WANG Jianwei HUANG Xiaoyun ZHENG Weijie JIANG Jiachen BO Yucheng YANG 《Frontiers of Earth Science》 SCIE CSCD 2024年第3期538-553,共16页
Remote sensing image scene classification and remote sensing technology applications are hot research topics.Although CNN-based models have reached high average accuracy,some classes are still misclassified,such as“f... Remote sensing image scene classification and remote sensing technology applications are hot research topics.Although CNN-based models have reached high average accuracy,some classes are still misclassified,such as“freeway,”“spare residential,”and“commercial_area.”These classes contain typical decisive features,spatial-relation features,and mixed decisive and spatial-relation features,which limit high-quality image scene classification.To address this issue,this paper proposes a Grad-CAM and capsule network hybrid method for image scene classification.The Grad-CAM and capsule network structures have the potential to recognize decisive features and spatial-relation features,respectively.By using a pre-trained model,hybrid structure,and structure adjustment,the proposed model can recognize both decisive and spatial-relation features.A group of experiments is designed on three popular data sets with increasing classification difficulties.In the most advanced experiment,92.67%average accuracy is achieved.Specifically,83%,75%,and 86%accuracies are obtained in the classes of“church,”“palace,”and“commercial_area,”respectively.This research demonstrates that the hybrid structure can effectively improve performance by considering both decisive and spatial-relation features.Therefore,Grad-CAM-CapsNet is a promising and powerful structure for image scene classification. 展开更多
关键词 image scene classification CNN grad-cam CapsNet DenseNet
原文传递
Grad-CAM:Understanding AI Models 被引量:1
4
作者 Shuihua Wang Yudong Zhang 《Computers, Materials & Continua》 SCIE EI 2023年第8期1321-1324,共4页
Artificial intelligence(AI)[1,2]allows computers to think and behave like humans,so it is now becoming more and more influential in almost every field[3].Hence,users in businesses,industries,hospitals[4],etc.,need to ... Artificial intelligence(AI)[1,2]allows computers to think and behave like humans,so it is now becoming more and more influential in almost every field[3].Hence,users in businesses,industries,hospitals[4],etc.,need to understand how these AI models work[5]and the potential impact of using them. 展开更多
关键词 Artificial intelligence grad-cam deep learning convolutional neural networks CLASSIFICATION LOCATION explainable
下载PDF
Cavitation recognition of axial piston pumps in noisy environment based on Grad-CAM visualization technique 被引量:1
5
作者 Qun Chao Xiaoliang Wei +2 位作者 Jianfeng Tao Chengliang Liu Yuanhang Wang 《CAAI Transactions on Intelligence Technology》 SCIE EI 2023年第1期206-218,共13页
The cavitation in axial piston pumps threatens the reliability and safety of the overall hydraulic system.Vibration signal can reflect the cavitation conditions in axial piston pumps and it has been combined with mach... The cavitation in axial piston pumps threatens the reliability and safety of the overall hydraulic system.Vibration signal can reflect the cavitation conditions in axial piston pumps and it has been combined with machine learning to detect the pump cavitation.However,the vibration signal usually contains noise in real working conditions,which raises concerns about accurate recognition of cavitation in noisy environment.This paper presents an intelligent method to recognise the cavitation in axial piston pumps in noisy environment.First,we train a convolutional neural network(CNN)using the spectrogram images transformed from raw vibration data under different cavitation conditions.Second,we employ the technique of gradient-weighted class activation mapping(Grad-CAM)to visualise class-discriminative regions in the spectrogram image.Finally,we propose a novel image processing method based on Grad-CAM heatmap to automatically remove entrained noise and enhance class features in the spectrogram image.The experimental results show that the proposed method greatly improves the diagnostic performance of the CNN model in noisy environments.The classification accuracy of cavitation conditions increases from 0.50 to 0.89 and from 0.80 to 0.92 at signal-to-noise ratios of 4 and 6 dB,respectively. 展开更多
关键词 axial piston pump cavitation recognition CNN grad-cam spectrogram image
下载PDF
基于EfficientNet和Grad-CAM++的冠状动脉造影体位识别方法的研究
6
作者 李劼慧 吴悔 +1 位作者 曾研 吴水才 《生命科学仪器》 2023年第6期82-88,共7页
目的:目前较少有研究采用人工智能的方法分析冠状动脉造影(CAG),本文拟通过深度学习EfficientNet和Grad-CAM++可视化技术,实现冠状动脉造影体位的自动识别。方法:将86639张造影图片划分为训练集、验证集和测试集,均包括8个临床常用的造... 目的:目前较少有研究采用人工智能的方法分析冠状动脉造影(CAG),本文拟通过深度学习EfficientNet和Grad-CAM++可视化技术,实现冠状动脉造影体位的自动识别。方法:将86639张造影图片划分为训练集、验证集和测试集,均包括8个临床常用的造影体位。以准确率作为主要观察指标,评价EfficientNet-B1在各个投照体位上的分类效果,并解释模型的学习过程。结果:EfficientNet-B1在验证集和测试集上8个造影体位的平均准确率分别为:90.73%,89.40%,均高于传统的VGG-16和ResNet-18。且Grad-CAM++显示,EfficientNet-B1能学习到最为全面的冠状动脉。结论:EfficientNet-B1可以有效分辨临床常用的造影体位,学习效果要好于其他网络模型。 展开更多
关键词 EfficientNet grad-cam++ 冠状动脉造影 体位识别
下载PDF
Efficient Grad-Cam-Based Model for COVID-19 Classification and Detection
7
作者 Saleh Albahli Ghulam Nabi Ahmad Hassan Yar 《Computer Systems Science & Engineering》 SCIE EI 2023年第3期2743-2757,共15页
Corona Virus(COVID-19)is a novel virus that crossed an animal-human barrier and emerged in Wuhan,China.Until now it has affected more than 119 million people.Detection of COVID-19 is a critical task and due to a large... Corona Virus(COVID-19)is a novel virus that crossed an animal-human barrier and emerged in Wuhan,China.Until now it has affected more than 119 million people.Detection of COVID-19 is a critical task and due to a large number of patients,a shortage of doctors has occurred for its detection.In this paper,a model has been suggested that not only detects the COVID-19 using X-ray and CT-Scan images but also shows the affected areas.Three classes have been defined;COVID-19,normal,and Pneumonia for X-ray images.For CT-Scan images,2 classes have been defined COVID-19 and non-COVID-19.For classi-fication purposes,pretrained models like ResNet50,VGG-16,and VGG19 have been used with some tuning.For detecting the affected areas Gradient-weighted Class Activation Mapping(GradCam)has been used.As the X-rays and ct images are taken at different intensities,so the contrast limited adaptive histogram equalization(CLAHE)has been applied to see the effect on the training of the models.As a result of these experiments,we achieved a maximum validation accuracy of 88.10%with a training accuracy of 88.48%for CT-Scan images using the ResNet50 model.While for X-ray images we achieved a maximum validation accuracy of 97.31%with a training accuracy of 95.64%using the VGG16 model. 展开更多
关键词 Convolutional neural networks(CNN) COVID-19 pre-trained models CLAHE grad-cam X-RAY data augmentation
下载PDF
融合Grad-CAM和卷积神经网络的COVID-19检测算法 被引量:15
8
作者 朱炳宇 刘朕 张景祥 《计算机科学与探索》 CSCD 北大核心 2022年第9期2108-2120,共13页
新型冠状病毒肺炎(COVID-19)检测中胸部X射线(CXR图像)和电子计算机断层扫描(CT)图像是两种主要技术手段,为医生诊断提供了重要依据。针对当前卷积神经网络(CNN)在医学放射性图像中检测COVID-19的准确率不高、算法复杂、无法标记特征区... 新型冠状病毒肺炎(COVID-19)检测中胸部X射线(CXR图像)和电子计算机断层扫描(CT)图像是两种主要技术手段,为医生诊断提供了重要依据。针对当前卷积神经网络(CNN)在医学放射性图像中检测COVID-19的准确率不高、算法复杂、无法标记特征区域的问题,提出了一种融合梯度加权类激活映射(GradCAM)颜色可视化和卷积神经网络的算法(GCCV-CNN),对COVID-19阳性患者、COVID-19阴性患者、普通肺炎患者以及正常人的肺部CXR图像和CT扫描图像进行快速分类。通过定位到CXR图像和CT扫描图像中CNN进行分类的关键区域,再综合深度学习算法得到更准确的检测结果。为验证GCCV-CNN算法的有效性,分别在3个COVID-19阳性患者数据集上进行实验,并与已有算法进行比较。结果表明该算法对COVID-19阳性患者的CXR图像和CT扫描图像分类性能优于“新冠网络”(COVID-Net)算法及迁移学习新冠网络(DeTraCNet)算法,准确率最高达98.06%,速度更快的同时还具有较好的鲁棒性。 展开更多
关键词 CXR图像 CT扫描图像 COVID-19 grad-cam 融合grad-cam颜色可视化和CNN的算法(GCCV-CNN)
下载PDF
基于Grad-CAM与KL损失的SSD目标检测算法 被引量:8
9
作者 侯庆山 邢进生 《电子学报》 EI CAS CSCD 北大核心 2020年第12期2409-2416,共8页
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细... 鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性. 展开更多
关键词 目标检测 可视化 类激活图 grad-cam SSD KL损失
下载PDF
基于Grad-CAM与B-CNN的细粒度图像分类方法研究 被引量:2
10
作者 邓绍伟 张伯泉 《计算机科学与应用》 2020年第5期841-850,共10页
细粒度图像具有类间差异小,类内差异大的特点。图像之间的差异主要存在于细微的局部区域,局部区域定位及其代表性特征提取成为细粒度图像分类的主要研究问题之一。本文基于Grad-CAM和双线性卷积神经网络B-CNN模型对细粒度图像分类方法... 细粒度图像具有类间差异小,类内差异大的特点。图像之间的差异主要存在于细微的局部区域,局部区域定位及其代表性特征提取成为细粒度图像分类的主要研究问题之一。本文基于Grad-CAM和双线性卷积神经网络B-CNN模型对细粒度图像分类方法进行研究,它利用Grad-CAM模型定位原图像中的显著区域,并裁剪出显著性区域图像作为双线性CNN的输入,融合全局和局部的特征,从而完成分类。在CUB-200-2011、Stanford Dogs和Stanford Cars三个数据集上的实验表明,相较于传统模型,该方法能够更加准确定位图像特征显著区域,具有更好的分类效果。 展开更多
关键词 细粒度图像分类 双线性卷积神经网络 grad-cam 显著性区域
下载PDF
基于Grad-CAM的Mask-FGSM对抗样本攻击 被引量:1
11
作者 余莉萍 《计算机应用与软件》 北大核心 2022年第7期195-200,共6页
深度学习缺乏可解释性,其容易受到对抗性样本的攻击。对此引入一种深度学习可解释性模型Grad-CAM(Gradient-weighted Class Activation Mapping),通过神经网络输入和输出之间的映射关系得到输入的热力图,结合FGSM(Fast Gradient Sign Me... 深度学习缺乏可解释性,其容易受到对抗性样本的攻击。对此引入一种深度学习可解释性模型Grad-CAM(Gradient-weighted Class Activation Mapping),通过神经网络输入和输出之间的映射关系得到输入的热力图,结合FGSM(Fast Gradient Sign Method)引入一种高效的算法来生成对抗样本。实验证明,该算法能够挖掘潜在的最佳攻击位置,仅需要修改3.821%的输入特征,就能有效生成使得神经网络错误分类的对抗样本,充分验证了该算法的高效性。 展开更多
关键词 深度学习 grad-cam FGSM 可解释性 对抗样本
下载PDF
基于Grad-CAM的探地雷达公路地下目标检测算法 被引量:16
12
作者 赵迪 叶盛波 周斌 《电子测量技术》 2020年第10期113-118,共6页
提出了一种基于卷积神经网络(convolutional neural networks, CNN)与梯度类激活热力图(gradient class activation map, Grad-CAM)的探地雷达公路地下目标检测方法。首先使用标记好的探地雷达图像数据集训练一个用于图像分类的CNN,然... 提出了一种基于卷积神经网络(convolutional neural networks, CNN)与梯度类激活热力图(gradient class activation map, Grad-CAM)的探地雷达公路地下目标检测方法。首先使用标记好的探地雷达图像数据集训练一个用于图像分类的CNN,然后基于训练完成的CNN对图像计算Grad-CAM激活图,将获得的激活图进行二值化,定位目标位置。构建了一个包括了5 000张探地雷达图像的数据集,并使用该数据集进行实验,其中4 000张图像用来训练模型,1 000张用来测试。在1 000张测试数据中,各个类别的召回率分别为:管线目标99.2%,地下空洞98.5%,无目标图像98.8%。目标定位结果与实际位置非常吻合。这些结果表明该方法能够有效的检测探地雷达图像中的目标。 展开更多
关键词 探地雷达 深度学习 目标检测 梯度类激活热力图
下载PDF
基于深度学习的带钢焊缝杯突试验结果分类
13
作者 张勇 《冶金动力》 2024年第1期82-85,共4页
为了实现对带钢焊缝月牙边杯突试验结果的自动分类,设计了一种基于轻量级网络的分类方法,首先采用数据增强扩充数据集样本数量,接着引入Grad-CAM算法对试验模型的中间层以热力图的形式进行可视化,最后结合MobileNet V3网络可视化中间层... 为了实现对带钢焊缝月牙边杯突试验结果的自动分类,设计了一种基于轻量级网络的分类方法,首先采用数据增强扩充数据集样本数量,接着引入Grad-CAM算法对试验模型的中间层以热力图的形式进行可视化,最后结合MobileNet V3网络可视化中间层设计了冻结特征提取部分的迁移学习训练方法,并对比测试了4种轻量型网络,试验结果表明基于迁移学习的MobileNet V3网络具有较好的缺陷分类能力。 展开更多
关键词 杯突试验 MobileNet V3 grad-cam 迁移学习
下载PDF
基于深度学习的DRFM信号识别
14
作者 房津辉 宋宝军 朱明哲 《现代雷达》 CSCD 北大核心 2024年第3期54-58,共5页
针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处... 针对数字射频存储器(DRFM)产生信号与源信号之间无法有效区分的问题,运用基于小波变换的同步压缩变换将时域的雷达信号转换为时频图,运用深度学习强大的图像识别能力,实现了基于深度学习的源信号与DRFM信号识别,从而解决了在雷达信号处理中无法有效区分回波信号和DRFM欺骗信号以及在雷达干扰识别中基于DRFM的欺骗干扰难以识别的问题。为了验证深度学习过程的可靠性,通过神经网络可解释性算法对训练结果进行了验证和分析。实验结果表明,相比于识别原始信号,识别DRFM信号神经网络需要用到更多的特征,神经网络判断准确率达到了96.33%,识别精度良好。 展开更多
关键词 干扰识别 时频变换 梯度加权类激活映射 导向反向传播 深度学习
下载PDF
数字预失真下的辐射源个体识别技术
15
作者 赵雅琴 谢丹 +3 位作者 吴龙文 丁沁宇 韩易伸 张拯华 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3331-3342,共12页
随着通信雷达技术的发展,针对辐射源发射机的非线性作用出现了预失真等新型技术,该类技术弱化了不同辐射源的个体特征进而恶化了辐射源个体识别性能.针对预失真下个体辐射源识别率降低的问题,本文提出了基于SincNet滤波器结构的辐射源... 随着通信雷达技术的发展,针对辐射源发射机的非线性作用出现了预失真等新型技术,该类技术弱化了不同辐射源的个体特征进而恶化了辐射源个体识别性能.针对预失真下个体辐射源识别率降低的问题,本文提出了基于SincNet滤波器结构的辐射源个体识别模型.本文采用Grad-CAM方法分析残差网络类激活区域,并提取共生矩阵特征用于辐射源识别,验证了预失真后信号局部特征的有效性.随后本文提出了基于SincNet滤波器结构的辐射源个体识别算法,在降低了计算量的同时,在低信噪比下具有更高的识别精度.本文通过实验验证了数字预失真对辐射源个体识别的消极作用,并且在实测数据上的结果表明所提方法的个体识别率在信噪比0 dB下达到94%,相比本文其他先进个体识别算法有明显的提升. 展开更多
关键词 辐射源个体识别 数字预失真 grad-cam SincNet
下载PDF
融合双线性网络和注意力机制的油橄榄品种识别 被引量:2
16
作者 朱学岩 陈锋军 +2 位作者 郑一力 李志强 张新伟 《农业工程学报》 EI CAS CSCD 北大核心 2023年第10期183-192,共10页
为解决自然条件下的油橄榄品种识别问题,该研究以油橄榄品种佛奥、莱星、皮削利和鄂植8号为研究对象,融合双线性网络与注意力机制,提出双线性注意力EfficientNet模型。针对不同品种油橄榄表型差异很小的特点,搭建双线性网络以充分提取... 为解决自然条件下的油橄榄品种识别问题,该研究以油橄榄品种佛奥、莱星、皮削利和鄂植8号为研究对象,融合双线性网络与注意力机制,提出双线性注意力EfficientNet模型。针对不同品种油橄榄表型差异很小的特点,搭建双线性网络以充分提取油橄榄图像中的特征信息。在此基础上,选用兼顾了速度和精度的EfficientNet-B0网络为特征提取网络。针对自然条件下油橄榄品种识别易受复杂背景干扰的问题,将CBAM(convolutional block attention module,CBAM)注意力与双线性网络结合,使模型在提取油橄榄图像特征时,能够聚焦到对油橄榄品种识别起关键作用的特征上。经测试,所提模型对4个油橄榄品种识别的总体准确率达到90.28%,推理时间为9.15 ms。Grad-CAM(gradient-weighted class activation mapping,Grad-CAM)热力图可视化结果也表明,所提模型在识别油橄榄品种时重点关注了果实以及部分叶子区域。消融试验结果表明,在EfficientNet模型中引入CBAM注意力和搭建双线性网络后,总体准确率分别提高了5.00和10.97个百分点。并且,对比试验结果表明,与双线性ResNet34、EfficientNet-SE注意力、双线性ResNet18、双线性VGG16和双线性GoogLeNet等模型相比,所提模型的总体识别准确率分别高12.78、11.53、11.11、10.70和5.00个百分点。该研究为解决自然条件下的油橄榄品种识别提供了依据,同时也可为其他作物的品种识别提供参考。 展开更多
关键词 图像处理 模型 品种识别 油橄榄 EfficientNet-B0 CBAM注意力 grad-cam
下载PDF
基于迁移学习的滚动轴承复合故障诊断研究 被引量:1
17
作者 杜康宁 宁少慧 《机床与液压》 北大核心 2023年第13期198-205,共8页
针对现有故障诊断方法多是面向单一故障进行研究,对于实际工况下的复合故障缺乏相应的诊断方法,提出一种基于有监督学习的ConvNeXt滚动轴承多工况复合故障诊断模型(TConvNeXt)。通过合成少数类过采样技术将滚动轴承数据集重构为平衡数据... 针对现有故障诊断方法多是面向单一故障进行研究,对于实际工况下的复合故障缺乏相应的诊断方法,提出一种基于有监督学习的ConvNeXt滚动轴承多工况复合故障诊断模型(TConvNeXt)。通过合成少数类过采样技术将滚动轴承数据集重构为平衡数据集,以提高复合故障样本的利用率;利用迁移学习使TConvNeXt网络模型掌握判别滚动轴承复合故障信息所需的部分权重,通过格拉姆角场将一维信号转换为RGB图像输入模型,训练模型剩余权重;最后将训练后的TConvNeXt网络模型用于滚动轴承故障诊断并且利用Grad-CAM方法进行可视化,分析网络诊断错误起因并对网络进行调整;将训练准确率最高的模型用于滚动轴承故障实测,检验其实际工况下的诊断能力。实验结果表明:TConvNeXt网络模型具有高诊断精度,它不仅在混叠故障诊断中表现突出,在单一故障诊断中也具有优势,能够很好地适应多工况下不同故障类型的滚动轴承故障诊断要求。 展开更多
关键词 复合故障诊断 迁移学习 ConvNeXt卷积神经网络 grad-cam方法
下载PDF
深度学习在内镜下内痔诊断及危险分级中的应用 被引量:2
18
作者 陆建英 沈文娟 +6 位作者 顾莹 沈琳霞 张叶群 袁金丹 张芝芝 许春芳 朱锦舟 《中国内镜杂志》 2023年第2期1-7,共7页
目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)... 目的建立内镜下内痔诊断及危险分级的深度学习模型,探讨人工智能辅助内镜下内痔诊疗的可行性。方法收集该院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组(A任务);根据LDRf分级标准,将内痔组进一步分为Rf0组、Rf1组和Rf2组(B任务)。选取基于卷积神经网络(CNN)框架的Xception、ResNet和EfficientNet,以及基于Transformer框架的ViT和ConvMixer等5个神经网络,建立针对A、B两项计算机视觉任务的深度学习模型。模型评价指标包括准确率、召回率、精确度、F1值和读片时间。将深度学习模型的读片表现与两位不同年资内镜医生进行比较。结果5种深度学习模型在A与B任务测试集中皆展现出较好的准确性。其中,最优模型为ConvMixer,准确性最高(0.961和0.911),其次为EfficientNet(0.956和0.901),均优于高年资内镜医生(0.952和0.881)和低年资内镜医生(0.913和0.832)。同时,所有深度学习模型在验证集中读片用时均<10 s,速度快于内镜医生(均>300 s)。此外,笔者采用梯度加权分类激活映射(Grad-CAM)方法突出图像中对模型判断较重要的区域。结论建立的内痔诊断及危险分级的深度学习模型,其表现优于内镜医生。基于深度学习的计算机视觉模型可辅助内镜医师进行内痔诊断和分级,展现出潜在的临床应用前景。 展开更多
关键词 深度学习 内痔 消化内镜 LDRf分级 梯度加权分类激活映射
下载PDF
基于ResNet的可解释性计算机视觉模型在内镜下内痔评估中的应用 被引量:1
19
作者 刘璐 林嘉希 +4 位作者 朱世祺 高静雯 刘晓琳 许春芳 朱锦舟 《现代消化及介入诊疗》 2023年第8期972-975,980,共5页
目的为克服深度学习模型黑盒不可解释的缺点,本研究旨在探讨可解释性计算机视觉模型在内镜下内痔诊断及危险分级中的应用。方法收集苏州大学附属第一医院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组;根据LDRf分级标准,对内痔组进... 目的为克服深度学习模型黑盒不可解释的缺点,本研究旨在探讨可解释性计算机视觉模型在内镜下内痔诊断及危险分级中的应用。方法收集苏州大学附属第一医院内镜中心的肛齿状线上倒镜图片,分为内痔组和正常组;根据LDRf分级标准,对内痔组进一步分级为Rf0、Rf1及Rf2三组。针对有无内痔、红色征、糜烂、血栓及活动性出血,构建基于ResNet50V2的可解释化模型,并利用江苏大学附属金坛医院内镜中心的内镜图片进行外部验证。使用准确性、敏感性、特异性以及F1值等指标对比可解释化模型与传统深度学习黑盒模型的表现,并与两位不同年资内镜医生进行比较。结果ResNet可解释化模型的准确性为0.957、敏感性为0.978、特异性为0.974,F1值为0.958,其准确性高于黑盒模型的0.938,高年资内镜医生的0.933及低年资医生的0.907。此外,模型采用Grad-CAM方法突出图像中对模型推理依据的区域。结论本研究通过收集内镜下肛齿状线上倒镜图像,构建可解释化计算机视觉模型并进行外部验证,提示该模型在内镜下内痔诊断与评级中表现优于传统深度学习黑盒模型。该模型在未来临床内镜诊疗中具有良好应用前景。 展开更多
关键词 可解释性 深度学习 内痔 消化内镜 LDRf分级 梯度加权分类激活映射
下载PDF
深度学习方法在地震事件分类中的应用及可解释性研究 被引量:1
20
作者 路晓辰 杨立明 +4 位作者 杨兴悦 王祖东 王维欢 高永国 尹欣欣 《地震工程学报》 CSCD 北大核心 2023年第2期474-482,共9页
采用2016—2020年福建台网所记录的爆破和天然地震事件以及背景噪声数据集,使用CNN模型、Inception10模型、ResNet18模型和Vgg16模型4种深度学习网络模型进行分类研究。针对深度学习网络模型的“黑盒”问题,将梯度类激活映射(Gradient-w... 采用2016—2020年福建台网所记录的爆破和天然地震事件以及背景噪声数据集,使用CNN模型、Inception10模型、ResNet18模型和Vgg16模型4种深度学习网络模型进行分类研究。针对深度学习网络模型的“黑盒”问题,将梯度类激活映射(Gradient-weighted Class Activation Mapping,Grad-CAM)算法引入这4种分类模型中,得到每个模型的可视化图。通过可视化图可以直观地看出模型在做出分类决策时对于不同波形特征的依赖权重,为模型的可解释性提供依据,进而提高模型的可信度。通过对模型的可视化图分析得出,分类效果更好的CNN模型和Vgg16模型在做出决策时更依赖于地震波形的震相特征,对于震前和震后的波段关注较小;而ResNet18模型和Inception10模型对于震相特征的关注不够敏锐。通过Grad-CAM算法对模型进行可视化分析得到的结果能够很好地反映模型的分类效果,对于改进和选择合适的分类模型具有重要意义。 展开更多
关键词 可解释性 grad-cam算法 爆破事件分类 深度学习
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部