基于注意力机制的卷积神经网络可视化方法被引量：4

Visualization Method of Convolutional Neural Network Based on Attention Mechanism

下载PDF

导出

摘要相比于传统机器学习算法,卷积神经网络“端到端”的黑盒特性使其内部工作机制缺乏透明性和可解释性,导致其在某些安全性要求较高的领域受到一定限制。为此,提出一种基于注意力机制的卷积神经网络可视化方法,用于可视化解释卷积神经网络中间层所学特征。该方法首先将注意力机制添加到网络结构中,跟随网络一起训练;然后,获取训练后模型的最高层特征图,并使用双线性插值将其放大到输入图像大小;最后,将处理后的特征图与输入图像叠加形成热力图,用于定位输入图像的关键区域,实现对卷积神经网络所学特征的理解和解释。在CIFAR10数据集上实验结果表明,相比于直接对特征图进行可视化,基于注意力机制的可视化方法能够更准确地定位目标的关键特征,从而帮助理解卷积神经网络所学特征。 Compared with traditional machine learning algorithms,the end-to-end black box nature of convolutional neural networks results in the lack of transparency and interpretability in the internal working mechanism,leading to restrictions in certain areas with high security requirements.To this end,this paper proposes a visualization method of convolutional neural network based on attention mechanism,which is used to visually explain the feature representation learned by the middle layer of convolutional neural network.First,this method adds the attention mechanism to the network structure and makes it train with the network.Then,the last layer feature map of the trained model is obtained and the bilinear interpolation is used to enlarge it to the input image size.Finally,the processed feature map is superimposed with the input image to form a final heatmap,which is used to locate the key area of the input image and realize the understanding and interpretation of the features learned by the convolutional neural network.Experimental results on CIFAR10 dataset show that,compared to directly visualizing the feature map,the visualization method based on the attention mechanism can accurately locate the key features of the object,thus helping understand the learned features of the convolutional neural network.

作者司念文常禾雨张文林屈丹 SI Nianwen;CHANG Heyu;ZHANG Wenlin;QU Dan(Information Engineering University,Zhengzhou 450001,China)

机构地区信息工程大学

出处《信息工程大学学报》 2021年第3期257-263,共7页 Journal of Information Engineering University

基金国家自然科学基金资助课题(61673395)。

关键词卷积神经网络可解释性可视化注意力机制热力图 deep neural network interpretability visualization attention mechanism heatmap

分类号 E917 [军事]

引文网络
相关文献

同被引文献30

1段瑞玲,李庆祥,李玉和.图像边缘检测方法研究综述[J].光学技术,2005,31(3):415-419. 被引量：377
2张欣刚,王雷,徐治皋,李勇.高压加热器泄漏的静态仿真计算及其故障特征分析[J].热力发电,2005,34(10):13-17. 被引量：7
3严俊,林刚,赖国亮,聂远仲.测色技术在炒青绿茶品质评价中的应用研究[J].食品科学,1996,17(7):21-24. 被引量：23
4林新,牛智有.基于近红外光谱茶叶种类的快速识别[J].华中农业大学学报,2008,27(2):326-330. 被引量：19
5陈孝敬,吴迪,何勇,李晓丽,刘守.基于多光谱图像颜色特征的茶叶分类研究[J].光谱学与光谱分析,2008,28(11):2527-2530. 被引量：16
6蒋帆,乔欣,郑华军,杨庆华.基于高光谱分析技术的机炒龙井茶等级识别方法[J].农业工程学报,2011,27(7):343-348. 被引量：22
7裴宜星,王江,吴帆.核电站高压加热器泄漏仿真[J].计算机仿真,2013,30(8):139-142. 被引量：4
8尹志,胡冬.茶叶感官审评方法中存在的若干问题分析[J].茶叶,2015,41(1):15-18. 被引量：23
9张瑞青.基于SVM的汽轮机回热系统故障诊断[J].价值工程,2015,34(18):61-63. 被引量：1
10王壮业.核电厂高压加热器系统常见故障分析及应对策略[J].科技创新导报,2017,14(22):66-66. 被引量：1

引证文献4

1韩伟娟,董新捷,邢广东,王海强.低照度图像增强算法研究及改进[J].信息工程大学学报,2022,23(2):173-178.
2章展熠,张宝荃,王周立,杨垚,范冬梅,何卫中,马军辉,林杰.多茶类CNN图像识别的数据增强优化及类激活映射量化评价[J].茶叶科学,2023,43(3):411-423. 被引量：1
3章壮炜,邢天阳,朱小良.基于CCA-DCNN算法和数字孪生的给水回热系统故障诊断研究[J].热能动力工程,2023,38(7):175-184. 被引量：2
4龚少翠,苗军,卿来云,乔元华.神经网络模型的可视化研究进展[J].计算机科学与应用,2022,12(4):988-1004. 被引量：2

二级引证文献5

1徐红姣,何彦青.主题粒度的潜在国际科技合作识别方法研究——以中俄为例[J].情报科学,2023,41(5):138-143. 被引量：1
2张晋宁.基于神经网络的视觉语音识别系统[J].电声技术,2023,47(11):101-104.
3魏振江,孙乐.分布式电源配电网继电保护二次回路故障识别方法[J].通信电源技术,2024,41(4):128-130.
4杨东红.面向SoC深度学习算法的图像识别研究[J].自动化与仪器仪表,2024(6):241-245.
5刘浩,肖云龙,肖焱山,曾祥云,郑胜.核电蒸汽系统数字孪生模型自动化同步技术[J].科学技术与工程,2024,24(29):12576-12583.

1张大伟.突出三类劳动融合五色教育着力构建大中小学劳动教育一体化体系[J].黑龙江教育（教育与教学）,2021(7):10-11.
2邓萍,蒋君好,余瑜,胡湘南,袁建勇,甘宗捷.Discovery Studio软件在药物化学教学中的应用[J].药学教育,2021,37(3):56-61. 被引量：6
3楼冠廷.声呐图像自动目标识别技术研究[J].工业控制计算机,2021,34(5):54-56. 被引量：1
4李召坤,杨睿,胡柏石,杜志明,赵利信.基于LWD随钻自然伽马测井数据的砂岩铀矿储层三维储量预测方法研究[J].原子能科学技术,2021,55(S02):373-379. 被引量：1

信息工程大学学报

2021年第3期

浏览历史

内容加载中请稍等...

基于注意力机制的卷积神经网络可视化方法被引量：4

同被引文献30

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的卷积神经网络可视化方法 被引量：4

同被引文献30

引证文献4

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的卷积神经网络可视化方法被引量：4