基于注意力模型的手绘图像检索方法被引量：3

Sketch-based Image Retrieval Based on Attention Model

下载PDF

导出

摘要针对手绘图像检索领域中手绘图像的特征稀疏、手绘本身易于形变等问题,文中提出了一种基于注意力模型的特征提取方法,通过精确提取手绘图像中的语义特征来获得高效准确的检索结果。首先使用卷积神经网络作为提取语义特征的基础框架;然后在有监督训练的过程中引入了注意力模型机制,通过在卷积神经网络的最后一层卷积层后引入注意力结构块的方法来定位出有效的语义特征,其中注意力结构块由空间注意力结构和通道注意力结构联合组成;最后通过融合不同层次的语义特征形成最终的特征描述子,达到高精度的检索,在基准数据库Flickr15k上的实验结果表明所提方法是可行有效的。此外,在手绘图像分类任务中,提出的注意力机制大幅提高了分类精度。 To solve the problems of the sparse features and the geometric distortion of hand-drawn images in the research field of SBIR(sketch based image retrieval),a new feature extraction method based on attention model is proposed in this paper.The retrieval results can be obtained efficiently and accurately by accurately extracting the semantic features of hand-drawn images.Firstly,convolutional neural network is used as the basic framework for extracting semantic features,and then the supervised training process is carried out.Attention model mechanism is introduced to locate effective semantic features by adding attention block after the last convolution layer of the convolution neural network,and the attention block is composed of spatial attention structure and channel attention structure.Finally,the final feature descriptor is formed by the fusion of semantic features in different layers,to realize high retrieval accuracy.The experimental results on benchmark Flickr15k dataset proves the feasibility and effectiveness of the proposed method.In addition,the proposed attention model can greatly improve the classification accuracy in the task of sketch classification.

作者李宗民李思远刘玉杰李华 LI Zong-min;LI Si-yuan;LIU Yu-jie;LI Hua(College of Computer&Communication Engineering,China University of Petroleum,Qingdao,Shandong 266580,China;Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China)

机构地区中国石油大学(华东)计算机与通信工程学院中国科学院计算技术研究所

出处《计算机科学》 CSCD 北大核心 2020年第11期199-204,共6页 Computer Science

基金国家自然科学基金(61379106,61379082,61227802) 山东省自然科学基金(ZR2013FM036,ZR2015FM011)。

关键词手绘检索注意力模型卷积神经网络手绘分类 Sketch-based image retrieval Attention model Convolutional neural network Sketch classification

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1刘玉杰,庞芸萍,路子奇,李宗民,李华.结合距离变换和隐层图词包的手绘图像检索方法[J].计算机辅助设计与图形学学报,2016,28(12):2168-2174. 被引量：6
2刘玉杰,窦长红,赵其鲁,李宗民,李华.基于条件生成对抗网络的手绘图像检索[J].计算机辅助设计与图形学学报,2017,29(12):2336-2342. 被引量：12
3刘玉杰,于邓,庞芸萍,李宗民,李华.综合多层语义特征与深度卷积网络的手绘图像检索方法[J].计算机辅助设计与图形学学报,2018,30(4):651-657. 被引量：3

二级参考文献1

1刘玉杰,庞芸萍,路子奇,李宗民,李华.结合距离变换和隐层图词包的手绘图像检索方法[J].计算机辅助设计与图形学学报,2016,28(12):2168-2174. 被引量：6

共引文献18

1王彤.基于卷积神经网络的舰船图像边缘检测算法[J].舰船科学技术,2019,41(22):79-81. 被引量：2
2陈明军,周含策,张丽艳.基于卷积神经网络的运动模糊编码点识别[J].计算机辅助设计与图形学学报,2017,29(10):1844-1852. 被引量：6
3刘玉杰,窦长红,赵其鲁,李宗民,李华.基于条件生成对抗网络的手绘图像检索[J].计算机辅助设计与图形学学报,2017,29(12):2336-2342. 被引量：12
4刘玉杰,于邓,庞芸萍,李宗民,李华.综合多层语义特征与深度卷积网络的手绘图像检索方法[J].计算机辅助设计与图形学学报,2018,30(4):651-657. 被引量：3
5谢志峰,叶冠桦,闫淑萁,何绍荣,丁友东.基于生成对抗网络的HDR图像风格迁移技术[J].上海大学学报（自然科学版）,2018,24(4):524-534. 被引量：8
6林家骏,诸葛晶晶,张晴.基于像素级生成对抗网络的复杂场景灰度图像彩色化[J].计算机辅助设计与图形学学报,2019,31(3):439-446. 被引量：4
7刘杨圣彦,潘翔,刘复昌,张三元.面向三维模型视图特征提取的残差卷积网络优化[J].计算机辅助设计与图形学学报,2019,31(6):936-942. 被引量：7
8于邓,刘玉杰,邢敏敏,李宗民,李华.包含跨域建模和深度融合网络的手绘草图检索[J].软件学报,2019,30(11):3567-3577. 被引量：7
9程皓楠,李思佳,刘世光.深度跨模态环境声音合成[J].计算机辅助设计与图形学学报,2019,31(12):2047-2055. 被引量：3
10刘尚争,刘斌.生成对抗网络图像类别标签跨模态识别系统设计[J].现代电子技术,2020,43(8):173-175. 被引量：3

同被引文献12

1金汉均,吴静.基于深度柯西哈希的图像检索研究[J].电子测量技术,2020(9):104-108. 被引量：1
2王新建,罗光春,秦科,陈爱国,赖云一.一种基于SVM和主动学习的图像检索方法[J].计算机应用研究,2016,33(12):3836-3838. 被引量：6
3刘海龙,李宝安,吕学强,黄跃.基于深度卷积神经网络的图像检索算法研究[J].计算机应用研究,2017,34(12):3816-3819. 被引量：51
4喻丽春,刘金清.基于改进的VGGNet算法的人脸识别[J].长春工业大学学报,2018,39(4):378-385. 被引量：10
5朱张莉,饶元,吴渊,祁江楠,张钰.注意力机制在深度学习中的研究进展[J].中文信息学报,2019,33(6):1-11. 被引量：127
6郭鹏,肖秦琨,赵一丹.基于深度图像的手势识别研究[J].国外电子测量技术,2019,38(10):6-12. 被引量：12
7艾曼.基于Faster-RCNN的车牌检测[J].计算机与数字工程,2020,48(1):174-177. 被引量：10
8朱阳光,刘瑞敏,黄琼桃.基于深度神经网络的弱监督信息细粒度图像识别[J].电子测量与仪器学报,2020,32(2):115-122. 被引量：35
9刘颖,程美,王富平,李大湘,刘伟,范九伦.深度哈希图像检索方法综述[J].中国图象图形学报,2020,25(7):1296-1317. 被引量：15
10王燕,张继凯,尹乾.基于Faster R-CNN的车牌识别算法[J].北京师范大学学报（自然科学版）,2020,56(5):647-653. 被引量：11

引证文献3

1彭洋,汪孟杰.基于卷积神经网络的车牌识别[J].科技与创新,2020(17):72-73. 被引量：4
2金汉均,曾星.基于注意力机制的深度哈希图像检索方法[J].电子测量技术,2021,44(3):144-148. 被引量：4
3魏赟,严正怡.结合注意力卷积神经网络的图像检索技术研究[J].小型微型计算机系统,2021,42(11):2368-2374. 被引量：6

二级引证文献14

1汪志成,王泽旺,朱梦帆,纪荣焕,张斌.基于卷积神经网络的局部放电声音识别研究[J].电子测量技术,2023,46(20):148-155. 被引量：2
2时瑞,蒋三新.基于模板与内容分离的票据识别方法[J].电子测量技术,2023,46(6):122-128.
3王恒涛.基于TensorFlow、Keras与OpenCV的图像识别集成系统[J].电子测试,2020,31(24):53-54. 被引量：14
4罗利梦,许芷毓,谢晓辉,李磊.基于卷积神经网络的表面肌电信号手势识别[J].电脑编程技巧与维护,2021(1):137-138. 被引量：1
5魏智锋,肖书浩,蒋国璋,伍世虔,程国飞.基于深度学习的人造板表面缺陷检测研究[J].林产工业,2021,58(2):21-26. 被引量：18
6莫少雄,赵波.复杂环境下的车牌识别[J].智能计算机与应用,2021,11(5):124-128. 被引量：5
7黄界生.基于深度学习的计算机视觉中图像检索算法研究[J].信息技术与信息化,2022(9):181-184. 被引量：2
8朱海艳,张付春,季跃龙,李盟,王百洋.基于神经网络的脑电信号体质检测研究[J].数字印刷,2022(6):53-63. 被引量：1
9田枫,卢圆圆,刘芳,刘宗堡.融合显著性检测的图像检索方法研究[J].重庆理工大学学报（自然科学）,2023,37(3):162-171. 被引量：1
10曾凡锋,王祺.融合自注意力和卷积的图像检索技术[J].计算机技术与发展,2023,33(7):34-40.

1王文超.基于可变形卷积的手绘图像检索[J].计算机系统应用,2020,29(7):239-244.
2段明贵,谷留明.对勾函数的图像为何是双曲线[J].中学数学研究（华南师范大学）（上半月）,2020,0(2):32-33.
3张翔,史志才,陈良.引入注意力机制和中心损失的表情识别算法[J].传感器与微系统,2020,39(11):148-151. 被引量：4
4黄鸿,彭超,吴若愚,陶俊利,张久权.基于部分注释CT图像的自监督迁移学习肺结节分类[J].光学学报,2020,40(18):93-100. 被引量：11
5潘娜,蒋敏,孔军.基于时空交互注意力模型的人体行为识别算法[J].激光与光电子学进展,2020,57(18):317-325. 被引量：3
6张连超,乔瑞萍,党祺玮,翟沛源,孙红帅.具有全局特征的空间注意力机制[J].西安交通大学学报,2020,54(11):129-138. 被引量：9
7周强.先行信息水平对“白熊效应”前后目标搜索的影响[J].心理学进展,2020,10(6):732-746. 被引量：1
8梁维天,李勇,王东波,李浩,袁圣,冯家新,孙文.辽东南金属矿勘查中广域电磁法应用效果[J].物探与化探,2020,44(5):1078-1084. 被引量：3
9秦闯,王颖,黄萌,李博,李雪超.半干旱地区河谷盆地与低丘缓坡冬季边界层特征差异的对比研究[J].高原气象,2020,39(5):1045-1057.
10袁磊,万涛,徐利权.三线建设遗存建筑的类型与空间特征研究[J].华中建筑,2020,38(11):23-28. 被引量：3

计算机科学

2020年第11期

浏览历史

内容加载中请稍等...

基于注意力模型的手绘图像检索方法被引量：3

参考文献3

二级参考文献1

共引文献18

同被引文献12

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于注意力模型的手绘图像检索方法 被引量：3

参考文献3

二级参考文献1

共引文献18

同被引文献12

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于注意力模型的手绘图像检索方法被引量：3