基于深度学习的图像自动标注算法被引量：26

Image Auto-Annotation Based on Deep Learning

下载PDF

导出

摘要图像的自动标注是图像检索领域一项基础而又富有挑战性的任务。深度学习算法自提出以来在图像和文本识别领域取得了巨大的成功,是一种解决"语义鸿沟"问题的有效方法。图像标注问题可以分解为基于图像与标签相关关系的基本图像标注和基于标注词汇共生关系的标注改善两个过程。文中将基本图像标注问题视为一个多标记学习问题,图像的标签先验知识作为深度神经网络的监督信息。在得到基本标注词汇的基础上,利用原始图像标签词汇的依赖关系与先验分布改善了图像的标注结果。最后将所提出的改进的深度学习模型应用于Corel和ESP图像数据集,验证了该模型框架及所提出的解决方案的有效性。 Image auto-annotation is a basic and challenge task in the image retrieval work.The traditional machine learning methods have obtained a lot achievements in this field.The deep learning algorithm has achieved great success in image and text learning work since it is presented,so it can be an efficient method to solve the semantic gap problems.Image auto-annotation can be decomposed into two steps,that is,the basic image auto-annotation based on the relationship between image and tag,and the annotation enhanced based on the mutual information of the tags.In this article,the basic image auto-annotation is viewed as a multi-labelled problem.Therefore the prior knowledge of the tags can be used as the supervise information of the deep neural network.After obtained the image tags,the dependent relationship of the tags is used to improve the annotation result.Finally,the model is tested in Corel and ESP datasets,and results prove that the method can efficiently solve the image auto-annotation problems.

作者杨阳张文生

机构地区中国科学院自动化研究所

出处《数据采集与处理》 CSCD 北大核心 2015年第1期88-98,共11页 Journal of Data Acquisition and Processing

基金国家自然科学基金重点(U1135005)资助项目

关键词机器学习深度学习神经网络图像自动标注 machine learning deep learning neural network image auto-annotation

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献27

1卢汉清,刘静.基于图学习的自动图像标注[J].计算机学报,2008,31(9):1629-1639. 被引量：42
2许红涛,周向东,向宇,施伯乐.一种自适应的Web图像语义自动标注方法[J].软件学报,2010,21(9):2183-2195. 被引量：15
3Cusano C, Cioeca G, Schettini R. Image annotation using SVM[C]//International Society for Optics and Photonics. [S. 1. ] : SHE, 2004: 330-338.
4Gao Y, Fan J, Xue X, et al. Automatic image annotation by incorporating feature hierarchy and boosting to scale up SVM classifiers[C]//Proceedings of the 14th Annual ACM International Conference on Multimedia. [S. 1. ]: ACM, 2006: 901- 910.
5Verma Y, Jawahar C V. Exploring SVM for image annotation in presence of confusing labels[C]//Proceedings of the 24th British Machine Vision Conference. London, British: BMVC, 2013: 25.1-25.11.
6Li J, Wang J Z. Automatic linguistic indexing of pictures by a statistical modeling approach [J]. Pattern Analysis and Ma- chine Intelligence, IEEE Transactions on, 2003, 25(9): 1075-1088.
7Chang E, Goh K, Sychay G, et al. CBSA: content-based soft annotation for multimodal image retrieval using Bayes point machines [J]. Circuits and Systems for Video Technology, IEEE Transactions on, 2003, 13(1) : 26-38.
8Carneiro G, Chan A B, Moreno P J, et al. Supervised learning of semantic classes for image annotation and retrieval [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2007, 29(3): 394-410.
9Mori Y, Takahashi H, Oka R. Image-to-word transformation based on dividing and vector quantizing images with words[C] //First International Workshop on Multimedia Intelligent Storage and Retrieval Management. Florida, USA: ACM, 1999.
10Blei D M, Jordan M I. Modeling annotated data[C]// Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval. Toronto, Canada: ACM, 2003: 127-134.

二级参考文献56

1赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量：21
2Li XR,Chen L,Zhang L,Lin FZ,Ma WY.Image annotation by large-scale content-based image retrieval.In:Nahrstedt K,et al.,ed.Proc.of the 14th ACM Int'l Conf.on Multimedia.Santa Barbara:ACM Press,2006.607-610.
3Wang XJ,Zhang L,Jing F,Ma WY.AnnoSearch:Image auto-annotation by search.In:Hari S,Milind RN,John RS,Yong R,eds.Proc.of the Conf.Image and Video Retrieval.2006.1483-1490.
4Feng HM,Shi R,Chua TS.A bootstrapping framework for annotating and retrieving WEB images.In:Schulzrinne H,et al.,eds.Proc.of the 12th ACM Int'l Conf.on Multimedia.New York:ACM Press,2004.960-967.
5Tseng VS,Su JH,Wang BW,Lin YM.WEB image annotation by fusing visual features and textual information.In:Proc.of the 2007 ACM Symp.on Applied Computing,Symposium on Applied Computing.New York:ACM Press,2007.1056-1060.
6Mori Y,Takahashi H,Oka R.Image-to-word transformation based on dividing and vector quantizing images with words.In:Proc.of the 1st Int'l Workshop on Multimedia Intelligent Storage and Retrieval Management.1999.
7Duygulu P,Barnard K,de Freitas JFG,Forsyth DA.Object recognition as machine translation:Learning a lexicon for a fixed image vocabulary.In:Proc.of the European Conf.on Computer Vision.2002.97-112.
8Blei D,Jordan M.Modeling annotated data.In:Proc.of the Int'l ACM SIGIR.Toronto:ACM Press,2003.127-134.
9Jeon J,Lavrenko V,Manmatha R.Automatic image annotation and retrieval using cross-media relevance models.In:Proc.of the Int'l ACM SIGIR.Toronto:ACM Press,2003.119-126.
10Li J,Wang J.Automatic linguistic indexing of pictures by a statistical modeling approach.IEEE Trans.on Pattern Analysis and Machine Intelligence,2003,25(19):1075-1088.

共引文献104

1吴效莹,李士勇.自动图像标注算法研究[J].科技风,2009(20):40-41.
2虎晓红,钱旭,王珂.图学习的区域图像标注方法[J].计算机应用,2009,29(9):2393-2394. 被引量：1
3谢书娟.SVM理论在图书馆馆藏图像标引方面的应用[J].甘肃科技,2010,26(1):118-119. 被引量：1
4高隽,谢昭,张骏,吴克伟.图像语义分析与理解综述[J].模式识别与人工智能,2010,23(2):191-202. 被引量：20
5李大湘,彭进业,卜起荣.基于QPSO-MIL算法的图像标注[J].计算机科学,2010,37(6):278-282. 被引量：2
6李东艳,李绍滋,柯逍.基于外部数据库的图像自动标注改善模型[J].计算机应用,2010,30(10):2610-2613. 被引量：1
7张华,梁宇生.基于实例图像自动语义标注方法的研究[J].山东农业大学学报（自然科学版）,2011,42(2):255-258. 被引量：1
8鲍泓,徐光美,冯松鹤,须德.自动图像标注技术研究进展[J].计算机科学,2011,38(7):35-40. 被引量：21
9刘峥,马军.一种基于图划分和图像搜索引擎的图像标注改善算法[J].计算机研究与发展,2011,48(7):1246-1254. 被引量：4
10邓剑勋,熊忠阳,曾代敏.基于AFSVM-MIL算法的图像标注[J].计算机应用研究,2011,28(10):3917-3919.

同被引文献394

1孙迪.科技文献标引问题探析——以国家图书馆为例[J].图书馆建设,2020,0(1):101-108. 被引量：3
2席斌,王振雷,钱锋.机器视觉工业检测系统的应用与发展[J].控制工程,2006,13(S1):220-222. 被引量：19
3王洪,贾惠波,徐端颐.基于中文学术期刊人工标引的自动分类新算法[J].现代图书情报技术,2002(S1):59-62. 被引量：1
4赵衍,张永娟,陈成材,陈恒.一种提高计算机自动赋词标引准确性的综合方法——基于创新型CBA数据库的实证分析[J].情报杂志,2012,31(5):185-191. 被引量：5
5杨学山.词典在汉语科技文献自动标引中的作用[J].情报科学,1987,8(3):35-38. 被引量：1
6张琪玉.关于主题词型手工检索系统标引工作的几点建议[J].国家图书馆学刊,1985,3(4):23-29. 被引量：1
7侯汉清.中、美、英三国标引方式比较中文图书主题标引宜采用保持上下文索引系统[J].国家图书馆学刊,1985,3(4):30-37. 被引量：1
8李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：93
9王迅,金万平,张存林,沈京玲,郭广平,杨党纲,吴东流,李建伟,郭兴旺.红外热波无损检测技术及其进展[J].无损检测,2004,26(10):497-501. 被引量：110
10梁国远,查红彬,刘宏.基于三维模型和仿射对应原理的人脸姿态估计方法[J].计算机学报,2005,28(5):792-800. 被引量：25

引证文献26

1罗斌,郜伟,汤进,王文中,李成龙.复杂环境下基于角点回归的全卷积神经网络的车牌定位[J].数据采集与处理,2016,31(1):65-72. 被引量：11
2周家琪,刘丽,崔晓萍,李方方.基于相似性迁移学习的图像标注[J].山东师范大学学报（自然科学版）,2016,31(2):22-26. 被引量：2
3杜烨宇,陶大鹏,梁虹,林旭.基于局部自适应核回归的仪表定位方法[J].数据采集与处理,2016,31(3):490-501. 被引量：1
4刘梦迪,陈燕俐,陈蕾.图像自动标注技术研究进展[J].计算机应用,2016,36(8):2274-2281. 被引量：3
5陈后金,李艳凤,彭亚辉.多视角乳腺X线图像匹配方法综述[J].数据采集与处理,2016,31(5):845-855. 被引量：2
6伍长荣,接标,叶明全.CT图像肺结节计算机辅助检测与诊断技术研究综述[J].数据采集与处理,2016,31(5):868-881. 被引量：21
7苏铁明,程福运,韩兆翠,欧宗瑛.基于深度学习与融入梯度信息的人脸姿态分类检测[J].数据采集与处理,2016,31(5):941-948.
8黄冬梅,许琼琼,杜艳玲,贺琪.基于DBNMI模型的海洋遥感影像自动标注方法[J].中国科学技术大学学报,2017,47(7):541-546. 被引量：2
9刘忠宝,赵文娟,贾君枝.深度学习及其对图书情报学的启示[J].情报工程,2017,3(4):62-70. 被引量：2
10柯圣财,李弼程,唐永旺,吴志兵,万建平.基于卷积神经网络和二进制K-means的图像快速聚类[J].数据采集与处理,2017,32(5):970-979. 被引量：2

二级引证文献139

1吴庆海.人工智能时代下的知识管理[J].知识管理论坛,2019,0(6):321-331. 被引量：7
2陈琳.基于知识图谱的国内数字人文研究现状分析[J].图书馆学刊,2020,0(1):89-94. 被引量：2
3徐跃.基于风格迁移学习的照片档案开发[J].兰台世界,2023(S01):134-136.
4郭恒川.人工智能中的机器学习技术应用[J].电子技术（上海）,2021,50(10):294-296. 被引量：2
5张乐江,李晓坤,张伟华,张懋源,陈虹旭,杨磊.基于深度学习的全景摄像机图像矫正方法研究[J].智能计算机与应用,2020(7):132-136.
6杨志安.我国中小企业发展的模式选择[J].经济管理,2000,26(4):13-14. 被引量：12
7李淑华,李建东.Powerbuilder中利用Windows API实现图片的动画特效[J].电脑编程技巧与维护,2000(4):78-81.
8浦东平,樊重俊,袁光辉.知识管理视角下平台型企业的管理模式和系统架构研究[J].中国人力资源开发,2018,35(12):103-111. 被引量：5
9童冰,郑东生,黄金华,许冲.一种融合深度特征图和形态学的车牌定位方法[J].长江大学学报（自科版）（上旬）,2016,13(10):60-65.
10谈进.浅析低剂量CT检查在肺结节筛查中的应用效果[J].当代医药论丛,2017,15(12):114-115. 被引量：2

1汤斌,王吉华,庞双双.改进的三维模型语义自动标注算法[J].山东师范大学学报（自然科学版）,2015,30(4):50-54.
2侯天峰,张志伟,葛陆蔚.基于WPF的图片浏览器设计与实现[J].微型电脑应用,2017,33(4):53-55. 被引量：2
3史晓峰,赵耀红.基本图像处理功能在GDI+中的实现方法[J].长春工程学院学报（自然科学版）,2003,4(3):67-69. 被引量：4
4杨允,张乐年.查片仪中线阵CCD的数据采集和处理研究[J].长沙航空职业技术学院学报,2006,6(3):55-58.
5胡涛,吴涛,李焱.一种基于场景识别的快速语义标注方法[J].华中科技大学学报（自然科学版）,2013,41(S1):103-107. 被引量：1
6陈娜.基于HMM的自动图像标注方法[J].计算机应用与软件,2011,28(5):259-261.
7王斌,俞能海.一种针对大规模网络图像的自动标注改善算法[J].电子与信息学报,2009,31(2):270-274. 被引量：2
8人语[J].消费电子,2014(3):7-7.
9崔晓萍,刘丽,周家琪,李方方,尚菲.基于稀疏表达的污损图像标注算法[J].山东师范大学学报（自然科学版）,2017,32(1):30-35.
10郭乔进,胡杰,高承志,周鹏飞.一种基于像素视觉共生的图像分割方法[J].信息化研究,2015,41(1):15-18.

数据采集与处理

2015年第1期

浏览历史

内容加载中请稍等...

基于深度学习的图像自动标注算法被引量：26

参考文献27

二级参考文献56

共引文献104

同被引文献394

引证文献26

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

基于深度学习的图像自动标注算法 被引量：26

参考文献27

二级参考文献56

共引文献104

同被引文献394

引证文献26

二级引证文献139

相关作者

相关机构

相关主题

浏览历史

基于深度学习的图像自动标注算法被引量：26