基于多标签判别字典学习的图像自动标注被引量：7

Automatic image annotation based on multi-label discriminative dictionary learning

下载PDF

导出

摘要针对图像自动标注中底层视觉特征与高层语义之间的语义鸿沟问题,在传统字典学习的基础上,提出一种基于多标签判别字典学习的图像自动标注方法。首先,为每幅图像提取多种类型特征,将多种特征组合作为字典学习输入特征空间的输入信息;然后,设计一个标签一致性正则化项,将原始样本的标签信息融入到初始的输入特征数据中,结合标签一致性判别字典和标签一致性正则化项进行字典学习;最后,通过得到的字典和稀疏编码矩阵求解标签稀疏编向量,实现未知图像的语义标注。在Corel 5K数据集上测试其标注性能,所提标注方法平均查准率和平均查全率分别可达到35%和48%;与传统的稀疏编码方法(MSC)相比,分别提高了10个百分点和16个百分点;与距离约束稀疏/组稀疏编码方法(DCSC/DCGSC)相比,分别提高了3个百分点和14个百分点。实验结果表明,所提方法能够较好地预测未知图像的语义信息,与当前几种流行的图像标注方法进行比较,所提方法具有较好的标注性能。 Concerning the problem of semantic gap between low-level visual features and high-level semantics in automatic image annotation, based on traditional dictionary learning, a multi-label discriminative dictionary learning method was proposed to automatic image annotation. First of all, multiple types of features for each image were extracted, and a combination of a variety of features was used as input information of the input feature space to the dictionary learning. Then, a label consistency regularization term was designed to integrate the label information of the original samples into the initial input feature data, and the dictionary of label consistency and the label consistency regularization term were combined to learn the dictionary. Finally, the label sparse coding vector was obtained by the dictionary and sparse coding matrix to implement the semantic annotation for an unknown image. The performance of the annotation was tested on the Corel 5 K data set. The average precision and average recall could reach 35% and 48% respectively, compared with the traditional Sparse Coding Method（ MSC）, which were increased by 10 percentage points and 16 percentage points respectively, and increased by 3 percentage points and 14 percentage points respectively than the method of Distance Constraint Sparse/Group Sparse Coding（ DCSC/DCGSC） for automatic image lableing. Compared with the current image annotation methods, the experimental results show the proposed method can predict the semantic information for an unknown image properly, and has better annotation performance.

作者杨晓玲李志清刘雨桐 YANG Xiaoling;LI Zhiqing;LIU Yutong(Key Laboratory of Intelligent Computing ＆ laformation Processing of Ministry of Education,Xiangtan University,Xiangtan Hunan 411100,China)

机构地区湘潭大学智能计算与信息处理教育部重点实验室

出处《计算机应用》 CSCD 北大核心 2018年第5期1294-1298,1303,共6页 journal of Computer Applications

关键词图像自动标注字典学习特征表示稀疏编码图像检索 automatic image annotation dictionary learning feature representation sparse coding image retrieval

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘梦迪,陈燕俐,陈蕾.图像自动标注技术研究进展[J].计算机应用,2016,36(8):2274-2281. 被引量：3
2吴伟,高光来,聂建云.一种融合语义距离的最近邻图像标注方法[J].计算机科学,2015,42(1):297-302. 被引量：5
3臧淼,徐惠民,张永梅.基于距离约束稀疏/组稀疏编码的自动图像标注[J].四川大学学报（工程科学版）,2016,48(5):78-83. 被引量：4
4范馨予,崔晓康.基于稀疏编码的图像自动标注[J].电子技术与软件工程,2017(4):83-84. 被引量：1
5吴寿昆,郭玉堂.基于Voronoi K阶邻近图的半监督学习自动图像标注[J].计算机应用与软件,2016,33(12):183-187. 被引量：2

二级参考文献111

1司海棠,秦小麟,郝学峰.基于Voronoik阶邻近的目标预警预报方法[J].计算机应用,2009(2):598-601. 被引量：2
2杨晓敏,吴炜,干宗良,严斌宇,张莹莹.一种基于稀疏字典和残余字典的遥感图像超分辨重建算法[J].四川大学学报（工程科学版）,2015,47(3):71-76. 被引量：5
3温超,耿国华.基于内容图像检索中的“语义鸿沟”问题[J].西北大学学报（自然科学版）,2005,35(5):536-540. 被引量：17
4杨立,左春,王裕国.基于语义距离的K-最近邻分类方法[J].软件学报,2005,16(12):2054-2062. 被引量：31
5曲吉林,寇纪淞,李敏强,安世虎.基于Voronoi图的异常检测算法[J].计算机工程,2007,33(23):35-36. 被引量：5
6Huiskes M, Thomee B, Lew M. New trends and ideas in visual concept detection[C]//Proceedings of the llth ACM Confer- ence on Multimedia Information Retrieval. Philadelphia, PA, USA,2010:527-536.
7Thomee B,Popescu A. Overview of the ImageCLEF 2012 Flickr Photo Annotation and Retrieval Task[C]//CLEF 2012 Working notes. Rome, Italy, 2012.
8Deng J,Berg A, Sstheesh S, et al. ImageNet Large Scale VisualRecognition Competition 2012 (ILSVRC2012)[OL]//http:// www. image-net, org/ehallenges/LSVRC/2012/.
9Everingham M,Gool L,Williams C, et al. The pascal visual ob- ject classes (voe) challenge[J]. International Journal of Com- puter Vision, 2010,88(2) : 303-338.
10Carneiro G, Chan A, Moreno P, et al. Supervised Learining of Semantie Classes for Image Annotation and Retrieval[J]. IEEE Transactions on pattern analysis and machine intelligence, 2007, 29(3) : 394-410.

共引文献9

1李丽,郭双双,梅树立,张楠楠.基于特征点提取匹配的蝗虫切片图像的拼接和修复方法[J].农业工程学报,2015,31(7):157-165. 被引量：15
2王建文,林劼.基于颜色直方图金字塔的图像自动标注方法[J].计算机工程,2016,42(6):235-240. 被引量：6
3范馨予,崔晓康.基于稀疏编码的图像自动标注[J].电子技术与软件工程,2017(4):83-84. 被引量：1
4韩毓.移动设备网络安全下人脸终端身份识别仿真[J].计算机仿真,2017,34(10):352-356. 被引量：2
5王威,朱宗玖,陆俊.基于字典学习和局部约束的稀疏表示人脸识别[J].电脑知识与技术,2018,14(2Z):200-202. 被引量：4
6邓曙光,郑智华,敖四芽,黄树新.多阶三角形数据结构的高阶Voronoi图算法研究[J].测绘科学,2019,44(7):35-39. 被引量：1
7谢迎娟,吴宁馨,张卓.基于视频跟踪的水下裂缝缺陷智能标注系统[J].现代电子技术,2020,43(12):155-160. 被引量：3
8曹建芳,赵爱迪,张自邦.融合阈值寻优的卷积神经网络在图像标注中的应用[J].计算机应用,2020,40(6):1587-1592. 被引量：4
9陈奕,董祥梅,朱险峰,田美娜,李永生,苏奎.基于图像分割软件的气胸诊断及图像标注方法[J].网络安全技术与应用,2021(9):137-138. 被引量：1

同被引文献56

1魏良针.基于支持向量机的铁路周边地表沉降变形量预测[J].中国安全生产科学技术,2019,15(S01):90-94. 被引量：5
2曾接贤,祝小超,符祥.一种改进的复杂图像线特征提取方法[J].中国图象图形学报,2010,15(12):1748-1754. 被引量：7
3吴伟,聂建云,高光来.一种基于改进的支持向量机多分类器图像标注方法[J].计算机工程与科学,2015,37(7):1338-1343. 被引量：9
4杨阳,张文生,杨雪冰.基于Dropout深度网络的两步图像标注算法[J].计算机科学与探索,2015,9(12):1494-1505. 被引量：3
5王晓梅,林晓惠,黄鑫.基于特征有效范围的前向特征选择及融合分类算法[J].小型微型计算机系统,2016,37(6):1159-1163. 被引量：8
6黎健成,袁春,宋友.基于卷积神经网络的多标签图像自动标注[J].计算机科学,2016,43(7):41-45. 被引量：20
7臧淼,徐惠民,张永梅.基于距离约束稀疏/组稀疏编码的自动图像标注[J].四川大学学报（工程科学版）,2016,48(5):78-83. 被引量：4
8吕钊,陆雨,周蚌艳,吴小培.基于共同空间模式的扫视信号特征提取算法[J].华中科技大学学报（自然科学版）,2016,44(10):123-127. 被引量：3
9张红斌,姬东鸿,尹兰,任亚峰,牛正雨.基于关键词精化和句法树的商品图像句子标注[J].计算机研究与发展,2016,53(11):2542-2555. 被引量：5
10高耀东,侯凌燕,杨大利.基于多标签学习的卷积神经网络的图像标注方法[J].计算机应用,2017,37(1):228-232. 被引量：20

引证文献7

1张红斌,邱蝶蝶,邬任重,朱涛,滑瑾,姬东鸿.基于极端梯度提升树算法的图像属性标注[J].山东大学学报（工学版）,2019,49(2):8-16. 被引量：4
2姚文婷,江菲飞.数字式多媒体图像连续视觉特征标注仿真研究[J].计算机仿真,2019,36(8):191-194. 被引量：2
3曹建芳,赵爱迪,张自邦.融合阈值寻优的卷积神经网络在图像标注中的应用[J].计算机应用,2020,40(6):1587-1592. 被引量：4
4曾宝国,尹文刚.基于SIFT与SVM的应急救援图像检测方法研究[J].中国安全生产科学技术,2020,16(8):186-192. 被引量：7
5陈彦君,李可大.基于语义标注的中医药数据加工平台[J].自动化技术与应用,2020,39(9):37-40. 被引量：1
6汪理,李光辉,陈吹信.融合显著信息的白色污染图像自动标注算法[J].计算机仿真,2021,38(7):165-169.
7孙春红,丁广太,方坤.基于稀疏字典学习的羊绒与羊毛分类[J].纺织学报,2022,43(4):28-32. 被引量：4

二级引证文献22

1李一民,谭振宇,杨辰,何峰,孟迪,罗菊花,段洪涛.基于多源卫星的滇池藻华提取机器学习算法研究[J].地球科学进展,2022,37(11):1141-1156. 被引量：6
2吴娟,朱跃龙,金松,杨涛,冯钧,吴志勇,薛涛,姜悦美.三种机器学习模型在太湖藻华面积预测中的应用[J].河海大学学报（自然科学版）,2020,48(6):542-551. 被引量：18
3邓晶.基于因子偏离度的GBDT多因子选股模型[J].软件导刊,2021,20(1):109-112.
4胡鹏宇.一种虚拟辅导员APP模式的创新型研究与设计[J].信息记录材料,2021,22(6):79-81. 被引量：1
5汪理,李光辉,陈吹信.融合显著信息的白色污染图像自动标注算法[J].计算机仿真,2021,38(7):165-169.
6张燕,姚江.基于视觉传达的网页界面信息显示系统设计[J].现代电子技术,2022,45(2):125-128. 被引量：4
7杨红云,黄琼,孙爱珍,王映龙,肖小梅,罗建军.基于卷积神经网络和支持向量机的水稻种子图像分类识别[J].中国粮油学报,2021,36(12):144-150. 被引量：15
8谢泗薪,李春华.应急救援情景下航空物流企业社交媒体印象管理策略研究--基于数字化情绪感染视角[J].价格月刊,2022(5):76-88. 被引量：4
9龚向阳,杨跃平,张明达,王思谨,江炯.基于深度残差LSTM的视频异常行为识别算法[J].电子设计工程,2022,30(19):164-168. 被引量：3
10王颖,王志一,黄勇,张海龙.矿区土壤重金属砷含量高光谱反演研究[J].世界核地质科学,2023,40(1):89-97. 被引量：1

1兰丽,耿增民,陈迪.一种基于多核SVM的服装图像自动标注方法[J].北京服装学院学报（自然科学版）,2017,37(2):54-62.
2刘赏,盛家川.基于线条形状和主方向墨色分布特征的中国画画家识别算法[J].模式识别与人工智能,2017,30(10):917-927. 被引量：4
3李世欣,郑睿鹏,郎爱国,毛从吉,丁义行,尹宝娟.核电厂1E级电缆一致性判别方法的研究[J].核安全,2017,16(3):12-17. 被引量：5
4付萌萌.基于Garbor小波和统一LBP算子的图像检索方法研究[J].电子测试,2018,29(11):59-60. 被引量：1
5程春燕.基于字典学习的图像去噪研究[J].电脑知识与技术,2018,14(1Z):164-165. 被引量：1
6张智超,胡轶宁,秦永林,罗立民.基于有序子窗搜索的非局部约束稀疏角度锥束CT重建算法[J].东南大学学报（自然科学版）,2017,47(5):906-912.
7解冰,李海娟.基于小波变换和改进的粒子群的新型图像匹配算法的研究[J].电脑知识与技术,2018,14(4Z):175-178. 被引量：1
8张培.基于交互式图像检索的检索方法研究[J].科技风,2018(27):257-257.
9李强,康子路.基于深度时空特征卷积-池化的视频人群计数方法[J].电信科学,2018,34(6):72-79.

计算机应用

2018年第5期

浏览历史

内容加载中请稍等...

基于多标签判别字典学习的图像自动标注被引量：7

参考文献5

二级参考文献111

共引文献9

同被引文献56

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于多标签判别字典学习的图像自动标注 被引量：7

参考文献5

二级参考文献111

共引文献9

同被引文献56

引证文献7

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于多标签判别字典学习的图像自动标注被引量：7