基于距离约束稀疏/组稀疏编码的自动图像标注被引量：4

Distance Constraint Sparse/Group Sparse Coding for Automatic Image Labeling

下载PDF

导出

摘要为解决图像自动标注中的语义鸿沟问题,有效选择并利用图像特征,提出基于距离约束稀疏/组稀疏编码(distance constraint sparse/group sparse coding,DCSC/DCGSC)的2种特征选择算法,并分别应用到图像自动标注任务中。考虑到不同特征基相似性对图像语义相似性的贡献不同,定义了度量二者相关性的距离约束正则项。将该正则项分别集成到稀疏/组稀疏编码的特征选择模型中,使选择的特征在保证稀疏性/组稀疏性的同时,优先选择与语义相似性描述最接近的视觉特征基。利用在训练图像集中学习的特征权值,寻找测试图像的K最近邻(Knearest neighbor,KNN)图像,并通过标签转移实现图像标注。在Corel5K图像库上测试标注性能,集成多特征的DCGSC查准率、查全率和标注正确的关键词个数可达32%、34%和151,优于其他相关标注算法。而对于单特征图像,使用DCSC也能改善标注性能。可见,距离约束对特征选择和图像标注是有效的。 In order to bridge the semantic gap in automatic image labeling, and effectively leverage image features, two feature selection algorithms based on distance constraint sparse/group sparse coding （DCSC/DCGSC） were presented to solve the problem of image se- mantic labeling. Considering that feature atoms similarity may have different contribution to the serhantie similarity between images, a distance constraint regularization was defined and integrated with sparse/group sparse coding for feature selection, which encourages the feature atoms with sparsity/group sparsity and more Similar to the semantic discrimination to be enforced. Given a test image, the K-Nea- rest Neighbors （KNN） can be found using the learned feature weights from the training images and labels can be transfered. Experimental results on Corel5K showed that DCGSC outperforms other related method with the average precision of 32% , average recall of 34% , and the numbers of total labels recalled of 151. For images represented with single type of feature, DCSC also helps to improve the annotation performance, which validates the effectivity of distance constraint for image labeling.

作者臧淼徐惠民张永梅

机构地区北京邮电大学信息与通信工程学院北方工业大学电子与信息工程学院北方工业大学计算机学院

出处《四川大学学报（工程科学版）》 EI CAS CSCD 北大核心 2016年第5期78-83,共6页 Journal of Sichuan University (Engineering Science Edition)

基金国家自然科学基金资助项目(61371143) 北京市自然科学基金资助项目(4132026) 北京市教委科研计划面上项目资助(KM201410009006)

关键词自动图像标注距离约束稀疏编码组稀疏编码特征选择 K最近邻 automatic image labeling distance constraint sparse coding group sparse coding feature selection K-nearest neighbor

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1Chang E, Goh K, Sychay G, et al. CBSA: Content-based soft annotation for multimodal image retrieval using hayes point machines [ J]. IEEE Transactions on Circuits and Systems for Video Technology,2003,13 ( 1 ) :26 - 38.
2Cusano C, Ciocca G, Schettini R. Image annotation using SVM[ C]//International Society for Optics and Photon- ics. San Jose : SPIE ,2003:330 - 338.
3Carneiro G, Chan A B, MorenoP J,et al. Supervised learn- ing of semantic classes for image annotation and retrieval [ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence ,2007,29 (3) :394 - 410.
4Duygulu P,Barnard K,Freitas J F G, et al. Object recog- nition as machine translation: Laming a lexicon for a fixed image vocabulary[C]//Proceedings of the European Conference on Computer Vision--Part IV. Berlin: Spring- er-Verlag, 2002 : 97 - 112.
5Feng S L, Manmatha R, Lavrenko V. Multiple bernoulli relevance models for image and video annotation [ C ]/! Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE ,2004 : 1002 - 1009.
6Carneiro G, Chan A B, Moreno P J, et al. Supervised learning of semantic classes for image annotation and re- trieval[ J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007,29 ( 3 ) : 394 - 410.
7. Makadia A,Pavlovic V,Kumar S. A new baseline for im- age annotation[C]//Proceedings of the European Confer- ence on Computer Vision. Berlin: Springer, 2008, 5304 (3) :316 -329.
8Guillaumin M,Mensink M,Verbeek J,et al. Tagprop- Dis- criminative metric learning in nearest neighbor models for image auto-annotation[ C]//Proceedings of the IEEE In- ternational Conference on Computer Vision. New York: IEEE ,2009:309 - 316.
9Wang Mei ,Li Feng,Wang Meng. Collaborative visual mod- eling for automatic image annotatto "via sparse model coding[ J]. Nerocomputing,2012,95 (14) :22 - 28.
10Zhang Wenbo, Tian Dongpng, Hu Hong, et al. Automatic image annotation via local sparse coding[ C]//Proceed- ings of the IEEE International Conference on Acoustics, Speech, and Signal Processing. New York: IEEE, 2013: 1661 - 1665.

共引文献4

1何秉钧,蒋鸣飞,罗欣,王蓉.噪声抑制的高光谱图像虚拟维数分析[J].四川大学学报（自然科学版）,2017,54(2):303-308. 被引量：1
2李楠宇,柳翠寅.射电日像仪的压缩感知和脏图高斯去噪[J].四川大学学报（自然科学版）,2019,56(6):1073-1080. 被引量：3
3卿粼波,吴梦凡,刘刚,刘晓,何小海,任超.基于小波域ADMM深度网络的图像复原算法[J].工程科学与技术,2022,54(5):257-267. 被引量：1
4杨帅,吴晓红,KARN Pradeep,何小海.一种基于分块的虹膜识别方法[J].四川大学学报（工程科学版）,2016,48(S1):150-156. 被引量：1

同被引文献21

1温超,耿国华.基于内容图像检索中的“语义鸿沟”问题[J].西北大学学报（自然科学版）,2005,35(5):536-540. 被引量：16
2鲍泓,徐光美,冯松鹤,须德.自动图像标注技术研究进展[J].计算机科学,2011,38(7):35-40. 被引量：21
3宋相法,焦李成.基于稀疏编码和集成学习的多示例多标记图像分类方法[J].电子与信息学报,2013,35(3):622-626. 被引量：14
4吴伟,高光来,聂建云.一种融合语义距离的最近邻图像标注方法[J].计算机科学,2015,42(1):297-302. 被引量：5
5吴伟,聂建云,高光来.一种基于改进的支持向量机多分类器图像标注方法[J].计算机工程与科学,2015,37(7):1338-1343. 被引量：9
6刘建伟,崔立鹏,刘泽宇,罗雄麟.正则化稀疏模型[J].计算机学报,2015,38(7):1307-1325. 被引量：62
7杨阳,张文生,杨雪冰.基于Dropout深度网络的两步图像标注算法[J].计算机科学与探索,2015,9(12):1494-1505. 被引量：3
8黎健成,袁春,宋友.基于卷积神经网络的多标签图像自动标注[J].计算机科学,2016,43(7):41-45. 被引量：20
9刘梦迪,陈燕俐,陈蕾.图像自动标注技术研究进展[J].计算机应用,2016,36(8):2274-2281. 被引量：3
10吴寿昆,郭玉堂.基于Voronoi K阶邻近图的半监督学习自动图像标注[J].计算机应用与软件,2016,33(12):183-187. 被引量：2

引证文献4

1范馨予,崔晓康.基于稀疏编码的图像自动标注[J].电子技术与软件工程,2017(4):83-84. 被引量：1
2杨晓玲,李志清,刘雨桐.基于多标签判别字典学习的图像自动标注[J].计算机应用,2018,38(5):1294-1298. 被引量：7
3王威,朱宗玖,陆俊.基于字典学习和局部约束的稀疏表示人脸识别[J].电脑知识与技术,2018,14(2Z):200-202. 被引量：4
4曹建芳,赵爱迪,张自邦.融合阈值寻优的卷积神经网络在图像标注中的应用[J].计算机应用,2020,40(6):1587-1592. 被引量：2

二级引证文献14

1朱沈.参七白黄散治疗消化性溃疡[J].河南中医,2000,20(3):30-30.
2杨晓玲,李志清,刘雨桐.基于多标签判别字典学习的图像自动标注[J].计算机应用,2018,38(5):1294-1298. 被引量：7
3张红斌,邱蝶蝶,邬任重,朱涛,滑瑾,姬东鸿.基于极端梯度提升树算法的图像属性标注[J].山东大学学报（工学版）,2019,49(2):8-16. 被引量：4
4姚文婷,江菲飞.数字式多媒体图像连续视觉特征标注仿真研究[J].计算机仿真,2019,36(8):191-194. 被引量：2
5曹建芳,赵爱迪,张自邦.融合阈值寻优的卷积神经网络在图像标注中的应用[J].计算机应用,2020,40(6):1587-1592. 被引量：2
6曾宝国,尹文刚.基于SIFT与SVM的应急救援图像检测方法研究[J].中国安全生产科学技术,2020,16(8):186-192. 被引量：5
7陈彦君,李可大.基于语义标注的中医药数据加工平台[J].自动化技术与应用,2020,39(9):37-40. 被引量：1
8狄岚,矫慧文,梁久祯.融合字典学习的小样本人脸鉴别[J].小型微型计算机系统,2021,42(1):154-160.
9张健,米建勋.鲁棒可预测判别字典学习人脸识别方法[J].计算机应用研究,2021,38(4):1245-1249.
10狄岚,矫慧文,梁久祯.稀疏综合字典学习的小样本人脸识别[J].智能系统学报,2021,16(2):218-227. 被引量：2

1黄劲,孙洋,徐浩然.稀疏编码(Sparse coding)在图像检索中的应用[J].数字技术与应用,2013,31(11):76-77. 被引量：3
2陈旭辉,秦月霜.拓频地震数据应用于地震反演中存在的问题[J].内蒙古石油化工,2008,34(10):104-105.
3XIE Yining,HUANG Jinjie,HE Yongjun.One Dictionary vs. Two Dictionaries in Sparse Coding Based Denoising[J].Chinese Journal of Electronics,2017,26(2):367-371. 被引量：3
4刘峰,吴瑞红,徐川,吕学强.专利文献中关键词抽取方法的改进[J].情报杂志,2014,33(12):36-40. 被引量：5
5田泽宇,门朝光,汤亚楠,蒋庆丰.应用全方向形状特征码的图像检索方法[J].哈尔滨工业大学学报,2016,48(11):129-134. 被引量：2
6谢飞,吴信东,胡学钢,李星华,江兆中.基于语义联系的新闻网页关键词抽取[J].广西师范大学学报（自然科学版）,2009,27(1):145-148. 被引量：10
7邱德红,潘昕昕,陈传波.基于多尺度序列谱核半定规划优化的签名认证方法[J].电子学报,2008,36(B12):44-49.
8李利正,黄煜栋,陈平生.正则化双阶线性稀疏编码在人脸识别中的应用[J].计算机应用与软件,2014,31(11):222-224.
9徐慧,冯雪晴,施磊磊,朱玉婷.基于影响力扩散内容模型的舆论领袖识别方法[J].软件导刊,2016,15(3):9-11. 被引量：2
10战宇,潘海为,韩启龙,谢晓芹,张志强,吴枰.一种运用图熵的医学图像聚类方法[J].小型微型计算机系统,2016,37(7):1594-1599. 被引量：3

四川大学学报（工程科学版）

2016年第5期

浏览历史

内容加载中请稍等...

基于距离约束稀疏/组稀疏编码的自动图像标注被引量：4

参考文献18

共引文献4

同被引文献21

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于距离约束稀疏/组稀疏编码的自动图像标注 被引量：4

参考文献18

共引文献4

同被引文献21

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于距离约束稀疏/组稀疏编码的自动图像标注被引量：4