弱标签环境下基于语义邻域学习的图像标注被引量：4

Image Annotation by Semantic Neighborhood Learning from Weakly Labeled Dataset

下载PDF

导出

摘要图像语义自动标注是实现图像语义检索与管理的关键,是具有挑战性的研究课题.传统的图像标注方法需要具有完整、准确标签的数据集才能取得较好的标注性能.然而,在现实应用中获得数据的标签往往是不准确、不完整的,并且标签分布不均衡.对于Web图像和社会化图像尤其如此.为了更好地利用这些弱标签样本,提出了一种基于语义邻域学习的图像自动标注方法(semantic neighborhood learning from weakly labeled image,SNLWL).首先在邻域标签损失误差最小化意义下,填充训练集样本标签.通过递进式的邻域选择过程,保证建立的语义一致邻域内样本具有全局相似性、部分相关性和语义一致性,并且语义标签分布平衡.在邻域标签重构误差最小化意义下进行标签预测,降低噪声标签对性能的影响.多个数据集上的实验结果表明,与已知的具有较好标注效果的方法相比,此方法更适用于处理弱标签数据集,标准评测集上的测试也表明了此方法的有效性. With the advance of Web technology, image sharing has become much easier than ever before. Automatic image annotation, which can predict relevant labels for images, is becoming more and more important. Traditional image annotation methods usually require a large number of complete, accurate labeled data to obtain good annotation performance. However, since obtaining weak labeled training data is often much easier and costs less efforts than obtaining a large amount of fully labeled training data, image labels are often incomplete and inaccurate in real world environment. In addition, different labels usually have large frequency differences. To effectively harness these weakly labeled images, in this paper, an automatic image annotation approach based on semantic neighborhood learning （SNLWL） is proposed. The missing labels are replenished by minimizing the reweighted error functions on training data. Then, the semantic neighborhood is obtained by a progressive neighborhood construction approach. We incorporate label completeness, global similarity, conceptual similarity, and partly correlation into the stage. In addition, an effective label inference strategy is proposed by minimizing the neighborhood reconstruction error to handle the noise in the labels. Extensive experimental results on different benchmark datasets show that the proposed approach makes a marked improvement as compared with other methods.

作者田枫沈旭昆

机构地区虚拟现实技术与系统国家重点实验室(北京航空航天大学) 东北石油大学计算机与信息技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2014年第8期1821-1832,共12页 Journal of Computer Research and Development

基金国家"八六三"高技术研究发展计划基金项目(2009AA012103) 国家自然科学基金项目(61170132 60533070) 黑龙江省教育厅科学技术研究项目(12511011 12521055) 东北石油大学青年科学基金项目(2013NQ120)

关键词图像标注自动标注弱标签语义邻域邻域学习 learning image annotation automatic annotation weak label semantic neighborhood neighborhood

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1Makadia A, Pavlovic V, Kumar S. A new baseline for image annotation [C] //Proc of the 10th European Conf on Computer Vision. Berlin: Springer, 2008:316-329.
2路晶,马少平.使用基于多例学习的启发式SVM算法的图像自动标注[J].计算机研究与发展,2009,46(5):864-871. 被引量：19
3柯逍,李绍滋,曹冬林.基于相关视觉关键词的图像自动标注方法研究[J].计算机研究与发展,2012,49(4):846-855. 被引量：3
4Nguyen N, Caruana R. Classification with partial labels [C] //Proc of the 14th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2008: 551- 559.
5He Xuming, Zemel R S. Learning hybrid models for image annotation with partially labeled data [C]//Proc of the 22nd Conf on Neural Information Processing Systems. New York: Curran Associates, 2008:625-632.
6Guillaumin M, Mensink T, Verbeek J. Tagprop: Discriminative metric learning in nearest neighbor models for image auto-annotation [C] //Proc of the 12th Int Conf on Computer Vision. Piseataway, NJ: IEEE, 2009.1 309-316.
7Verbeek J, Guillaumin M. Image annotation with TagProp on the MIRFLICKR set [C] //Proc of the 2nd ACM SIGMM Int Conf on Multimedia Information Retrieval. New York: Association for Computing Machinery, 2010 : 537-546.
8Fan Jianping, Shen Yi, Zhou Ning. Harvesting large-scale weakly-tagged image databases from the web [C] //Proe of the 23rd IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE Computer Society, 2010:802-809.
9Bucak S S, Jin Rong. Multi-label learning with incomplete class assignments [C] //Proc of the 24th IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE Computer Society, 2011 : 2801-2808.
10Zhang Shaoting, Huang Junzhou, Huang Yuchi. Automatic image annotation using group sparsity [C] //Proc of the 23rd IEEE Conf on Computer Vision and Pattern Recognition. Piscataway, NJ:IEEE Computer Society, 2010:3312-3319.

二级参考文献35

1路晶,马少平.基于概念索引的图像自动标注[J].计算机研究与发展,2007,44(3):452-459. 被引量：10
2Duygulu P, Barnard K, Freitas J de, et al. Object recognition as machine translation: Learning a lexicon for a fixed image vocabulary [G] //LNCS2353: Proe of ECCV. Berlin: Springer, 2002:97-112 .
3Barnad K, Duygulu P, Fretias N, et al. Matching words and pictures [J]. Journal of Machine Learning Research, 2003, 3:1107-1135
4Jeon J, Lavrenko V, Manmatha R. Automatic image annotation and retrieval using cross-media relevance models [C] //Proc of the 26th Annual Int ACM SIGIR Conf. New York: ACM, 2003:119-126
5Pan J Y, Yang H J, Duygulu P, et al. Automatic image captioning [C]//Proc of the 2004 IEEE Int Conf on Multimedia and Expo (ICME'04). 2004:1987-1990
6Carneiro G, Vaseoncelos N. Formulating semantics image annotation as a supervised learning problem [C]//Proc of IEEE Conf Computer Vision and Pattern Recognition (CVPR'05). Los Alamitos, CA: IEEE Computer Society, 2005 : 163-168
7Dietterich T G, Lathrop R H, Lozano-Perez T. Solving the multiple-instance problem with axis-parallel rectangles [J]. Artificial Intelligence, 1997, 89(1-2): 31-71
8Maron O, Lozano-Perez T. A framework for multipleinstance learning [G]. Advances in Neural Information Processing Systems 11. Cambridge: MIT Press, 1998: 570- 576
9Zhang Q, Goldman S A. EMDD: An improved multipleinstance learning technique [G]. Advances in Neural Information Processing Systems 14. Cambridge, MA: MIT Press, 2002: 1073-1080
10Yang C, Dong M, Fotouhi F. Region bsased image annotation through multiple-instance learning [C] //Proc of ACM Multimedia. New York: ACM, 2005:435-438

共引文献20

1周晓剑,马义中,朱嘉钢.SMO算法的简化及其在非正定核条件下的应用[J].计算机研究与发展,2010,47(11):1962-1969. 被引量：10
2谢书娟.图像自动分类在数字化图书馆中的应用[J].甘肃科技,2011,27(5):91-94. 被引量：1
3刘峥,马军.一种基于图划分和图像搜索引擎的图像标注改善算法[J].计算机研究与发展,2011,48(7):1246-1254. 被引量：4
4柯逍,李绍滋,曹冬林.基于相关视觉关键词的图像自动标注方法研究[J].计算机研究与发展,2012,49(4):846-855. 被引量：3
5柯逍,李东艳,陈国龙.基于词频同现与WordNet的图像自动标注改善算法研究[J].计算机应用研究,2012,29(7):2796-2800. 被引量：1
6蒋黎星,侯进.基于集成分类算法的自动图像标注[J].自动化学报,2012,38(8):1257-1262. 被引量：11
7罗晓燕,欧阳宁,莫建文,李雁.基于MPEG-7和MM混合模型的图像自动标注算法[J].计算机工程与设计,2012,33(12):4707-4710.
8田枫,沈旭昆,刘贤梅.大规模图像语义相关性自动标注[J].计算机辅助设计与图形学学报,2013,25(2):160-166. 被引量：1
9王科平,杨艺,王新良.包空间多示例图像自动分类[J].中国图象图形学报,2013,18(9):1093-1100. 被引量：2
10张志武,阚德涛.基于语义学习的自动图像标注技术研究述评[J].情报学报,2013,32(10):1112-1120. 被引量：2

同被引文献18

1于耀亮,姜嘉言,张立明.一种新的距离测度学习算法[J].信息与电子工程,2008,6(2):115-119. 被引量：3
2卢汉清,刘静.基于图学习的自动图像标注[J].计算机学报,2008,31(9):1629-1639. 被引量：42
3李志欣,施智平,李志清,史忠植.融合语义主题的图像自动标注[J].软件学报,2011,22(4):801-812. 被引量：50
4刘峥,马军.一种基于图划分和图像搜索引擎的图像标注改善算法[J].计算机研究与发展,2011,48(7):1246-1254. 被引量：4
5杨栋,周秀玲,郭平.基于贝叶斯通用背景模型的图像标注[J].自动化学报,2013,39(10):1674-1680. 被引量：9
6赵鹏,王文彬,朱伟伟.融合主题和视觉语义的图像自动标注方法[J].计算机辅助设计与图形学学报,2013,25(11):1709-1714. 被引量：7
7张静,胡微微,陈志华,袁玉波.多模型融合的多标签图像自动标注[J].计算机辅助设计与图形学学报,2014,26(3):472-478. 被引量：10
8邱泽宇,方全,桑基韬,徐常胜.基于区域上下文感知的图像标注[J].计算机学报,2014,37(6):1390-1397. 被引量：12
9田枫,沈旭昆.基于标签集相关性学习的大规模网络图像在线标注[J].自动化学报,2014,40(8):1635-1643. 被引量：6
10金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：36

引证文献4

1张红斌,姬东鸿,尹兰,任亚峰,牛正雨.基于关键词精化和句法树的商品图像句子标注[J].计算机研究与发展,2016,53(11):2542-2555. 被引量：5
2王浩,吕学强,黄跃.基于距离测度学习的AP聚类图像标注[J].计算机工程与应用,2017,53(23):159-164. 被引量：2
3马艳春,刘永坚,解庆,熊盛武,唐伶俐.自动图像标注技术综述[J].计算机研究与发展,2020,57(11):2348-2374. 被引量：7
4韩京宇,陈伟,赵静,郎杭,毛毅.基于异常特征模式的心电数据标签清洗方法[J].计算机研究与发展,2023,60(11):2594-2610.

二级引证文献14

1方佳琦,卢林丽,薛鹏,党乐,朱兰.人工智能应用于宫颈癌筛查的研究现状[J].中华医学杂志,2023,103(46):3783-3791.
2张红斌,殷依,姬东鸿,任亚峰.基于词序列拼积木模型的图像句子标注研究[J].北京理工大学学报,2017,37(11):1144-1149. 被引量：4
3李广丽,刘斌,朱涛,殷依,张红斌.基于优选典型相关分量的跨媒体检索模型[J].山东大学学报（工学版）,2018,48(5):38-46. 被引量：1
4刘闯,陈桂芬.基于密度最大值的K-means初始聚类中心点算法改进[J].数字技术与应用,2017,35(11):118-119. 被引量：4
5张红斌,邱蝶蝶,邬任重,殷依,朱涛,姬东鸿.基于梯度提升决策树与混合型迁移学习的材质属性标注模型[J].中国科技论文,2018,13(20):2378-2387. 被引量：2
6张红斌,邱蝶蝶,邬任重,朱涛,滑瑾,姬东鸿.基于极端梯度提升树算法的图像属性标注[J].山东大学学报（工学版）,2019,49(2):8-16. 被引量：4
7王嘉旭,薛鹏,江宇(综述),乔友林(审校).人工智能在宫颈癌筛查中的应用研究进展[J].中国肿瘤临床,2021,48(9):468-471. 被引量：8
8Xuefei Du,Xuyu Xiang.Research on Prevention of Citrus Anthracnose Based on Image Retrieval Technology[J].Journal of Information Hiding and Privacy Protection,2020,2(1):11-19. 被引量：1
9江杨,于惠芝,高亚,沈昱,毛敏,刘崇梅.AI细胞形态学联合DNA定量分析鉴别良恶性胸腹水的探讨[J].肿瘤防治研究,2023,50(4):390-396. 被引量：2
10刘静,陈金广.基于通道注意力和Transformer的图像标题生成方法[J].计算机与现代化,2023(5):8-12.

1柯逍,周铭柯,牛玉贞.融合深度特征和语义邻域的自动图像标注[J].模式识别与人工智能,2017,30(3):193-203. 被引量：11
2王新颖,吕天阳,王生生,王钲旋,张宇.基于语义邻域的数据降维方法在三维模型检索中的应用[J].大连海事大学学报,2008,34(3):107-110.
3E-Government： Learning from a Success Story[J].通讯和计算机（中英文版）,2012,9(6):625-635.
4欧阳军林,夏利民,文杏梓.结合SML与本体的图像语义自动标注方法[J].小型微型计算机系统,2012,33(9):2109-2112. 被引量：1
5李志欣,施智平,李志清,史忠植.图像检索中语义映射方法综述[J].计算机辅助设计与图形学学报,2008,20(8):1085-1096. 被引量：36
6王宇娇.基于人工智能方法的图像语义检索[J].四川理工学院学报（自然科学版）,2007,20(3):101-104. 被引量：1
7宋广为,刘程军,王庆鹏,叶斌,潘锋.一种新的基于本体论描述的内容图像检索模型[J].信息与控制,2012,41(3):319-325. 被引量：4
8罗敏,王丽娜,张焕国.基于无监督聚类的入侵检测方法[J].电子学报,2003,31(11):1713-1716. 被引量：64
9田枫,沈旭昆.一种适合弱标签数据集的图像语义标注方法[J].软件学报,2013,24(10):2405-2418. 被引量：3
10王飞,钱玉文,王执铨.基于聚类的二次异常入侵检测算法[J].信息网络安全,2010(3):41-43. 被引量：1

计算机研究与发展

2014年第8期

浏览历史

内容加载中请稍等...

弱标签环境下基于语义邻域学习的图像标注被引量：4

参考文献16

二级参考文献35

共引文献20

同被引文献18

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

弱标签环境下基于语义邻域学习的图像标注 被引量：4

参考文献16

二级参考文献35

共引文献20

同被引文献18

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

弱标签环境下基于语义邻域学习的图像标注被引量：4