融合语义主题的图像自动标注被引量：50

Automatic Image Annotation by Fusing Semantic Topics

下载PDF

导出

摘要由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计一个概率模型分别从视觉模态和文本模态中捕获潜在语义主题,并提出一种自适应的不对称学习方法融合两种语义主题.对于每个图像文档,它在各个模态上的主题分布通过加权进行融合,而权值由该文档的视觉词分布的熵值来确定.于是,融合之后的概率模型适当地关联了视觉模态和文本模态的信息,因此能够很好地预测未知图像的语义标注.在一个通用的Corel图像数据集上,将提出的方法与几种前沿的图像标注方法进行了比较.实验结果表明,该方法具有更好的标注和检索性能. Automatic image annotation has become an important issue,due to the existence of a semantic gap.Based on probabilistic latent semantic analysis（PLSA）,this paper presents an approach to annotate and retrieve images by fusing semantic topics.First,in order to precisely model training data,each image is represented as a bag of visual words.Then,a probabilistic model is designed to capture latent semantic topics from visual and textual modalities,respectively.Furthermore,an adaptive asymmetric learning approach is proposed to fuse these semantic topics.For each image document,the topic distribution of each modality is fused by multiplying different weights,which is determined by the entropy of the distribution of visual words.Consequently,the probabilistic model can predict semantic annotations for an unseen image because it associates visual and textual modalities properly.This approach is compared with several other state-of-the-art approaches on a standard Corel dataset.The experimental results show that this approach performs more effectively and accurately.

作者李志欣施智平李志清史忠植

机构地区中国科学院计算技术研究所智能信息处理重点实验室中国科学院研究生院

出处《软件学报》 EI CSCD 北大核心 2011年第4期801-812,共12页 Journal of Software

基金国家自然科学基金(60933004 60903141 60805041) 国家重点基础研究发展计划(973)(2007CB311004)

关键词图像自动标注主题模型概率潜语义分析自适应不对称学习图像检索 automatic image annotation topic model probabilistic latent semantic analysis adaptive asymmetric learning image retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李志欣,施智平,李志清,史忠植.图像检索中语义映射方法综述[J].计算机辅助设计与图形学学报,2008,20(8):1085-1096. 被引量：36

二级参考文献78

1吴洪,卢汉清,马颂德.基于内容图像检索中相关反馈技术的回顾[J].计算机学报,2005,28(12):1969-1979. 被引量：52
2施智平,李清勇,史俊,史忠植.集成视觉特征和语义信息的相关反馈方法[J].计算机辅助设计与图形学学报,2007,19(9):1138-1142. 被引量：4
3Vasconcelos N. Minimum probability of error image retrieval[J]. IEEE Transactions on Signal Processing, 2004, 52(8): 2322-2336
4Rasiwasia N, Moreno P J, Vasconcelos N. Bridging the gap: query by semantic example [J].IEEE Transactions on Multimedia, 2007, 9(5):923-938
5Goh K S, Chang E, Cheng K T. SVM binary classifier ensembles for image classification [C]//Proceedings of the 10th International Conference on Information and Knowledge Management, Atlanta, 2001:395-402
6Cusano C, Ciocca G, Schettini R. Image annotation using SVM [C]//Proceedings of SPIE, San Jose, 2004, 5304:330 -338
7Gao Y L, Fan J P, Xue X Y, et al. Automatic image annotation by incorporating feature hierarchy and boosting to scale up SVM classifiers [C] //Proceedings of the 14th ACM International Conference on Multimedia, Santa Barbara, 2006:901-910
8Chang E, Goh K, Sychay G, et al. CBSA: content-based soft annotation for multimodal image retrieval using Bayes point machines [J]. IEEE Transactions on Circuits and Systems for Video Technology, 2003, 13(1):26-38
9Town C, Sinclair D. Content based image retrieval using semantic visual categories [ R].Cambridge: AT&T Laboratories, 2001
10Li J, Wang J Z. Automatic linguistic indexing of pictures by a statistical modeling approach [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25 (9): 1075-1088

共引文献35

1刘毅.一种图像局部特征的语义提取方法[J].计算机工程与科学,2010,32(6):61-64. 被引量：1
2王守觉,孙华,柳培忠,廖英豪,丁兴号,郭东辉.基于仿生形象思维方法的图像检索算法[J].电子学报,2010,38(5):993-997. 被引量：8
3江悦,王润生,王程.采用上下文金字塔特征的场景分类[J].计算机辅助设计与图形学学报,2010,22(8):1366-1373. 被引量：14
4李志欣,施智平,刘曦,史忠植.建模连续视觉特征的图像语义标注方法[J].计算机辅助设计与图形学学报,2010,22(8):1412-1420. 被引量：9
5杨丹,李博,赵红.鲁棒视觉词汇本的自适应构造与自然场景分类应用[J].电子与信息学报,2010,32(9):2139-2144. 被引量：3
6时慧琨.一种利用用户反馈日志获取图像语义标注方法[J].通化师范学院学报,2010,31(12):40-41.
7柳培忠,王守觉.利用多维空间同源连续性的图像检索[J].应用科学学报,2011,29(2):153-158.
8黄文宇,覃团发,唐振华.基于模糊支持向量机的面向语义图像检索算法[J].计算机应用研究,2011,28(5):1987-1990. 被引量：8
9朱佳丽,李士进,万定生,冯钧.基于特征选择和半监督学习的遥感图像检索[J].中国图象图形学报,2011,16(8):1474-1482. 被引量：8
10赵可心,宋立新.一种基于语义模型的乳腺钙化病灶标注方法[J].生物医学工程学杂志,2012,29(1):160-163.

同被引文献443

1魏勇刚,张国春,常勇,袁方.基于词性分析和领域知识的Deep Web语义标注[J].郑州大学学报（理学版）,2009,41(1):52-55. 被引量：7
2陆江锋,单春芳,洪小龙,裘正军.基于数字图像的茶叶形状特征提取及不同茶叶鉴别研究[J].茶叶科学,2010,30(6):453-457. 被引量：15
3黄昌宁,童翔.汉语真实文本的语义自动标注[J].语言文字应用,1993(4):18-25. 被引量：7
4纪传俊,刘作涛,产文,周向东.一个基于语义上下文建模的图像自动标注系统[J].计算机研究与发展,2011,48(S3):441-445. 被引量：2
5余正涛,樊孝忠,康海燕.基于自然语言理解的受限领域自动应答系统[J].计算机工程,2004,30(18):35-37. 被引量：10
6王崇骏,杨育彬,陈世福.基于高层语义的图像检索算法[J].软件学报,2004,15(10):1461-1469. 被引量：20
7田波平,孙秋梅,廖庆喜,张国忠.6CZZ-600型针形名优茶做形机及成型工艺优化[J].农业工程学报,2005,21(4):65-68. 被引量：12
8施智平,胡宏,李清勇,史忠植,段禅伦.基于纹理谱描述子的图像检索[J].软件学报,2005,16(6):1039-1045. 被引量：44
9韩彦芳,施鹏飞.基于数字图像处理的表面缺损检测技术[J].测控技术,2005,24(9):15-18. 被引量：18
10杨立,左春,王裕国.基于语义距离的K-最近邻分类方法[J].软件学报,2005,16(12):2054-2062. 被引量：31

引证文献50

1蒙祖强,史忠植.基于相容粒度空间模型的自适应图像语义分类方法[J].高技术通讯,2012,22(7):697-705. 被引量：2
2惠晓威,吴凡.基于二叉树SVM的图像标注与改善方法研究[J].计算机应用与软件,2012,29(10):184-187.
3邓小玲,倪江群,代芬,李震.基于LLOM的单目图像深度图估计算法[J].计算机应用研究,2012,29(11):4357-4359. 被引量：2
4罗晓燕,欧阳宁,莫建文,李雁.基于MPEG-7和MM混合模型的图像自动标注算法[J].计算机工程与设计,2012,33(12):4707-4710.
5李志欣,陈宏朝,吴璟莉,周生明.基于概率主题建模的图像语义学习与检索[J].广西师范大学学报（自然科学版）,2012,30(3):125-134. 被引量：3
6王云英.基于PLSA模型的Web页面语义标注算法研究[J].情报杂志,2013,32(1):141-144. 被引量：5
7李志欣,施智平,陈宏朝,吴璟莉.基于语义学习的图像多模态检索[J].计算机工程,2013,39(3):258-263. 被引量：6
8曹永锋,陈荣,孙洪.基于BvSBHC的主动学习多类分类算法[J].计算机科学,2013,40(8):309-312. 被引量：3
9谢昭,凌然,吴克伟.独立子空间中的场景特征增量学习方法[J].计算机研究与发展,2013,50(11):2287-2294.
10赵鹏,王文彬,朱伟伟.融合主题和视觉语义的图像自动标注方法[J].计算机辅助设计与图形学学报,2013,25(11):1709-1714. 被引量：7

二级引证文献138

1王铁君,王维兰.基于本体的唐卡图像标注方法[J].吉林大学学报（工学版）,2020,50(1):289-296. 被引量：2
2宁业衍,方宇,杨皓,杭观荣,陶翰中,张汝枭.基于距离判断函数的钢轨扣件分割方法[J].智能计算机与应用,2021,11(11):64-67. 被引量：1
3姚辉煌.氧化铅精矿压滤脱水的改进[J].世界有色金属,2000,25(4):42-43.
4刘巍,王峰.基于多维特征向量的图像检索技术研究[J].中国科技信息,2013(17):73-73. 被引量：1
5龙钧宇,邓绯.基于高维特征检索智能算法的图像检索技术的研究[J].科技通报,2013,29(11):102-105.
6黄卫东,陈凌云,吴美蓉.网络舆情话题情感演化研究[J].情报杂志,2014,33(1):102-107. 被引量：34
7李丽,郭双双,梅树立,张楠楠.基于特征点提取匹配的蝗虫切片图像的拼接和修复方法[J].农业工程学报,2015,31(7):157-165. 被引量：15
8郭少友,窦畅,常桢.网页语义标注研究综述[J].情报杂志,2015,34(4):169-175. 被引量：5
9夏利民,刘涛,肖永良.基于视觉注意力模型的高速铁路轨道病害检测[J].信息与控制,2015,44(3):353-358. 被引量：2
10李志欣,李灵芝,张灿龙.基于模糊关联规则和决策树的图像自动标注[J].智能系统学报,2015,10(4):636-644. 被引量：1

1张宇,袁野,王国仁.一个基于概率潜语义分析的多模态多媒体检索模型[J].小型微型计算机系统,2015,36(8):1665-1670. 被引量：5
2田东平,李乃乾.基于上下文相关模型的图像语义标注[J].小型微型计算机系统,2016,37(4):855-860. 被引量：1
3刘建伟,刘媛,罗雄麟.用于社区检测的加权非负矩阵三因式分解[J].计算机工程与设计,2014,35(12):4284-4288.
4郭克冰,仇伟涛,时萌悦,范家铭.基于Radon变换的非纯文本图像倾斜校正[J].福建电脑,2015,31(10):102-103. 被引量：2
5orangeye.从Office 2003的图片中抠出文字[J].网友世界,2008(18):35-35.
6滕敏.把图片中的文字“抠”出来[J].家电检修技术（办公版）,2006(12):44-44.
7周勇生.巧用Photoshop速成特效字[J].家庭电脑世界,2000(7):32-34.
8李志欣,施智平,刘曦,史忠植.建模连续视觉特征的图像语义标注方法[J].计算机辅助设计与图形学学报,2010,22(8):1412-1420. 被引量：9
9黄文博,燕杨,李博.一种融合PLSA模型和树模型的文本病历语义分析新方法[J].吉林大学学报（理学版）,2013,51(4):666-670.
10李谦,杜友田,薛姣.基于异构信息双向传播的网络视频分类方法[J].计算机应用,2013,33(8):2293-2296. 被引量：1

软件学报

2011年第4期

浏览历史

内容加载中请稍等...

融合语义主题的图像自动标注被引量：50

参考文献1

二级参考文献78

共引文献35

同被引文献443

引证文献50

二级引证文献138

相关作者

相关机构

相关主题

浏览历史

融合语义主题的图像自动标注 被引量：50

参考文献1

二级参考文献78

共引文献35

同被引文献443

引证文献50

二级引证文献138

相关作者

相关机构

相关主题

浏览历史

融合语义主题的图像自动标注被引量：50