一种语义级文本协同图像识别方法被引量：7

A collaborative image recognition method based on semantic level of text

下载PDF

导出

摘要为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题.考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法.该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率;最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别.在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率.实验结果表明,文本协同方法能够有效辅助图像识别,具有更好的识别性能. To solve the problem that singular-modal image recognition using only the low-level visual features has low accuracy, considering that many images have embedded-in textual information, a collaborative method using the embedded-in text to aid the recognition of images is proposed. The method includes three steps. Firstly, after localization, segmentation, binarization and feature extraction, semantics of text is gotten. Secondly, the collaborative posterior probability is calculated by extracting visual features of images and counting correlation of visual and textual modals. At last, for each class of images, the joint posterior probability is calculated using the previous two items. A new image is recognized to the class with maximal joint posterior probability. Experiments on the self-built data set of sports video frames showed that the proposed method performed better than the singular-modal method on three different visual features and had higher accuracy.

作者段喜萍刘家锋王建华唐降龙

机构地区哈尔滨工业大学计算机科学与技术学院哈尔滨师范大学计算机科学与信息工程学院黑龙江省高校智能教育与信息工程重点实验室

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2014年第3期49-53,共5页 Journal of Harbin Institute of Technology

基金国家自然科学基金资助项目(61173087 41071262)

关键词文本定位图像识别多模态 text localization image recognition multi-modal

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献14

1PANDA N, CHANG E Y. Efficient top-k hyperplanequery processing for multimedia information retrieval[C]//Proceedings of the 14th annual ACMinternational conference on Multimedia. New York, NY:ACM, 2006: 317-326.
2LU Zhiwu, IP H H S. Image categorization with spatialmismatch kernels[C]//IEEE Conference on ComputerVision and Pattern Recognition. Miami, FL: IEEE,2009: 397-404.
3SONG X,JIAO L C,YANG S,et al. Sparse coding andclassifier ensemble based multi-instance learning forimage categorization [J]. Signal Processing, 2013,93(1) :1-11.
4RUSSELL B C, FREEMAN W T, EFROS A A, et al.Using multiple segmentations to discover objects andtheir extent in image collections [C] //IEEE Conferenceon Computer Vision and Pattern Recognition.Piscataway, NJ; IEEE, 2006: 1605-1614.
5VAILAYA A,FIGUEIREDO MAT,JAIN A K, et al.Image classification for content-based indexing [J].IEEE Transactions on Image Processing, 2001, 10( 1):117-130.
6LI F F,PERONA P. A bayesian hierarchical model forlearning natural scene categories [C] //IEEE ComputerSociety Conference on Computer Vision and PatternRecognition. Piscataway, NJ: IEEE, 2005: 524-531.
7LIU D,CHEN T. Unsupervised image categorization andobject localization using topic models andcorrespondences between images [C] //InternationalConference on Computer Vision. Piscataway. NJ : IEEE,2007: 1-7.
8FERGUS R, PERONA P, ZISSERMAN A. Object classrecognition by unsupervised scale-invariant leaming[C]//IEEE Conference on Computer Vision and PatternRecognition. Piscataway,NJ; IEEE, 2003 : 264-271.
9LIU Y,GOTO S,IKENAGA T. A robust algorithm for textdetection in color images [C] //Proceedings of the EighthInternational Conference on Document Analysis andRecognition. Piscataway, NJ; IEEE, 2005 ; 399-403.
10CHEN Y,WANG J Z. Image categorization by learningand reasoning with regions [J]. The Journal of MachineLearning Research,2004,5( 12) ; 913-939.

二级参考文献25

1Li XR,Chen L,Zhang L,Lin FZ,Ma WY.Image annotation by large-scale content-based image retrieval.In:Nahrstedt K,et al.,ed.Proc.of the 14th ACM Int'l Conf.on Multimedia.Santa Barbara:ACM Press,2006.607-610.
2Wang XJ,Zhang L,Jing F,Ma WY.AnnoSearch:Image auto-annotation by search.In:Hari S,Milind RN,John RS,Yong R,eds.Proc.of the Conf.Image and Video Retrieval.2006.1483-1490.
3Feng HM,Shi R,Chua TS.A bootstrapping framework for annotating and retrieving WEB images.In:Schulzrinne H,et al.,eds.Proc.of the 12th ACM Int'l Conf.on Multimedia.New York:ACM Press,2004.960-967.
4Tseng VS,Su JH,Wang BW,Lin YM.WEB image annotation by fusing visual features and textual information.In:Proc.of the 2007 ACM Symp.on Applied Computing,Symposium on Applied Computing.New York:ACM Press,2007.1056-1060.
5Mori Y,Takahashi H,Oka R.Image-to-word transformation based on dividing and vector quantizing images with words.In:Proc.of the 1st Int'l Workshop on Multimedia Intelligent Storage and Retrieval Management.1999.
6Duygulu P,Barnard K,de Freitas JFG,Forsyth DA.Object recognition as machine translation:Learning a lexicon for a fixed image vocabulary.In:Proc.of the European Conf.on Computer Vision.2002.97-112.
7Blei D,Jordan M.Modeling annotated data.In:Proc.of the Int'l ACM SIGIR.Toronto:ACM Press,2003.127-134.
8Jeon J,Lavrenko V,Manmatha R.Automatic image annotation and retrieval using cross-media relevance models.In:Proc.of the Int'l ACM SIGIR.Toronto:ACM Press,2003.119-126.
9Li J,Wang J.Automatic linguistic indexing of pictures by a statistical modeling approach.IEEE Trans.on Pattern Analysis and Machine Intelligence,2003,25(19):1075-1088.
10E.Chang,G.Kingshy,G.Sychay,and G.Wu.Cbsa:Content-Based soft annotation for multimodal image retrieval using Bayes point machines.IEEE Trans.on CSVT,2003,13(1):26-38.

共引文献14

1孙君顶,杜娟.图像自动语义标注技术综述[J].计算机系统应用,2012,21(7):258-261. 被引量：3
2蒋黎星,侯进.基于集成分类算法的自动图像标注[J].自动化学报,2012,38(8):1257-1262. 被引量：11
3陈叶旺,钟必能,王靖,李海波.一种基于本体与描述文本的网络图像语义标注方法[J].计算机科学,2012,39(B06):293-299. 被引量：4
4俞建松,曹冬林,李绍滋,林达真.基于互联网搜索与反馈验证的图像自动标注[J].计算机工程,2012,38(24):211-215. 被引量：1
5张志武,阚德涛.基于语义学习的自动图像标注技术研究述评[J].情报学报,2013,32(10):1112-1120. 被引量：2
6郭海凤,张盈盈,李广水,韩立新.基于社会网络的图像语义获取研究综述[J].计算机与现代化,2014(1):126-131.
7王柠,刘国华.含有不希望出现句子的网页鉴别问题[J].小型微型计算机系统,2014,35(6):1232-1238.
8吴伟,高光来,聂建云.一种融合语义距离的最近邻图像标注方法[J].计算机科学,2015,42(1):297-302. 被引量：5
9杨阳,张文生.基于深度学习的图像自动标注算法[J].数据采集与处理,2015,30(1):88-98. 被引量：26
10吴伟,聂建云,高光来.一种基于改进的支持向量机多分类器图像标注方法[J].计算机工程与科学,2015,37(7):1338-1343. 被引量：9

同被引文献31

1周加涛,邓文怡,刘力双.一种基于视觉测量技术的复杂工件检测系统[J].北京信息科技大学学报,2010(3):34-37.
2张昱,陈光黎.基于最小二乘支持向量机的机器视觉识别方法[J].测控技术,2011,30(7):97-100. 被引量：11
3张建中,何永义,李军.机器人装配视觉定位应用研究[J].机电工程,2011,28(8):934-937. 被引量：25
4张旭苹,汪家其,张益昕,王顺,谢飞.大尺度三维几何尺寸立体视觉测量系统实现[J].光学学报,2012,32(3):140-147. 被引量：56
5杜友田,李谦,周亚东,吴陈鹤.基于异质信息融合的网络图像半监督学习方法[J].自动化学报,2012,38(12):1923-1932. 被引量：3
6王鹏,王婧,杜卫东.基于模糊理论的焊缝缺陷图像识别算法研究[J].科学技术与工程,2013,21(19):5520-5523. 被引量：3
7申晓霞,张桦,高赞,徐光平,薛彦兵,张哲.基于深度信息和RGB图像的行为识别算法[J].模式识别与人工智能,2013,26(8):722-728. 被引量：16
8杨眉,魏鸿磊,华顺刚.一种基于神经网络的扇贝图像识别方法[J].大连海洋大学学报,2014,29(1):70-74. 被引量：14
9丁兆云,贾焰,周斌.微博数据挖掘研究综述[J].计算机研究与发展,2014,51(4):691-706. 被引量：120
10罗会兰,郭敏杰,孔繁胜.集成多特征与稀疏编码的图像分类方法[J].模式识别与人工智能,2014,27(4):345-355. 被引量：7

引证文献7

1郑魁敬,潘春莹,许斐.机器人装配中的视觉引导定位技术研究[J].制造技术与机床,2016(3):84-90. 被引量：8
2郭继昌,王楠,张帆.基于多描述子分层特征学习的图像分类[J].哈尔滨工业大学学报,2016,48(11):83-89. 被引量：3
3董素鸽,胡代弟.显示图像复杂目标优化识别仿真研究[J].计算机仿真,2017,34(5):453-456. 被引量：3
4王琦.气象预报中阴雨雾图像优化识别仿真[J].计算机仿真,2017,34(7):422-425.
5胡慧君,刘亚,刘茂福,顾进广,吴黎兵.面向微博图文关系识别的统一特征空间映射方法[J].武汉大学学报（理学版）,2017,63(5):448-452. 被引量：2
6程鲁玉,孟小艳,达新民.关于果林中果害虫图像特征高效分类识别仿真[J].计算机仿真,2018,35(2):425-428. 被引量：8
7王汉其,肖曙红.基于视觉与位置检测的机器人定位矫正系统研究[J].制造业自动化,2019,41(5):42-45.

二级引证文献23

1王琳.主体参与扎实训练──第八册《基础训练7》教学设计[J].小学语文教学,2000(6):56-56.
2王文萍,刘桂雄.面向机箱标准件装配质量的KB-BBT结构机器评价系统[J].中国测试,2017,43(6):99-102. 被引量：1
3周菁.基于视觉的机器人自主泊位系统研究[J].舰船电子工程,2017,37(6):29-32.
4雷焕宇,刘伟铭.基于K-means算法的地铁站台异物检测[J].计算机与现代化,2018(6):42-46. 被引量：5
5袁文礼.机器人装配中的视觉引导定位技术分析[J].科技与创新,2017(10):55-55. 被引量：5
6杨楚皙,赵岩,王世刚,李鹤楠.小波变换下的特征匹配图像编码[J].哈尔滨工程大学学报,2018,39(11):1816-1822. 被引量：2
7王汉其,肖曙红.基于视觉与位置检测的机器人定位矫正系统研究[J].制造业自动化,2019,41(5):42-45.
8许志强,张婷.数字式多媒体场景图像准确分类方法仿真[J].计算机仿真,2019,36(7):385-388. 被引量：1
9张博,张苗辉,陈运忠.基于空间金字塔池化和深度卷积神经网络的作物害虫识别[J].农业工程学报,2019,35(19):209-215. 被引量：48
10李睿,章宇辉.深度强化学习的图像特征高效分类方法仿真[J].计算机仿真,2020,37(1):377-380. 被引量：1

1曹昌盛,徐磊,赖林光.基于ADSP-BF561的智能视频分析前端的设计与实现[J].中国科技信息,2013(24):128-130.
2于进,钱锋.基于粒子群优化的高斯核函数聚类算法[J].计算机工程,2010,36(14):22-23. 被引量：10
3滕军,卢伟.基于支持度的加速度传感器布置方法[J].深圳土木与建筑,2008(3):28-30.
4梁发云,陈志文,王婧,施建盛,何辉.基于FFmpeg的立体视频播放技术研究[J].电视技术,2013,37(11):27-29. 被引量：2
5赵丽娜,韩冬梅,薛华成.一种有效加密MP4文件的方法[J].计算机应用与软件,2012,29(10):22-24.
6赵寒冰,李加林,曾志远.计算机辅助图像分类信息挖掘与应用探讨[J].计算机应用研究,2005,22(4):236-238. 被引量：2
7陈欣.Photoshop辅助工具拓展“三原色示意图”绘制新方法[J].煤炭技术,2010,29(6):192-193. 被引量：1
8颜雪松,蔡之华.一种基于图像的关联规则发现算法的研究[J].计算机工程与应用,2003,39(2):209-211. 被引量：6
9程庆敏,付思瑞.POS辅助图像定位[J].电光与控制,2015,22(5):77-79. 被引量：1
10刘洪见,郑丽敏.计算机辅助图像识别应用中颜色特征的表征和提取[J].浙江亚热带作物通讯,2007,29(1):44-48.

哈尔滨工业大学学报

2014年第3期

浏览历史

内容加载中请稍等...

一种语义级文本协同图像识别方法被引量：7

参考文献14

二级参考文献25

共引文献14

同被引文献31

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种语义级文本协同图像识别方法 被引量：7

参考文献14

二级参考文献25

共引文献14

同被引文献31

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

一种语义级文本协同图像识别方法被引量：7