采用上下文金字塔特征的场景分类被引量：14

Scene Classification with Context Pyramid Features

下载PDF

导出

摘要为了能有效地表述场景图像的语义特性,提出一种基于图像块上下文信息的场景图像分类框架.首先用规则网格将图像分块,并提取每个块的SIFT特征;然后用K均值算法对训练图像的块特征聚类,形成块类型的码本;再根据此码本对图像块进行量化,得到图像的视觉词汇表示,形成视觉词汇图,并在其上建立2类视觉词汇模型:相邻共现的不同视觉词汇对模型和连续共现的相同视觉词汇群模型;最后应用空间金字塔匹配建立视觉词汇的上下文金字塔特征,并采用SVM分类器进行分类.实验结果证明,在常用的场景图像库上,文中方法比已有的典型方法具有更好的场景分类性能. To describe the semantic characteristic of scene images efficiently, this paper proposes a scene image classification framework based on image patch context information. First, the patches of images are got by a regular grid, and their SIFT （scale invariant feature transform） features are extracted. Then the SIFT features of training images are clustered with the K-means algorithm to form a codebook of the patches. We quantize the patches of images according to this codebook and get the visual word representation of the image, which forms a visual word map. In the map, two kinds of visual word models are set up： one is visual word pair with different words and the other is visual word group that consists of the same and consecutive words. Finally by applying spatial pyramid matching, the context pyramid features of visual words are obtained and classified with SVM. Experiments in frequently used scene image databases show that our method has got better performance than the existing typical methods in classifying scene images.

作者江悦王润生王程

机构地区国防科学技术大学电子科学与工程学院ATR国家重点实验室长沙

出处《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1366-1373,共8页 Journal of Computer-Aided Design & Computer Graphics

基金国家自然科学基金(40971245)

关键词场景分类上下文信息空间金字塔匹配图像块 scene classification context information spatial pyramid matching image patch

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1Vailaya A, Figueiredo M, Jain A, et al. Content-based hierarchical classification of vacation images [C]//Proceedings of IEEE International Conference on Multimedia Computing and Systems, Florence, 1999, 1:9518-9523.
2Szummer M, Picard R W. Indoor-outdoor image classification [C] //Proceedings of IEEE International Workshop on Content-Based Access of Image and Video Databases, Bombay, 1998:42-52.
3Oliva A, Torralba A. Modeling the shape of the scene: a holistic representation of the spatial envelope [J]. International Journal of Computer Vision, 2001, 42(3) : 145- 175.
4Carson C, Thomas M, Belongie S, et al. Blobworld: a system for region-based image indexing and retrieval [C] // Proceedings of International Conference on Visual Information Systems, Amsterdam, 1999:660-672.
5Sivic J, Zisserman A. Video Google: a text retrieval approach to object matching in videos [C]//Proceedings of the 9th IEEE International Conference on Computer Vision, Nice, 2003, 2: 1470-1478.
6Lazebnik S, Schmid C, Ponce J. Beyond bags of features: spatial pyramid matching for recognizing natural categories [C]//Proceedings of IEEE Computer Sociely Conference on Computer Vision and Pattern Recognition, New York, 2006:2169-2178.
7Quelhas P, Monay F, Odobez J M, et al. A thousand words in a scene [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(9): 1575-1589.
8Bosch A, Zisserman A, Mufioz X. Scene classification using a hybrid generative/discriminative approach [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(4): 712-727.
9Hofmann T. Unsupervised learning by probabilistic latent semantic analysis [J]. Machine Learning, 2001, 42 (1/2) : 177-196.
10BleiDM, Ng A Y, Jordan M I. Latent Dirichlet allocation [J]. Journal of Machine Learning Research, 2003, 3:993- 1022.

二级参考文献90

1吴洪,卢汉清,马颂德.基于内容图像检索中相关反馈技术的回顾[J].计算机学报,2005,28(12):1969-1979. 被引量：52
2王润生.图像理解[M].长沙:国防科技大学出版社,1994..
3施智平,李清勇,史俊,史忠植.集成视觉特征和语义信息的相关反馈方法[J].计算机辅助设计与图形学学报,2007,19(9):1138-1142. 被引量：4
4Ulaby F, Kouyate F, Brisco B,Williams L.Textural information in SAR images [J]. IEEE Trans Geoscience and Remote Sensing, 1986, GE-24:235 - 245.
5Canny J. A computational approach to edge detection [ J ]. IEEE Trans on Pattern Analysis Machine Intelligence, 1986,8( 11 ) :679 - 698.
6Dainty J. Laser Speckle and Related Phenomena ( Vol. 9 ) [ M ]. New York : Springer-Verlag Berlin Heidelberg, 1975.
7Touzi R, Lopes A, Bousquet P. A statistical and geometrical edge detector for SAR images [J]. IEEE Trans on Geoscience and Remote Sensing, 1988,26(6) :764 - 773.
8Skingley J, Rye A. The Hough transform applied to SAR images for thin line detection [J]. Pattern Recognit Lett, 1987,6(3) :61 - 67.
9Burns B. Extracting straight lines [J] .IEEE Trans Part Anal Machine Intell, 1986, PAMI-8(4) :425 -455.
10Merlet N, Zerubia J. New prospects in line detection by dynamic programming [J]. IEEE Trans Pattern Anal Machine Intell, 1996, 18(4) :426 - 431.

共引文献66

1韩震,金亚秋.星载红外与微波多源遥感数据提取长江口淤泥质潮滩水边线信息[J].自然科学进展,2005,15(8):1000-1006. 被引量：14
2贾晓琳,吴惠思,李爱国,覃征.适用于机场跑道识别的改进H ough变换[J].小型微型计算机系统,2005,26(12):2200-2202. 被引量：5
3李卫斌,田俊华,李宗领.基于改进Canny算子的SAR图像边缘检测[J].咸阳师范学院学报,2006,21(2):40-42. 被引量：2
4曹占辉,李言俊,张科,吴盘龙.一种基于高斯函数的直线型边缘提取算法[J].红外技术,2006,28(4):207-209. 被引量：2
5张小虎,李由,李立春,王鲲鹏,于起峰.一种基于梯度方向直方图的直线轮廓提取新方法[J].光学技术,2006,32(6):824-826. 被引量：13
6梅小明,牛瑞卿,张良培,李平湘.基于Beamlet变换的直线特征提取[J].测绘信息与工程,2006,31(6):38-40. 被引量：1
7张广伟,邓喀中,张永红,余海坤.基于多个极化通道的SAR影像道路探测[J].国土资源遥感,2006,18(4):29-32.
8焦凤萍,罗斌.一种综合的SAR图像边缘检测方法[J].计算机技术与发展,2007,17(1):69-70. 被引量：4
9杨桄,陈克雄,周脉鱼,徐忠林,王宗明.SAR图像中目标的检测和识别研究进展[J].地球物理学进展,2007,22(2):617-621. 被引量：18
10李卫斌,何明一,张顺利.一种新的SAR图像边缘检测算子[J].计算机工程与设计,2007,28(17):4175-4177. 被引量：5

同被引文献173

1吕跃进,李金海.基于一一映射的概念格属性约简算法[J].计算机应用研究,2009,26(3):849-851. 被引量：4
2张文修,魏玲,祁建军.概念格的属性约简理论与方法[J].中国科学（E辑）,2005,35(6):628-639. 被引量：193
3李道国,苗夺谦,张东星,张红云.粒度计算研究综述[J].计算机科学,2005,32(9):1-12. 被引量：54
4刘仁金,黄贤武.图像分割的商空间粒度原理[J].计算机学报,2005,28(10):1680-1685. 被引量：23
5李清勇,胡宏,施智平,史忠植.基于纹理语义特征的图像检索研究[J].计算机学报,2006,29(1):116-123. 被引量：25
6张向荣,谭山,焦李成.基于商空间粒度计算的SAR图像分类[J].计算机学报,2007,30(3):483-490. 被引量：21
7蒋义勇,张继福,张素兰.基于链表结构的概念格渐进式构造[J].计算机工程与应用,2007,43(11):178-180. 被引量：11
8韩东峰,李文辉,郭武.基于潜在局部区域空间关系学习的物体分类算法[J].计算机学报,2007,30(8):1286-1294. 被引量：5
9Oliva A, Torralba A. Modeling the shape of the scene: a holistic representation of the spatial envelope [ J ]. Interna- tional Journal of Computer Vision ,2001,42 (3) : 145-175.
10Siagian C, Itti L. Rapid Biologically-Inspired Scene Clas- sification Using Features Shared with Visual Attention [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29 (2) :300-312.

引证文献14

1胡正平,涂潇蕾.多方向上下文特征结合空间金字塔模型的场景分类[J].信号处理,2011,27(10):1536-1542. 被引量：5
2张素兰,郭平,张继福,胡立华.图像语义自动标注及其粒度分析方法[J].自动化学报,2012,38(5):688-697. 被引量：20
3陈慧中,陈永光,景宁,陈荦,王钧.基于显著区域的月球影像内容特征研究[J].电子学报,2012,40(5):911-919. 被引量：3
4周亮亮.基于概念格的视觉单词约简方法[J].电脑开发与应用,2012,25(9):15-17. 被引量：1
5金泰松,李玲玲,李翠华.基于全局优化策略的场景分类算法[J].模式识别与人工智能,2013,26(5):440-446. 被引量：4
6赵悦,于剑,谢博鋆.结合空间语义信息的图像表示方法[J].计算机科学与探索,2013,7(10):896-904. 被引量：1
7王澍,吕学强,张凯,李卓.基于快速鲁棒特征集合统计特征的图像分类方法[J].计算机应用,2015,35(1):224-230. 被引量：5
8温旭杰,卢辉斌,李强.基于局部语义上下文的场景分类方法[J].燕山大学学报,2014,38(6):551-556.
9张永,王国帅.基于支持区域探测的视觉短语的图像表示方法[J].计算机科学与探索,2015,9(5):629-634.
10闫利,朱睿希,刘异,莫楠.顾及遥感影像场景类别信息的视觉单词优化分类[J].遥感学报,2017,21(2):280-290. 被引量：4

二级引证文献65

1石梵,王超,申祎,张艳,仇星.基于稀疏词典的高分遥感影像震后建筑物检测[J].仪器仪表学报,2020(7):205-213. 被引量：2
2刘中涛,胡凡,王淦,李钊,王磊,葛平高,王建娟.基于特征融合的深度学习场景识别与应用[J].计算机应用研究,2020,37(S01):418-420. 被引量：1
3张瑞杰,郭志刚,李弼程,高毫林.基于E^2LSH-MKL的视觉语义概念检测[J].自动化学报,2012,38(10):1671-1678. 被引量：3
4褚萌,张素兰,张继福.一种新的基于频繁加权概念格的视觉单词生成方法[J].太原科技大学学报,2012,33(6):421-425. 被引量：1
5杜广朝,魏雪峰,邵明省.基于像素基因算法的图像显著区域检测研究[J].激光与红外,2013,43(6):694-697. 被引量：4
6唐勇,杨林,段亮亮.基于图像单元对比度与统计特性的显著性检测[J].自动化学报,2013,39(10):1632-1641. 被引量：6
7马垣.形式概念中的内涵亏值及属性约简[J].模式识别与人工智能,2013,26(12):1096-1105. 被引量：2
8彭太乐,张文俊,丁友东,郭桂芳.基于时序上下文的视频场景分类[J].计算机工程与应用,2014,50(9):103-106. 被引量：2
9王挺进,赵永威,李弼程.N步长距离视觉语言模型的图像分类方法[J].信息工程大学学报,2014,15(4):453-458.
10钟利华,张素兰,胡立华,张继福.基于概念格层次分析的视觉词典生成方法[J].计算机辅助设计与图形学学报,2015,27(1):136-141. 被引量：5

1陈光喜,龚震霆,温佩芝,任夏荔.基于局部抑制线性编码的图像快速识别方法[J].计算机科学,2016,43(5):308-312. 被引量：1
2张立和,潘磊,刘涛,马臣.基于核拉普拉斯稀疏编码的图像分类[J].大连理工大学学报,2015,55(2):192-197. 被引量：2
3章海兵,刘士荣,张波涛,王坚.基于SPM-IBOVW模型的自然场景识别[J].上海交通大学学报,2016,50(6):902-909. 被引量：2
4徐涛,庹红娅,方正,刘力,敬忠良.基于特征筛选的码本区分性增强方法[J].计算机应用研究,2014,31(5):1597-1600.
5付毅,田畅,吴泽民,曾明勇,胡银记.一种快速的全局场景分类算法[J].红外与激光工程,2013,42(S01):242-248. 被引量：1
6高常鑫,桑农.整合局部特征和滤波器特征的空间金字塔匹配模型[J].电子学报,2011,39(9):2034-2038. 被引量：9
7赵嵩,冯湘.一种基于稀疏编码空间金字塔匹配的图像分类算法[J].应用光学,2016,37(5):706-711. 被引量：2
8陈海林,吴秀清.基于双空间金字塔匹配核的图像目标分类[J].中国科学技术大学学报,2010,40(3):313-320. 被引量：3
9周红庆,吴扬扬.中文客户评论对象特征的抽取与聚类方法[J].微型机与应用,2014,33(17):72-75. 被引量：2
10王建文,林劼.基于颜色直方图金字塔的图像自动标注方法[J].计算机工程,2016,42(6):235-240. 被引量：6

计算机辅助设计与图形学学报

2010年第8期

浏览历史

内容加载中请稍等...

采用上下文金字塔特征的场景分类被引量：14

参考文献20

二级参考文献90

共引文献66

同被引文献173

引证文献14

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

采用上下文金字塔特征的场景分类 被引量：14

参考文献20

二级参考文献90

共引文献66

同被引文献173

引证文献14

二级引证文献65

相关作者

相关机构

相关主题

浏览历史

采用上下文金字塔特征的场景分类被引量：14