图像物体分类与检测算法综述被引量：188

A Review on Image Object Classification and Detection

下载PDF

导出

摘要图像物体分类与检测是计算机视觉研究中的两个重要的基本问题,也是图像分割、物体跟踪、行为分析等其他高层视觉任务的基础.该文从物体分类与检测问题的基本定义出发,首先从实例、类别、语义三个层次对物体分类与检测研究中存在的困难与挑战进行了阐述.接下来,该文以物体检测和分类方面的典型数据库和国际视觉算法竞赛PASCAL VOC竞赛为主线对近年来物体分类与检测的发展脉络进行了梳理与总结,指出表达学习和结构学习在于物体分类与检测中占有重要的地位.最后文中对物体分类与检测的发展方向进行了思考和讨论,探讨了图像物体识别中下一步研究可能的方向. Image object classification and detection are two of the most essential problems in computer vision.They are the basis of many other complex vision problems,such as segmentation,tracking,and action analysis.In this paper,we try to give an analysis of object classification and detection algorithms based on PASCAL VOC challenge,which is generally acknowledged as a public evaluation for object recognition.We first discuss the importance of object classification and detection; next we summarize the difficulties and challenges in the development of basic object recognition.Then we review the yearly achievements in the study of object classification and detection.Finally we discuss the development directions of object classification and detection,from the view of representations learning and structure learning.

作者黄凯奇任伟强谭铁牛

机构地区中国科学院自动化研究所模式识别国家重点实验室智能感知与计算研究中心

出处《计算机学报》 EI CSCD 北大核心 2014年第6期1225-1240,共16页 Chinese Journal of Computers

基金国家"九七三"重点基础研究发展规划项目基金(2012CB316302) 国家自然科学基金(61322209) 国家科技支撑计划(2012BAH07B01)资助~~

关键词物体分类物体检测计算机视觉特征表达结构学习 object classification object detection computer vision feature representations structural learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献67

1Marr D.Vision:A Computational Investigation Into the Human Representation and Processing of Visual Information.Cambridge:The MIT Press,2010.
2LeCun Y,Bottou L,Bengio Y,Haffner P.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998,86(11):2278-2324.
3Ferrari V,Jurie F,Schmid C.From images to shape models for object detection.International Journal of Computer Vision,2009,87(3):284-303.
4Latecki L J,Lakamper R,Eckhardt U.Shape descriptors for non rigid shapes with a single closed contour//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Hilton Head,USA,2000,1:424-429.
5Krizhevsky A.Learning Multiple Layers of Features from Tiny Images[M.S.dissertation].University of Toronto,2009.
6Torralba A,Fergus R,Freeman W T.80 million tiny images:A large dataset for non-parametric object and scene recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1958-1970.
7Li FebFei,Fergus R,Perona P.Learning generative visual models from few training examples:An incremental Bayesian approach tested on 101 object categories//Proceedings of the Computer Vision and Pattern Recognition (CVPR),Workshop on Generative-Model Based Vision.Washington,USA,2004:178.
8Griffin G,Holub A D,Perona P.The Caltech 256.Caltech Technical Report CNS-TR-2007-001.
9Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).New York,USA,2006:2169-2178.
10Li Fei-Fei,Perona P.A Bayesian hierarchical model for learning natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Washington,USA,2005:524-531.

二级参考文献55

1黄凯奇,吴镇扬,王桥.色彩恒常性在彩色图像增强中的应用[J].应用科学学报,2004,22(3):322-326. 被引量：10
2汪云九,齐翔林.初级视觉的Gabor函数模型的研究进展[J].生物物理学报,1993,9(3):508-513. 被引量：7
3Borji A, Itti L. State-of-the-Art in Visual Attention Modeling. IEEE Trans on Pattern Analysis and Machine Intelligence, 2013, 35 ( 1 ) : 185-207.
4TenenbaumJ B, Griffiths T L, Kemp C. Theory-Based Bayesian Models of Inductive Learning and Reasoning. Trends in Cognitive Sciences, 2006,10(7): 309-318.
5Roberts L. Machine Perception of Three-Dimensional Solids. Ph. 0 Dissertation. Cambridge, USA: Massachusetts Institute of Technolo?gy, 1963.
6Marr D. Vision: A Computational Investigation into the Human Re?presentation and Processing of Visual Information. San Francisco, USA: Freeman, 1982.
7Aloimonos Y. What I Have Learned. CVGIP: Image Understand?ing, 1994, 60(1) : 74-85.
8Neisser U. Cognition and Reality. San Francisco, USA: Freeman, 1976.
9Wandell B A. Foundations of Vision. Sunderland, USA: Sinauer Associates, 1995.
10Gonzalez R C, Woods R E. Digital Image Processing. 2nd Edition. Upper Saddle River, USA: Prentice Hall, 2002.

共引文献11

1罗宇,宋歌,杨红雨.基于图像识别的建筑物三维重建[J].计算机工程与设计,2015,36(1):191-196. 被引量：7
2纪红,齐芳,马铭.一种基于解释性的遗传模糊分类系统设计方法[J].北华大学学报（自然科学版）,2015,16(4):538-541. 被引量：1
3周怡,杜珠英,谭嘉傑,陈仕鹏,黄国强.医学决策分析课程中的视觉认知教学[J].中华医学图书情报杂志,2015,24(10):5-7. 被引量：2
4焦李成,赵进,杨淑媛,刘芳,谢雯.稀疏认知学习、计算与识别的研究进展[J].计算机学报,2016,39(4):835-852. 被引量：17
5骆剑承,吴田军,夏列钢.遥感图谱认知理论与计算[J].地球信息科学学报,2016,18(5):578-589. 被引量：14
6李天添,赵丹华,赵江洪.基于视觉认知的汽车内饰造型效果图评价体系构建[J].包装工程,2018,39(6):165-169. 被引量：6
7王高峰,石钟磊,谭魏盟,李思,高涛.融合双密度双树复小波变换与多尺度Retinex的图像增强算法[J].计算机与数字工程,2017,45(5):870-873. 被引量：2
8刘洋.从图片验证看图像分类的研究现状[J].通讯世界,2019,26(1):186-187. 被引量：1
9熊朝华,吕望晗,吴蔚,徐建平,李晓冬.情报侦察领域人工智能技术的应用与发展[J].指挥信息系统与技术,2019,10(5):8-13. 被引量：9
10黄凯奇,赵鑫,李乔哲,胡世宇.视觉图灵:从人机对抗看计算机视觉下一步发展[J].图学学报,2021,42(3):339-348. 被引量：4

同被引文献1612

1李茂月,马康盛,许勇浩,王飞.基于单目结构光的形貌测量误差补偿方法研究[J].仪器仪表学报,2020(5):19-31. 被引量：15
2姜倩,刘曼.文本检测与识别在细粒度图片分类中的应用[J].计算机系统应用,2020(10):248-254. 被引量：3
3蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：53
4孙梦博.基于卷积神经网络的关键词提取方法[J].计算机产品与流通,2020,0(1):50-50. 被引量：1
5刘婷,周柏均,赵永生,时雷雨.基于卷积神经网络的无人船海面垃圾分类算法[J].船舶工程,2021,43(S01):399-404. 被引量：7
6康雪玮,于文雅,谭钧恺,邓超,巩红晖,夏辉.基于深度学习的债券图表数据光学字符识别(OCR)检测与文本识别的应用[J].办公自动化,2021,26(14):54-58. 被引量：11
7陈明惠,王帆,张晨曦,李福刚,郑刚.基于压缩感知的频域OCT图像稀疏重构[J].光学精密工程,2020,28(1):189-199. 被引量：17
8刘常杰,邾继贵,杨学友,叶声华.汽车白车身在线激光视觉检测站[J].仪器仪表学报,2004,25(z1):671-672. 被引量：17
9田元,王乘,管涛.基于FCM和图割的交互式图像分割方法[J].工程图学学报,2010,31(2):123-127. 被引量：3
10段明秀,何迎生.基于LVQ神经网络的手写字母识别[J].吉首大学学报（自然科学版）,2010,31(2):41-43. 被引量：13

引证文献188

1高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
2陆晔,孙晓凯,李梦媛.基于“检测+分类”模型融合的物体识别应用分析[J].电信科学,2020,36(S01):276-283. 被引量：1
3孙晓凯,倪卿元,陈文强.图像增强方法在深度学习图像识别场景应用中的可行性研究[J].电信科学,2020,36(S01):172-179. 被引量：9
4闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：2
5刘鹏翼.智能视频分析技术及应用[J].网络安全技术与应用,2018(12):127-127. 被引量：4
6高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
7施明登,周鹏,白铁成.基于Bag of Words的干果图像分类研究[J].安徽农业科学,2014,42(29):10381-10383. 被引量：1
8侯宾,张文志,戴源成,田洪强.基于OpenCV的目标物体颜色及轮廓的识别方法[J].现代电子技术,2014,37(24):76-79. 被引量：18
9蔡强,刘亚奇,曹健,毛典辉,牛群.图像目标类别检测综述[J].计算机科学与探索,2015,9(3):257-265. 被引量：13
10纪红,齐芳,马铭.一种基于解释性的遗传模糊分类系统设计方法[J].北华大学学报（自然科学版）,2015,16(4):538-541. 被引量：1

二级引证文献2158

1钟映春,祝玉杰,李芳,朱爽,戚剑.周围神经MicroCT图像中神经束轮廓获取[J].中国图象图形学报,2020,25(2):354-365. 被引量：4
2庞宁.基于深度学习的输电线杆塔鸟巢检测与识别[J].自动化与仪器仪表,2020(4):195-198. 被引量：6
3于枫世,隋毅,王常颖,初佳兰.基于深度学习的高分辨率卫星遥感影像围填海检测识别[J].遥感技术与应用,2022,37(4):789-799.
4胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
5杨青,薛辉.基于领域自适应的故障诊断研究与进展[J].沈阳理工大学学报,2020(4):82-86. 被引量：2
6田卓钰,马苗,杨楷芳.基于级联注意力与点监督机制的考场目标检测模型[J].软件学报,2022,33(7):2633-2645. 被引量：5
7周冠博,钱奇峰,吕心艳,刘春霞,徐雅静.人工智能新技术在国家气象中心台风业务中的应用探索[J].热带气象学报,2022,38(4):481-491. 被引量：1
8傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：49
9康烨,邱金凯,佟尚谕,许秀英.基于深度学习的红豆外观品质识别[J].内蒙古农业大学学报（自然科学版）,2022,43(4):82-87.
10刘海锋.煤矿智能化升级平台建设及运维保障研究[J].工矿自动化,2021,47(S01):32-35. 被引量：6

1张启忠,杨纪春,罗志增.用于物体分类的多传感器集成与信息融合系统[J].模式识别与人工智能,1998,11(1):112-117. 被引量：11
2刘栋,李素,曹志冬.深度学习及其在图像物体分类与检测中的应用综述[J].计算机科学,2016,43(12):13-23. 被引量：31
3李娜.全局多阶统计中混合应用局部多核度量学习的实验分析[J].电脑迷,2016(10).
4李德龙,王静.Access 2003——小型企业应用的典型数据库[J].民营科技,2009(1):33-33. 被引量：1
5张英杰,张铁昌.基于物体分类的非变形纹理映射技术[J].西北工业大学学报,1995,13(1):151-155. 被引量：4
6刘涛.解决变频器干扰问题的有效途径[J].山东工业技术,2016(16):255-255.
7孙季丰,袁春林,邱卫东,余英林.一个具有图像语义的物体分类系统的实现[J].科学技术与工程,2008,8(3):676-681. 被引量：1
8马蕊,刘华平,孙富春,高蒙.基于触觉序列的物体分类[J].智能系统学报,2015,10(3):362-368. 被引量：2
9萧田国.典型数据库故障及解决[J].软件世界,2009(6):77-78. 被引量：1
10任捷怡,吴小俊.一种改进的协方差鉴别学习方法[J].山东大学学报（工学版）,2015,45(1):9-12. 被引量：1

计算机学报

2014年第6期

浏览历史

内容加载中请稍等...

图像物体分类与检测算法综述被引量：188

参考文献67

二级参考文献55

共引文献11

同被引文献1612

引证文献188

二级引证文献2158

相关作者

相关机构

相关主题

浏览历史

图像物体分类与检测算法综述 被引量：188

参考文献67

二级参考文献55

共引文献11

同被引文献1612

引证文献188

二级引证文献2158

相关作者

相关机构

相关主题

浏览历史

图像物体分类与检测算法综述被引量：188