基于Pivots选择的有效图像块描述子被引量：3

Efficient Patch-Level Descriptor for Image Categorization via Patch Pivots Selection

下载PDF

导出

摘要设计图像块特征表示是计算机视觉领域内的基本研究内容,优秀的图像块特征表示能够有效地提高图像分类、对象识别等相关算法的性能.SIFT(scale-invariant feature transform)和HOG(histogram of oriented gradient)是人为设计图像块特征表示的优秀代表,然而,人为设计图像块特征间的差异往往不能足够理想地反映图像块间的相似性.核描述子(kernel descriptor,简称KD)方法提供了一种新的方式生成图像块特征,在图像块间匹配核函数基础上,应用核主成分分析(kernel principal component analysis,简称KPCA)方法进行特征表示,且在图像分类应用上获得不错的性能.但是,该方法需要利用所有联合基向量去生成核描述子特征,导致算法时间复杂度较高.为了解决这个问题,提出了一种算法生成图像块特征表示,称为有效图像块描述子(efficient patch-level descriptor,简称EPLd).算法建立在不完整Cholesky分解基础上,自动选择少量的标志性图像块以提高算法效率,且利用MMD(maximum mean discrepancy)距离计算图像间的相似性.实验结果表明,该算法在图像/场景分类应用中获得了优秀的性能. Designing patch-level features is essential for achieving good performance in computer vision tasks, such as image classification and object recognition. SIFT （scale-invariant feature transform） and HOG （histogram of oriented gradient） are the typical schemes among many pre-defined patch-level descriptors, but the difference between artificial patch-level features is not good enough for reflecting the similarities of images. Kernel descriptor （KD） method offers a new way to generate features from match kernel defined over image patch pairs using KPCA （kernel principal component analysis） and yields impressive results. However, all joint basis vectors are involved in the kernel descriptor computation, which is both expensive and not necessary. To address this problem, this paper presents an efficient patch-level descriptor （EPLd） which is built upon incomplete Cholesky decomposition. EPLd automatically selects a small number of image patches pivots to achieve better computational efficiency. Based on EPLd, MMD （maximum mean discrepancy） distance is used for computing similarities between images. In experiments, the EPLd approach achieves competitive results on several image/scene classification datasets compared with state-of-the-art methods.

作者谢博鋆朱杰于剑

机构地区交通数据分析与挖掘北京市重点实验室(北京交通大学) 河北省机器学习与计算智能重点实验室(河北大学) 中央司法警官学院信息管理系

出处《软件学报》 EI CSCD 北大核心 2015年第11期2930-2938,共9页 Journal of Software

基金国家自然科学基金(61370129 61375062 61300072) 高等学校博士学科点专项科研基金(20120009110006) 河北省教育厅青年基金(QN2015099) 河北省社会科学基金(HB15TQ013)

关键词标志性图像块不完整Cholesky分解核描述子有效图像块描述子 MMD距离 patch pivot incomplete Cholesky decomposition kernel descriptor efficient patch-level descriptor MMD distance

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1Bojun XIE,Yi LIU,HuiZHANG,Jian YU.Efficient image representation for object recognition via pivots selection[J].Frontiers of Computer Science,2015,9(3):383-391. 被引量：3
2黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：191

二级参考文献105

1Marr D.Vision:A Computational Investigation Into the Human Representation and Processing of Visual Information.Cambridge:The MIT Press,2010.
2LeCun Y,Bottou L,Bengio Y,Haffner P.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998,86(11):2278-2324.
3Ferrari V,Jurie F,Schmid C.From images to shape models for object detection.International Journal of Computer Vision,2009,87(3):284-303.
4Latecki L J,Lakamper R,Eckhardt U.Shape descriptors for non rigid shapes with a single closed contour//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Hilton Head,USA,2000,1:424-429.
5Krizhevsky A.Learning Multiple Layers of Features from Tiny Images[M.S.dissertation].University of Toronto,2009.
6Torralba A,Fergus R,Freeman W T.80 million tiny images:A large dataset for non-parametric object and scene recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1958-1970.
7Li FebFei,Fergus R,Perona P.Learning generative visual models from few training examples:An incremental Bayesian approach tested on 101 object categories//Proceedings of the Computer Vision and Pattern Recognition (CVPR),Workshop on Generative-Model Based Vision.Washington,USA,2004:178.
8Griffin G,Holub A D,Perona P.The Caltech 256.Caltech Technical Report CNS-TR-2007-001.
9Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).New York,USA,2006:2169-2178.
10Li Fei-Fei,Perona P.A Bayesian hierarchical model for learning natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Washington,USA,2005:524-531.

共引文献192

1高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
2陆晔,孙晓凯,李梦媛.基于“检测+分类”模型融合的物体识别应用分析[J].电信科学,2020,36(S01):276-283. 被引量：1
3孙晓凯,倪卿元,陈文强.图像增强方法在深度学习图像识别场景应用中的可行性研究[J].电信科学,2020,36(S01):172-179. 被引量：10
4闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：4
5刘鹏翼.智能视频分析技术及应用[J].网络安全技术与应用,2018(12):127-127. 被引量：4
6高薇,曾健民.基于卷积神经网络算法的图像识别应用研究[J].西安文理学院学报（自然科学版）,2019,22(1):10-14. 被引量：8
7施明登,周鹏,白铁成.基于Bag of Words的干果图像分类研究[J].安徽农业科学,2014,42(29):10381-10383. 被引量：1
8侯宾,张文志,戴源成,田洪强.基于OpenCV的目标物体颜色及轮廓的识别方法[J].现代电子技术,2014,37(24):76-79. 被引量：19
9蔡强,刘亚奇,曹健,毛典辉,牛群.图像目标类别检测综述[J].计算机科学与探索,2015,9(3):257-265. 被引量：13
10纪红,齐芳,马铭.一种基于解释性的遗传模糊分类系统设计方法[J].北华大学学报（自然科学版）,2015,16(4):538-541. 被引量：1

同被引文献19

1方向,陈思佳,贾颖.基于概率测度支持向量机的静态手写数字识别方法[J].微电子学与计算机,2015,32(4):107-110. 被引量：7
2张国敏,殷建平,祝恩.一种基于区域熵值的车牌定位方法[J].计算机工程与科学,2004,26(5):31-33. 被引量：3
3史迎春,周献中,方鹏飞.综合利用形状和颜色特征的台标识别[J].模式识别与人工智能,2005,18(2):216-222. 被引量：13
4唐轶峻,申小阳,朱雯兰,隋成华.基于BP神经网络的数显仪表动态字符识别系统[J].光学仪器,2005,27(6):62-66. 被引量：6
5林克正,张彩华,刘丕娥.基于分块主颜色匹配的图像检索[J].计算机工程,2010,36(13):186-188. 被引量：20
6熊钢,平西建,张涛,孙兵.一种基于图像内容的最低有效位匹配隐写分析方法[J].电子与信息学报,2012,34(6):1380-1387. 被引量：5
7金阳,程江华,任通,库锡树.基于视频帧加权的台标自动检测方法[J].电视技术,2012,36(21):33-36. 被引量：4
8肖满生,吴卫,王宏.基于邻域灰度值聚类的图像色彩量化[J].控制与决策,2013,28(6):935-939. 被引量：1
9侯胜伟,滕奇志,高明亮,何小海.台标的自动检测与识别[J].四川大学学报（自然科学版）,2013,50(3):522-528. 被引量：3
10李琼,陈利,王维虎.基于SVM的手写体数字快速识别方法研究[J].计算机技术与发展,2014,24(2):205-208. 被引量：19

引证文献3

1张伟,许海洋.基于可变形部件模型的台标识别方法[J].计算机应用研究,2017,34(7):2202-2206.
2朱彬,薛路强,谭守标.一种改进的数字图像定位识别方法研究[J].计算机技术与发展,2017,27(12):67-70. 被引量：4
3肖满生,肖哲,万烂军.多特征融合的图像格贴近度匹配方法[J].西安交通大学学报,2019,53(4):115-121. 被引量：2

二级引证文献6

1彭刚,杜兵.变电站二次设备的数显仪表定位方法[J].自动化仪表,2018,39(7):56-60. 被引量：3
2罗守品,杨涛,梅艳莹.基于改进ORB和网格运动统计的图像匹配算法[J].传感器与微系统,2019,38(7):125-127. 被引量：10
3高斌.基于自适应蚁群算法的快速位移图像精准定位方法[J].菏泽学院学报,2019,41(5):52-56.
4李硕,杜媛.基于嵌入式技术的印刷设备套色精定位方法研究[J].自动化与仪器仪表,2020(6):128-131.
5辛明勇,徐长宝,骆柏锋,徐振恒,刘子轩,鲁彩江.基于模糊判据的接地网腐蚀程度诊断方法研究[J].自动化仪表,2024,45(3):8-11.
6吴园园.数字图像处理关键技术应用与发展[J].计算机产品与流通,2019,0(3):109-109.

1李娜.全局多阶统计中混合应用局部多核度量学习图像集分类研究[J].经营管理者,2016(36).
2胡传志,程实.基于WavixTion实现MMD人偶同步[J].信息通信,2013,26(7):82-82.
3万络为MMD提供仓库管理及配送解决方案[J].物流技术与应用,2010(4):114-114.
4刘永新.初探计算机病毒的免疫[J].成功,2012(4):281-281.
5硬件维修[J].电脑爱好者（普及版）,2008,0(7):95-95.
6SMMDA—Ⅱ多功能设备状态监测诊断分析仪[J].中国高校技术市场,2002(4):57-58.
7王茜,杨传栋,刘泓.基于模糊集的隐私保护方法研究[J].计算机应用研究,2013,30(2):518-520. 被引量：5
8皋军,黄丽莉.最大局部加权均值差异嵌入[J].电子学报,2013,41(8):1462-1468. 被引量：4
9程实,顾颀,潘健生,陈善利.基于ARToolkit-MMD虚拟人偶成像增强现实研究[J].微电子学与计算机,2011,28(10):150-152. 被引量：3
10张毅,廖巧珍,罗元.融合二阶HOG与CS-LBP的头部姿态估计[J].智能系统学报,2015,10(5):741-746. 被引量：5

软件学报

2015年第11期

浏览历史

内容加载中请稍等...

基于Pivots选择的有效图像块描述子被引量：3

参考文献2

二级参考文献105

共引文献192

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Pivots选择的有效图像块描述子 被引量：3

参考文献2

二级参考文献105

共引文献192

同被引文献19

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于Pivots选择的有效图像块描述子被引量：3