基于RGB-D图像核描述子的物体识别方法被引量：3

Object recognition method based on RGB-D image kernel descriptor

下载PDF

导出

摘要针对传统的颜色-深度(RGB-D)图像物体识别的方法所存在的图像特征学习不全面、特征编码鲁棒性不够等问题,提出了基于核描述子局部约束线性编码(KD-LLC)的RGB-D图像物体识别方法。首先,在图像块间匹配核函数基础上,应用核主成分分析法提取RGB-D图像的3D形状、尺寸、边缘、颜色等多个互补性核描述子;然后,分别对它们进行LLC编码及空间池化处理以形成相应的图像编码向量;最后,把这些图像编码向量融合成具有鲁棒性、区分性的图像表示。基于RGB-D数据集的仿真实验结果表明,作为一种基于人工设计特征的RGB-D图像物体识别方法,由于所提算法综合利用深度图像和RGB图像的多方面特征,而且对传统深度核描述子的采样点选取和紧凑基向量的计算这两方面进行了改进,使得物体类别识别率达到86.8%,实体识别率达到92.7%,比其他同类方法具有更高的识别准确率。 The traditional RGB-Depth （RGB-D） image object recognition methods have some drawbacks, such as insufficient feature learning and poor robustness of feature coding. In order to solve these problems, an object recognition method of RGB-D image based on Kernel Descriptor and Locality-constrained Linear Coding （KD-LLC） was proposed. Firstly, based on the kernel function of image block matching, several complementary kernel descriptors from RGB-D images, such as 3D shape, size, edges and color, were extracted using Kernel Principal Component Analysis （KPCA）. Then, the extracted feature from different cues, were processed by using LLC and Spatial Pyramid Pooling （SPP） to form the corresponding image coding vectors. Finally, the vectors were combined to obtain robust and distinguishable image representation. As a hand- crafted feature method, the proposed algorithm was compared to other hand-crafted feature methods on a RGB-D image dataset. In the proposed algorithm, multiple cues from depth image and RGB image were used, and the sampling points selection and basis vectors calculation schema for depth kernel descriptor generation were proposed. Due to above-mentioned improvements, the category and instance recognition accuracy of the proposed algorithm for objects can respectively reach 86.8% and 92.7%, which are higher than those of the previously hand-crafted feature methods for object recognition from RGB-D images.

作者骆健蒋旻

机构地区武汉科技大学计算机科学与技术学院智能信息处理与实时工业系统湖北省重点实验室(武汉科技大学)

出处《计算机应用》 CSCD 北大核心 2017年第1期255-261,共7页 journal of Computer Applications

基金国家自然科学基金面上项目(41571396) 国家创新训练项目(201410488017)~~

关键词 RGB-D图像物体识别局部约束线性编码核描述子空间池化 RGB-D image object recognition Locality-constrained Linear Coding （LLC） kernel descriptor SpatialPyramid Pooling （SPP）

分类号 TP391.413 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1黄晓琳,薛月菊,涂淑琴,李鸿生,何金辉.基于压缩感知理论的RGB-D图像分类方法[J].计算机应用与软件,2014,31(3):195-198. 被引量：4
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：592
3卢良锋,谢志军,叶宏武.基于RGB特征与深度特征融合的物体识别算法[J].计算机工程,2016,42(5):186-193. 被引量：14

二级参考文献49

1李长勇,曹其新.基于深度图像的蔬果形状特征提取[J].农业机械学报,2012,43(S1):242-245. 被引量：9
2蔡骋,张明,朱俊平.基于压缩感知理论的杂草种子分类识别[J].中国科学：信息科学,2010,40(S1):160-172. 被引量：16
3MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
4MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
5李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
610 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
7Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
8Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
9Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
10Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.

共引文献607

1贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
2毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
3范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
4孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：2
5华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：7
6刘树霄,衣立,张苏平,时晓曚,薛允传.基于全卷积神经网络方法的日间黄海海雾卫星反演研究[J].海洋湖沼通报,2019(6):13-22. 被引量：11
7王海涛.自主无人系统——概念、体系架构和设计要素[J].电信快报,2021(5):6-9.
8郭龙银,扎西多吉,尚慧杰,旦增.基于LSTM的藏语语音识别[J].电脑知识与技术,2020,0(4):154-155. 被引量：2
9李佳意,董万鹏,任梦,张吉超,弓成美琪.新时代计算机智能制造模式的研究进展[J].智能计算机与应用,2021,11(3):98-105. 被引量：1
10唐公田.杏砧杏快速育苗新技术[J].科技致富向导,2000(4):26-26.

同被引文献20

1赵源萌,王岭雪,金伟其,骆媛.基于区域直方图统计的灰度图像色彩传递方法[J].北京理工大学学报,2012,32(3):322-326. 被引量：17
2谷明琴,蔡自兴.基于无参数形状检测子和DT-CWT的交通标志识别[J].计算机研究与发展,2013,50(9):1893-1901. 被引量：7
3汤一平,宗明理,吴立娟.基于双色反射模型的彩色结构光颜色识别的研究[J].计算机学报,2013,36(9):1908-1916. 被引量：14
4刘婷,程建.基于训练字典的遥感图像融合[J].计算机工程与应用,2013,49(19):135-140. 被引量：6
5李积英,党建武,王阳萍.融合量子克隆进化与二维Tsallis熵的医学图像分割算法[J].计算机辅助设计与图形学学报,2014,26(3):465-471. 被引量：16
6施晓东,刘格.一种光学遥感图像海陆分割方法[J].国外电子测量技术,2014,33(11):29-32. 被引量：22
7亓晓彤,曹冬雨,王京海,刘昌儒,范生宏.基于图像处理的非规则形状检测方法[J].光电工程,2015,42(1):72-76. 被引量：8
8李荆轩,张学典,田媛,伍雷.基于模式识别的餐饮自助结算系统[J].信息技术,2015,39(7):9-11. 被引量：2
9林兆华,米阳,葛兵.一种粗精结合的快速图像自动调焦算法[J].国外电子测量技术,2015,34(10):28-31. 被引量：17
10王利,杨征,李洋.特征聚合的遥感图像数据库检索技术[J].激光杂志,2016,37(6):78-81. 被引量：19

引证文献3

1陈小娥.基于HSV空间和形状检测的餐盘识别智能算法研究[J].西安文理学院学报（自然科学版）,2017,20(6):67-71. 被引量：1
2苗佳,赵永来.轿车流线型曲面缺陷的图像识别与检测方法研究[J].现代电子技术,2017,40(20):95-97. 被引量：2
3李珣,王高平,李林鹏,王晓华,景军锋,张凯兵.基于RGB-D图像的物体识别方法[J].西安工程大学学报,2021,35(4):55-70. 被引量：9

二级引证文献12

1吕剑铎,刘玮,王耀.图像技术在选煤厂装车系统中的应用[J].煤炭工程,2020,52(S02):71-73. 被引量：1
2李宇宏,韩豫,杨煜昕,芮意,孙蓉,孙昊,尤少迪.基于图像识别的渣土车监管系统设计及实现[J].土木工程与管理学报,2019,36(4):170-177. 被引量：11
3王建华,冉煜琨.基于最优几何匹配的时间连贯3D动画重建[J].电子设计工程,2021,29(20):36-42.
4李涛,王凌云,王磊,任勇军.一种基于FY-4A遥感数据的渤海海冰反演算法[J].电子设计工程,2022,30(1):1-6. 被引量：2
5米热尼格尔·买买提,张太红,迪力夏提·多力昆.基于Mask R-CNN的马匹烙印号提取方法研究及应用[J].电子设计工程,2022,30(8):10-15.
6李博,康亚辉,周博闻.基于平面基线靶标的航空摄影测量重定位[J].西安工程大学学报,2022,36(3):137-142.
7张玉敏,孙鹏凯,叶平峰,吉兴全,王志豪,公政.基于CNN的配电网快速重构方法[J].智慧电力,2022,50(11):112-118. 被引量：9
8张俊超,马晓琴,严嘉正.基于特征提取的电力电子凭证图像识别系统[J].电子设计工程,2023,31(16):81-85.
9赵蓉城.基于凸锥模型的图像集分类方法的改进[J].绵阳师范学院学报,2023,42(8):86-96.
10陈梅芬,吴佳骏.基于STM32F103的颜色及形状识别系统设计[J].山西电子技术,2023(5):26-29. 被引量：1

1刘力力,张为华.模拟器采样工具设计与实现[J].计算机应用与软件,2012,29(1):1-3. 被引量：2
2钱萍,吴蒙,刘镇,尚艳羽.基于网络编码的WSN隐私保护研究[J].南京邮电大学学报（自然科学版）,2015,35(5):41-47. 被引量：1
3张建明,周威,吴宏林.基于Gabor特征和支持向量引导字典学习的人脸识别[J].计算机工程与应用,2016,52(13):177-182. 被引量：2
4刘贞报,布树辉,周昆,高曙明,韩军伟,吴俊.A Survey on Partial Retrieval of 3D Shapes[J].Journal of Computer Science & Technology,2013,28(5):836-851. 被引量：5
5夏利民,谷士文,曾三友.基于形变模型由立体序列图象恢复物体的3D形状[J].计算机工程,2001,27(10):22-23.
6孙勇,陈旭炜.美术字样条的制作[J].杭州电子工业学院学报,2001,21(4):64-67.
7J. Andreas Barentzen,臧光明.计算几何处理指南[J].国外科技新书评介,2014,0(6):11-11.
8王练,梁申虎,彭代渊.多源多中继无线网络中基于随机线性网络编码的调度方案[J].电子与信息学报,2017,39(3):532-538. 被引量：6
9雷浩鹏,罗笑南,林淑金,盛建强.Automatic 3D Shape Co-Segmentation Using Spectral Graph Method[J].Journal of Computer Science & Technology,2013,28(5):919-928. 被引量：1
10石祥滨,厉复圳,张德园.采用强制稀疏编码的人脸识别方法[J].小型微型计算机系统,2017,38(2):381-385. 被引量：4

计算机应用

2017年第1期

浏览历史

内容加载中请稍等...

基于RGB-D图像核描述子的物体识别方法被引量：3

参考文献3

二级参考文献49

共引文献607

同被引文献20

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于RGB-D图像核描述子的物体识别方法 被引量：3

参考文献3

二级参考文献49

共引文献607

同被引文献20

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于RGB-D图像核描述子的物体识别方法被引量：3