基于混合卷积自编码极限学习机的RGB-D物体识别被引量：9

RGB-D object recognition based on hybrid convolutional auto-encoder extreme learning machine

下载PDF

导出

摘要有效学习丰富的表征信息在RGB-D目标识别任务中至关重要,是实现高泛化性能的关键。针对卷积神经网络训练时间长的问题,提出了一种混合卷积自编码极限学习机(HCAE-ELM)结构,包括卷积神经网络(CNN)和自编码极限学习机(AE-ELM),该结构合并了CNN的有效性和AE-ELM快速性的优点。它使用卷积层和池化层分别从RGB和深度图来有效提取低阶特征,然后在共享层合并两种模型特征,输入到自编码极限学习机中以得到高层次的特征,最终的特征使用极限学习机(ELM)进行分类,以获得更好的快速泛化能力。文中在标准的RGB-D数据集上进行了评估测试,其实验结果表明,相比较深度学习和其他的ELM方法,文中的混合卷积自编码极限学习机模型取得了良好的测试准确率,并且有效地缩减了训练时间。 Learning rich representations efficiently plays an important role in RGB-D object recognition task,which is crucial to achieve high generalization performance.For the long training time of convolutional neural networks,a Hybrid Convolutional Auto-Encoder Extreme Learning Machine Structure(HCAE-ELM)was put forward which included Convolutional Neural Network(CNN)and Auto-Encoder Extreme Learning Machine(AE-ELM),which combined the power of CNN and fast training of AE-ELM.It used convolution layers and pooling layers to effectively abstract lower level features from RGB and depth images separately.And then,the shared layer was developed by combining these features from each modality and fed to an AE-ELM for higher level features.The final abstracted features were fed to an ELM classifier,which led to better generalization performance with faster learning speed.The performance of HCAE-ELM was evaluated on RGB-D object dataset.Experimental results show that the proposed method achieves better testing accuracy with significantly shorter training time in comparison with deep learning methods and other ELM methods.

作者殷云华李会方 Yin Yunhua;Li Huifang(School of Electronics and Information,Northwestern Polytechnical University,Xi′an 710072,China;Science and Technology on Transient Impact Laboratory,Beijing 102202,China)

机构地区西北工业大学电子信息学院瞬态冲击技术重点实验室

出处《红外与激光工程》 EI CSCD 北大核心 2018年第2期52-59,共8页 Infrared and Laser Engineering

基金国家自然科学基金青年科学基金(61402368) 瞬态冲击技术重点实验室基金(61426060103162606007)

关键词极限学习机卷积神经网络自编码极限学习机物体识别 ELM CNN AE-ELM object recognition

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1刘天华,杨绍清,刘松涛.基于CNN的海空光电目标检测技术研究[J].红外与激光工程,2008,37(S2):655-658. 被引量：4
2王勇,徐海松.Spectral characterization of scanner based on PCA and BP ANN[J].Chinese Optics Letters,2005,3(12):725-728. 被引量：16
3王鑫,沃波海,管秋,陈胜勇.基于流形学习的人体动作识别[J].中国图象图形学报,2014,19(6):914-923. 被引量：30
4李军梅,胡以华,陶小红.基于主成分分析与BP神经网络的识别方法研究[J].红外与激光工程,2005,34(6):719-723. 被引量：40
5李长勇,曹其新.基于深度图像的蔬果形状特征提取[J].农业机械学报,2012,43(S1):242-245. 被引量：9
6曹雏清,李瑞峰,赵立军.基于深度图像技术的手势识别方法[J].计算机工程,2012,38(8):16-18. 被引量：60

二级参考文献47

1梁宾桥,王继宗,梁晓颖.高性能混凝土强度预测的神经网络-主成分分析[J].计算机工程与应用,2004,40(18):192-195. 被引量：13
2Kelly D,McDonald J,Markham C.A Person Independent System for Recognition of Hand Postures Used in Sign Language[J].Pattern Recognition Letters,2010,31(11):1359-1368.
3Wang Chieh-Chih,Wang Ko-Chih.Hand Posture Recognition Using Adaboost with Sift for Human Robot Interaction[C]//Proc.of International Conference on Advanced Robotics.Jeju Island,Korea:[s.n.],2007.
4Flasinski M,Myslinski S.On the Use of Graph Parsing for Recognition of Isolated Hand Postures of Polish Sign Language[J].Pattern Recognition,2010,43(6):2249-2264.
5Witten I H,Frank E.Data Mining:Practical Machine Learning Tools and Techniques[M].Burlington,USA:Morgan Kaufmann Publishers,2005.
6MarquessJP 吴逸飞.模式识别-原理、方法及应用[M].北京:清华大学出版社,2003..
7Plagemann C, Ganapathi V, Koller D, et al. Real-time identification and localization of body parts from depth images[C]//Proceedings of IEEE International Conference on Robotics and Automation. Anchorage, USA: IEEE, 2010: 3108-3113.
8Schwarz L A, Mkhitaryan A, Mateus D, et al. Estimating human 3d pose from time-of-flight images based on geodesic distances and optical flow[C]//Proceedings of IEEE International Conference on Automatic Face & Gesture Recognition and Workshops. Santa Barbara, USA: IEEE, 2011: 700-706.
9Shotton J, Sharp T, Kipman A, et al. Real-time human pose recognition in parts from single depth images[J]. Communications of the ACM, 2013, 56(1): 116-124.
10Sim D G, Kwon O K, Park R H. Object matching algorithms using robust Hausdorff distance measures[J]. IEEE Transactions on Image Processing, 1999, 8(3): 425-429.

共引文献150

1王辉,杨杰,黎明,蔡念.一种基于神经网络的图像复原方法[J].红外与激光工程,2006,35(z4):121-125. 被引量：9
2汪云,甘泉,李琳.一种结合曲率与平行向量的实时指尖检测方法[J].图学学报,2014,35(2):285-289. 被引量：3
3周竹,刘洁,李小昱,李培武,王为,展慧.霉变板栗的近红外光谱和神经网络方法判别[J].农业机械学报,2009,40(S1):109-112. 被引量：19
4刘亚东,胡德文,刘发益,李明,王玉成.稳态快速谱光学功能映射[J].光学学报,2006,26(11):1710-1716.
5蔺广逢,范引娣,张媛.主成分分析与BP神经网络的人脸识别方法研究[J].现代电子技术,2007,30(2):53-55. 被引量：12
6闫雪梅,王晓华,夏兴高.基于PCA和BP神经网络算法的车牌字符识别[J].激光与红外,2007,37(5):481-484. 被引量：11
7方泽军,纪常伟,洪晶.基于PCA-GABP神经网络的发动机负荷特性预测[J].内燃机与动力装置,2007,24(2):33-38.
8邹文海,徐海松,王勇.基于彩色扫描仪的图像光谱重构[J].光学学报,2007,27(5):859-863. 被引量：11
9邹凌云,王正志.基于主成分分析-神经网络的非编码RNA预测[J].生物医学工程研究,2007,26(1):6-9. 被引量：6
10王勇,徐海松.基于多项式回归模型的扫描仪色度特征化[J].光学学报,2007,27(6):1135-1138. 被引量：24

同被引文献46

1刘高平,赵杜娟,黄华.基于自编码神经网络重构的车牌数字识别[J].光电子．激光,2011,22(1):144-148. 被引量：14
2宋蛰存,陈宁,李迪飞.ZigBee无线传感技术在森林火灾监测中的应用[J].自动化仪表,2011,32(4):50-52. 被引量：31
3赵源萌,王岭雪,金伟其,骆媛.基于区域直方图统计的灰度图像色彩传递方法[J].北京理工大学学报,2012,32(3):322-326. 被引量：17
4吴虎胜,张凤鸣,吴庐山.一种新的群体智能算法--狼群算法[J].系统工程与电子技术,2013,35(11):2430-2438. 被引量：190
5王勇,赵俭辉,章登义,叶威.基于稀疏自编码深度神经网络的林火图像分类[J].计算机工程与应用,2014,50(24):173-177. 被引量：34
6王雅思,姚鸿勋,孙晓帅,许鹏飞,赵思成.深度学习中的自编码器的表达能力研究[J].计算机科学,2015,42(9):56-60. 被引量：36
7傅天驹,郑嫦娥,田野,丘启敏,林斯俊.复杂背景下基于深度卷积神经网络的森林火灾识别[J].计算机与现代化,2016(3):52-57. 被引量：33
8骆健,蒋旻.基于RGB-D图像核描述子的物体识别方法[J].计算机应用,2017,37(1):255-261. 被引量：3
9牛玉虎.卷积稀疏自编码神经网络[J].计算机与现代化,2017(2):22-29. 被引量：9
10林原,徐博,孙晓玲,林鸿飞,许侃.基于似然损失函数的组样本排序学习方法[J].模式识别与人工智能,2017,30(3):235-241. 被引量：1

引证文献9

1朱峰山.丛林式盆景的制作[J].花卉,2000(3):21-21.
2叶华,谭冠政.单幅图像的深度标签流形学习[J].红外与激光工程,2018,47(6):234-240. 被引量：1
3冯嘉良,朱定局,廖丽华.基于多尺度空洞卷积自编码神经网络的森林烟火监测[J].计算机与数字工程,2019,47(12):3142-3148. 被引量：1
4黄小华.大数据下机械智能故障诊断的机遇与挑战[J].时代农机,2019,46(12):94-95. 被引量：3
5顾鑫,唐向红,陆见光,黎书文.基于深度CNN和ELM的滚动轴承故障诊断研究[J].兵器装备工程学报,2020,41(3):154-158. 被引量：7
6廖一鹏,杨洁洁,王志刚,王卫星.基于双模态卷积神经网络自适应迁移学习的浮选工况识别[J].光子学报,2020,49(10):167-178. 被引量：8
7李珣,李林鹏,Alexander Lazovik,王文杰,王晓华.基于改进双流卷积递归神经网络的RGB-D物体识别方法[J].光电工程,2021,48(2):21-30. 被引量：7
8李珣,王高平,李林鹏,王晓华,景军锋,张凯兵.基于RGB-D图像的物体识别方法[J].西安工程大学学报,2021,35(4):55-70. 被引量：9
9肖娜,周孟申.基于卷积自编码神经网络的航空发动机轴承故障诊断方法研究[J].计算机测量与控制,2021,29(12):84-88. 被引量：11

二级引证文献46

1李颖,吴仕虎,杨鑫杰,巴鹏.基于GLCM-HOG和WOA-ELM的往复压缩机气阀故障诊断方法[J].电子测量技术,2023,46(20):156-163. 被引量：3
2徐志敏,李晋.基于形态梯度的大地电磁成像处理研究[J].红外与激光工程,2019,48(5):132-136.
3刘炜哲,刘烜哲,秦玮键,杨忠荣,袁驰.大数据背景下机械智能故障诊断的机遇与挑战[J].中国机械,2020(4):36-36.
4祝俊皓.基于大数据背景下机械智能故障诊断研究[J].时代汽车,2020(15):167-168. 被引量：2
5辛惠娟,董禹辛.大数据分析在机械故障诊断中的应用探索[J].中国宽带,2021(1):82-82. 被引量：1
6孙艺聪,田润澜,刘冲,郭扬.基于Bagging-CNN雷达信号分类方法[J].兵器装备工程学报,2021,42(5):191-195. 被引量：4
7程玮.面向电力的SDN设备监测研究[J].保山学院学报,2021,40(2):85-92.
8陈功胜,唐向红,陆见光,杨瑞恒.基于CNN-ETR的滚动轴承故障诊断研究[J].兵器装备工程学报,2021,42(6):251-255. 被引量：4
9王真真,张佳林,闫攀运.特种车辆故障预测与健康管理系统架构研究[J].装备制造技术,2021(5):274-277. 被引量：2
10洪腾蛟,丁凤娟,王鹏,冯定,凃忆柳.深度学习在轴承故障诊断领域的应用研究[J].科学技术与工程,2021,21(22):9203-9211. 被引量：18

1张元进.跳出语文看语文教学[J].教学月刊（小学版）（语文）,2006(10):14-14.
2屈雁秋,陈锋.基于随机丛林的人体部件分类方法[J].计算机工程,2018,44(1):247-251.
3周华平,袁月.改进鱼群算法优化的ELM在乳腺肿瘤辅助诊断中的应用研究[J].计算机工程与科学,2017,39(11):2145-2152. 被引量：8
4张玉琴,朱旭强,吴力新,刘宏建.表没食子儿茶素没食子酸酯对脑损伤小鼠认知和氧化应激的影响[J].中华实验外科杂志,2018,35(3):475-477. 被引量：7
5官金安,杨建华,赵瑞娟.基于ICA和极限学习机的模拟阅读脑电特征分类[J].中南民族大学学报（自然科学版）,2018,37(1):85-89. 被引量：3
6王磊,刘兆伟.基于极限学习机的机器人类人运动轨迹控制方法研究[J].数字技术与应用,2017,35(12):61-62. 被引量：4
7卜勇霞.管道中浆体摩擦损失预测模型研究[J].城市建设理论研究（电子版）,2017,7(30):130-131.
8王彦华.胺碘酮治疗快速性心律失常疗效分析[J].中国实用医药,2018,13(5):103-104. 被引量：1
9张镱议,焦健,汪可,郑含博,房加珂,周浩.基于帝国殖民竞争算法优化支持向量机的电力变压器故障诊断模型[J].电力自动化设备,2018,38(1):99-104. 被引量：44

红外与激光工程

2018年第2期

浏览历史

内容加载中请稍等...

基于混合卷积自编码极限学习机的RGB-D物体识别被引量：9

参考文献6

二级参考文献47

共引文献150

同被引文献46

引证文献9

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于混合卷积自编码极限学习机的RGB-D物体识别 被引量：9

参考文献6

二级参考文献47

共引文献150

同被引文献46

引证文献9

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于混合卷积自编码极限学习机的RGB-D物体识别被引量：9