基于多模态深度神经网络的抓取检测方法

Grasp Detection Method Based on Multi-modal Deep Neural Network

下载PDF

导出

摘要针对机器人抓取检测任务中对未知物体抓取检测精度低的问题,提出了一种多模态深度神经抓取检测模型。首先,在RGB和深度两个通道中引入残差模块以进一步提升网络的特征提取能力。其次,引入多模态特征融合模块进行特征融合。最后,通过全连接层回归融合特征得到最佳抓取检测结果。实验结果表明,在Cornell抓取数据集上,本文方法的图像拆分检测精度达到95.7%,对象拆分检测精度达到94.6%。此外,还通过消融实验证明了引入残差模块可以提高网络抓取检测性能。 A multi-modal deep neural network grasping detection network was proposed to address the issue of low accuracy in robot grasping detection tasks for unknown objects.Firstly,residual modules were introduced in both RGB and depth channels to further enhance the feature extraction capability of the network.Secondly,a multimodal feature fusion module was introduced for feature fusion.Finally,the best grasping detection result was obtained by fusing features through fully connected layer regression.The experimental results demonstrate that the algorithm proposed achieves a precision rate of 95.7% for grasping and 94.6% for object segmentation on the Cornell dataset.In addition,it has been demonstrated through ablation experiments that introducing residual modules can improve the performance of network crawling detection.

作者严松张蕾 YAN Song;ZHANG Lei(Electronic Information College,Xi'an Polytechnic of University,Xi'an 710048,China)

机构地区西安工程大学电子信息学院

出处《科学技术与工程》北大核心 2024年第17期7239-7248,共10页 Science Technology and Engineering

基金陕西省科技厅科技成果转移与推广计划(2020TG-011)。

关键词抓取检测机器人多模态融合深度学习 grasp detection robotic arm multimodal fusion deep learning

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1高智伟,谭晓东,刘客.基于双目视觉的物体识别定位与抓取[J].科学技术与工程,2020,20(20):8285-8291. 被引量：17
2仲训杲,徐敏,仲训昱,彭侠夫.基于多模特征深度学习的机器人抓取判别方法[J].自动化学报,2016,42(7):1022-1029. 被引量：34
3孟月波,黄琪,韩九强,徐胜军,王宙.基于两阶段的机器人动态多物品定位抓取方法[J].激光与光电子学进展,2023,60(6):278-287. 被引量：2
4杨华,宋卓著,吴杰宏,高利军.基于SE-ResNet的机器人最优抓取姿态检测方法[J].传感器与微系统,2023,42(5):112-116. 被引量：1
5李淦,牛洺第,陈路,杨静,闫涛,陈斌.融合视觉特征增强机制的机器人弱光环境抓取检测[J].计算机应用,2023,43(8):2564-2571. 被引量：1
6贾淼,邵全全,胡洁,戚进.一种多信息融合的机器人抓取区域检测方法[J].机电一体化,2022,28(2):13-21. 被引量：1
7马世超,孙磊,何宏,郭延华.基于感兴趣区域的机器人抓取系统[J].科学技术与工程,2020,20(11):4395-4403. 被引量：3

二级参考文献57

1李秀智,李家豪,张祥银,彭小彬.基于深度学习的机器人最优抓取姿态检测方法[J].仪器仪表学报,2020(5):108-117. 被引量：32
2王德明,颜熠,周光亮,李勇奇,刘成菊,林立民,陈启军.基于实例分割网络与迭代优化方法的3D视觉分拣系统[J].机器人,2019,41(5):637-648. 被引量：17
3Paolini R, Rodriguez A, Srinivasa S S, Mason M T. A data-driven statistical framework for post-grasp manipulation. The International Journal of Robotics Research, 2014, 33(4):600-615.
4Droniou A, Ivaldi S, Sigaud O. Deep unsupervised network for multimodal perception, representation and classification. Robotics and Autonomous Systems, 2015, 71(9):83-98.
5Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, 2006, 313(5786):504-507.
6Bengio Y. Learning deep architectures for AI. Foundations and TrendsoledR in Machine Learning, 2009, 2(1):1-127.
7L?ngkvist M, Karlsson L, Loutfi A. A review of unsupervised feature learning and deep learning for time-series modeling. Pattern Recognition Letters, 2014, 42:11-24.
8Erhan D, Bengio Y, Courville A, Manzagol P A, Vincent P, Bengio S. Why does unsupervised pre-training help deep learning? Journal of Machine Learning Research, 2010, 11:625-660.
9Salakhutdinov R, Hinton G. Deep Boltzmann machines. In:Proceedings of the 12th International Conference on Artificial Intelligence and Statistics (AISTATS) 2009. Florid, USA, 2009. 448-455.
10Ngiam J, Khosla A, Kim M, Nam J, Lee H, Ng A Y. Multimodal deep learning. In:Proceedings of the 28th International Conference on Machine Learning. Bellevue, USA, 2011. 689-696.

共引文献52

1胡师柿.视觉机器人目标识别与定位研究[J].造纸装备及材料,2021,50(8):40-41. 被引量：3
2高子航.基于5G通信的四足机器人控制系统设计[J].电子技术（上海）,2021,50(5):140-141. 被引量：3
3黄寅.基于软件工程与叠层深度学习的工件文本识别算法[J].宝鸡文理学院学报（自然科学版）,2018,38(1):48-51. 被引量：1
4牛剑峰.综采工作面装备机器人化技术研究[J].煤矿机电,2018,39(2):36-41. 被引量：1
5闫哲,杜学丹,曹淼,蔡莹皓,鲁涛,王硕.基于深度学习的机器人抓取位置检测方法[J].高技术通讯,2018,28(1):58-66. 被引量：13
6辛菁,姚雨蒙,程晗,张友民.基于卷积神经网络的机器人对未知物体视觉定位控制策略[J].信息与控制,2018,47(3):355-362. 被引量：17
7王宗伟.有限训练样本下基于深度领域自适应的机器人物体抓取[J].电子设计工程,2018,26(20):33-36. 被引量：1
8温秀兰,张腾飞,芮平,崔俊宇.基于三维机器视觉的工业机器人定位系统设计[J].组合机床与自动化加工技术,2018(9):49-52. 被引量：20
9龙慧,朱定局,田娟.深度学习在智能机器人中的应用研究综述[J].计算机科学,2018,45(B11):43-47. 被引量：26
10张嘉礼,李特,谭朝元,刘海波,刘阔,李兰柱,王永青.面向蜂窝结构件的机器人视觉定位方法[J].航天制造技术,2019(2):13-18. 被引量：2

1李丹,李秀芬.基于思维导图的沉浸式怀旧疗法护理应用于阿尔茨海默病患者的效果研究[J].基层医学论坛,2024,28(14):51-53.
2孙先涛,江汪洋,陈文杰,陈伟海,智亚丽.基于感兴趣区域的物体抓取位姿检测[J].系统工程与电子技术,2024,46(6):1867-1877.
3易首成,纪元法,孙希延,韦照川,贾茜子.基于Cornell的自适应电离层闪烁强度的模型研究[J].科学技术与工程,2024,24(12):4851-4860.
4黎施彬,龚俊,汤圣君.基于Graph Transformer的半监督异配图表示学习模型[J].计算机应用,2024,44(6):1816-1823.
5张雯露,黄雄杰,李容,汪辉,关皓,周青平,陈有军.川西北高寒地区5种饲草产量与CNCPS组分分析[J].草地学报,2024,32(6):1672-1681.

科学技术与工程

2024年第17期

浏览历史

内容加载中请稍等...

基于多模态深度神经网络的抓取检测方法

参考文献7

二级参考文献57

共引文献52

相关作者

相关机构

相关主题

浏览历史