基于视觉推理的机器人多物体堆叠场景抓取方法被引量：6

Robotic grasping in multi-object stacking scenes based on visual reasoning

导出

摘要基于视觉的机器人抓取方法是研究智能机器人抓取问题的重要思路.本文提出了一种基于机器视觉推理的适用于多物体堆叠场景的机器人抓取方法,算法包含了场景理解和抓取规划两个步骤.在第一步的场景理解中,本文的算法包含两个主要部分:视觉操作关系推理和抓取部位检测.在视觉操作关系推理中,本文提出了一种基于深度卷积网络的视觉操作关系网络(Visual Manipulation Relationship Network, VMRN),以对物体和操作关系进行实时推理.在视觉操作关系网络中,通过设计物体对池化层,实现了物体检测和操作关系推理的端对端训练,提升了算法的速度和性能.在第二步的抓取部位检测中,本文提出了基于有向锚点框的全卷积视觉抓取部位检测网络,实现了对物体抓取部位的实时检测,并在康奈尔抓取数据集上取得了目前最高的精度.在抓取规划中,通过结合场景深度信息和抓取部位检测结果,获取当前被抓取物体的抓取点和对应的抓取向量,并通过坐标系变换将Kinect坐标系的抓取向量映射为机器人坐标系的抓取向量,完成当前抓取.实验结果表明,本文提出的机器人抓取方法能够在多物体堆叠环境下按照正确顺序完成抓取任务,并成功抓取目标物体. Vision is one of the most important ways to solve robotic grasping problem. We propose a framework that can help the robot grasp target object in multi-object scenes based on visual reasoning, which includes two stages: Perception and execution. During percetion stage, our proposed framework includes two parts: Visual manipulation relationship reasoning and robotic grasp detection. In visual manipulation relationship reasoning, Visual Manipulation Relationship Network(VMRN) is proposed to simultainously detect objects and gets manipulation relationships between each pair of objects. We design Object Pairing Pooling Layer to implement endto-end training of object detection and visual manilupation relationship reasoning in VMRN, which makes the algorithm faster and more robust. In robotic grasp detection, fully convolutional grasp detection network based on oriented anchor box is proposed to implement real-time grasp detection for any object, which is the state-of-the-art robotic grasp detection algorithm on the standard Cornell Grasp Dataset. During execution stage, by combining depth information and perception results, grasp point and grasp vector in camera coordinate are computed first. Then, they are transformed into robot coordinate for robot to execute grasping motion.Experimental results show that our framework can help robot grasp target in multi-object scene in the right order.

作者张翰博兰旭光周欣文田智强张扬郑南宁 ZHANG HanBo;LAN XuGuang;ZHOU XinWen;TIAN ZhiQiang;ZHANG Yang & ZHENG NanNing(Institute of Artificial Intelligence and Robotics,National Engineering Laboratory of 14sual Information Processing and Applications,School of Telecommunications,Xi'an Jiaotong University,Xi'an 710049,China)

机构地区西安交通大学电信学院人工智能与机器人研究所视觉信息处理与应用国家工程实验室

出处《中国科学：技术科学》 EI CSCD 北大核心 2018年第12期1341-1356,共16页 Scientia Sinica(Technologica)

基金国家自然科学基金(批准号:91748208 61573268) 国家重点研发计划(编号:2017YFB1302200)资助项目

关键词机器人抓取视觉操作关系推理视觉抓取部位检测视觉操作关系数据集 robotic grasping visual manipulation relationship reasoning grasp detection visual relationship manipulation dataset

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

同被引文献44

1王植,贺赛先.一种基于Canny理论的自适应边缘检测方法[J].中国图象图形学报（A辑）,2004,9(8):957-962. 被引量：216
2罗世民,李茂西.双目视觉测量中三维坐标的求取方法研究[J].计算机工程与设计,2006,27(19):3622-3624. 被引量：37
3张铖伟,王彪,徐贵力.摄像机标定方法研究[J].计算机技术与发展,2010,20(11):174-179. 被引量：45
4邱茂林,马颂德,李毅.计算机视觉中摄像机定标综述[J].自动化学报,2000,26(1):43-55. 被引量：430
5罗尤春,孙容磊.机器视觉理论及应用[J].软件导刊,2014,13(3):13-14. 被引量：7
6朱奇光,张兴家,陈卫东,陈颖.基于颜色矩的改进尺度不变特征变换的移动机器人定位算法[J].计量学报,2016,37(2):118-122. 被引量：9
7Yongjin LIU,Minjing YU,Qiufang FU,Wenfeng CHEN,Ye LIU,Lexing XIE.Cognitive mechanism related to line drawings and its applications in intelligent process of visual media： a survey[J].Frontiers of Computer Science,2016,10(2):216-232. 被引量：5
8韩冬,聂宏,陈金宝,颜文彧,王小涛.腱驱动空间五指灵巧手控制系统研究[J].机器人,2016,38(2):129-134. 被引量：6
9Yunhe Pan.Heading toward Artificial Intelligence 2.0[J].Engineering,2016,2(4):409-413. 被引量：131
10于书盼,韩彦芳.基于多特征融合与改进霍夫变换的电缆检测研究[J].软件导刊,2017,16(11):193-196. 被引量：1

引证文献6

1许高建,张蕴,赖小燚.基于Faster R-CNN深度网络的茶叶嫩芽图像识别方法[J].光电子．激光,2020,31(11):1131-1139. 被引量：32
2刘亚欣,王斯瑶,姚玉峰,杨熹,钟鸣.机器人抓取检测技术的研究现状[J].控制与决策,2020,35(12):2817-2828. 被引量：25
3马朝阳,华云松.双目视觉机械手对堆叠球体抓取方法研究[J].软件导刊,2021,20(8):65-69. 被引量：1
4王培元,关欣.混合增强视觉认知架构及其关键技术进展[J].中国图象图形学报,2021,26(11):2619-2629. 被引量：4
5刘学超,张波,郑魁敬.基于深度相机的汽车转向节位姿估计研究[J].机床与液压,2022,50(14):1-7. 被引量：2
6刘光辉,宋鑫,孟月波,徐胜军.结合实例分割与抓取筛选的堆叠目标抓取方法[J].小型微型计算机系统,2024,45(7):1648-1655.

二级引证文献64

1黄海松,陈星燃,韩正功,范青松,朱云伟,胡鹏飞.基于多尺度注意力机制和知识蒸馏的茶叶嫩芽分级方法[J].农业机械学报,2022,53(9):399-407. 被引量：9
2廖禹韬,吴黎明,王桂棠,霍启乐.基于深度相机的金属柜体三维重建[J].电子测量技术,2023,46(20):36-40.
3冯戒虚,司冠南,周风余.服务机器人云平台服务质量指标体系综述[J].计算机工程与应用,2021,57(3):58-71. 被引量：1
4张晓,刘英,李玉荣,费叶琦.基于卷积神经网络的经济林产品检测与分选研究进展[J].世界林业研究,2021,34(5):81-86. 被引量：2
5葛俊彦,史金龙,周志强,王直,钱强.基于三维检测网络的机器人抓取方法[J].仪器仪表学报,2021,42(8):146-153. 被引量：14
6王芳,崔丹丹,李林.基于深度学习的采摘机器人目标识别定位算法[J].电子测量技术,2021,44(20):162-167. 被引量：18
7吕军,方梦瑞,姚青,武传宇,贺盈磊,边磊,钟小玉.基于区域亮度自适应校正的茶叶嫩芽检测模型[J].农业工程学报,2021,37(22):278-285. 被引量：11
8董豪,杨静,李少波,王军,段仲静.基于深度强化学习的机器人运动控制研究进展[J].控制与决策,2022,37(2):278-292. 被引量：47
9刘夏阳,邓健,任东彦,芦超越,陈国良,刘晓荣.视觉增强系统在应急医疗救援力量培训的应用探讨[J].中华灾害救援医学,2022,10(3):170-173. 被引量：1
10刘顺利,刘昌华.基于目标检测算法的松材线虫病染病松树检测[J].农业与技术,2022,42(6):75-80.

1白成超,晏卓,宋俊霖.结合深度学习的机械臂视觉抓取控制[J].载人航天,2018,24(3):299-307. 被引量：8
2张驰,尚伟伟,丛爽,刘宜.机器人平滑抓取移动物体的运动规划方法[J].机械工程学报,2018,54(19):10-17. 被引量：3
3尹金鹏,张同川,戴金桥.一种基于单目视觉的工业分拣机器人系统设计[J].产业与科技论坛,2018,17(17):62-63. 被引量：1
4刘竞吉.应用坐标系变换解答解析几何问题[J].中学生数学（高中版）,2018,0(12):43-44.
5刘登生,陈利霞,王学文,梁胜梅.基于Faster R-CNN多特征融合的人类活动检测网络[J].桂林电子科技大学学报,2018,38(5):364-368.
6施驰.基于神经网络的物体检测[J].通讯世界,2019,26(2):3-4. 被引量：1
7祝源.DFS不仅有奢侈品还有艺术与尊享的探索[J].芭莎珠宝,2018,0(6):226-227.
8吴宏晓,黄顺涛,崔江静,廖雁群,曾啸,孟安波.改进SSD方法在电缆隧道明火识别中的应用[J].宁夏电力,2018,0(5):1-5.
9高凌云.简单机器人可以群体化执行复杂任务[J].现代物理知识,2018,30(5):56-56.
10毛旭林.图书产品内容和形式优化的难点与对策[J].科技与出版,2018(12):123-127. 被引量：4

中国科学：技术科学

2018年第12期

浏览历史

内容加载中请稍等...

基于视觉推理的机器人多物体堆叠场景抓取方法被引量：6

同被引文献44

引证文献6

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于视觉推理的机器人多物体堆叠场景抓取方法 被引量：6

同被引文献44

引证文献6

二级引证文献64

相关作者

相关机构

相关主题

浏览历史

基于视觉推理的机器人多物体堆叠场景抓取方法被引量：6