基于合成数据集的多目标识别与6-DoF位姿估计

Multi-Object Recognition and 6-DoF Pose Estimation Based on Synthetic Datasets

下载PDF

导出

摘要多目标识别及六自由度(6-DoF)位姿估计是实现物料无序堆放状态下机器人自动分拣的关键。近年来,基于深度神经网络的方法在目标识别及位姿估计领域受到广泛关注,但此类方法依赖大量训练样本,而样本的采集及标注费时费力,限制了其实用性。其次,当成像条件差、目标相互遮挡时,现有位姿估计方法无法保证结果的可靠性,进而导致抓取失败。为此,文中提出了一种基于合成数据样本的目标识别、分割及位姿估计方法。首先,以目标对象的3维(3D)几何模型为基础,利用3D图形编程工具生成虚拟场景的多视角RGB-D合成图像,并对生成的RGB图像及深度图像分别进行风格迁移和噪声增强,从而提高合成数据的真实感,以适应真实场景的检测需要;接着,利用合成数据集训练YOLOv7-mask实例分割模型,运用真实数据进行测试,结果验证了该方法的有效性;然后,以分割结果为基础,基于ES6D目标位姿估计模型,提出了一种在线姿态评估方法,以自动滤除严重失真的估计结果;最后,采用基于主动视觉的位姿估计校正策略,引导机械臂运动到新的视角重新检测,以解决因遮挡而导致位姿估计偏差的问题。在自行搭建的6自由度工业机器人视觉分拣系统上进行了实验,结果表明,文中提出的方法能较好地适应复杂环境下工件的识别与6-DoF姿态估计要求。 Multi-object recognition and 6-DoF(degree of freedom)pose estimation are the key to achieve automatic sorting of robots in the state of unordered stacking of materials.In recent years,methods based on deep neural networks have received much attention in the multi-object recognition and 6-DoF pose estimation fields.Such methods rely on a large number of training samples,however,the collection and labeling of samples is time-consuming and laborious,which limits its application.In addition,when the imaging conditions are poor and the targets are occluded by each other,the existing pose estimation methods cannot guarantee the reliability of the results,resulting in grasping failures.To this end,this paper presented a method for target recognition,segmentation and pose estimation based on synthetic data samples.Firstly,multi-view RGB-D synthetic images of virtual scenes were generated using 3D graphics programming tools based on the 3D geometric models of the target objects,and then style transfer and noise enhancement was performed,respectively,on the generated RGB images and the depth images to improve their realism,so that they are suited for the detection in real scenes.Next,the YOLOv7-mask instance segmentation model was trained with synthetic datasets and tested by real data.The results demonstrate the effectiveness of the proposed method.Secondly,the ES6D model was utilized to estimate target poses based on the segmentation results,and an online posture evaluation method was proposed to automatically filter out severely distorted estimation results.Finally,a pose estimation correction strategy based on active vision technique was proposed to guide the robot arm to move to a new viewpoint for re-detection,which can effectively solve the problem of pose estimation deviation caused by occlusion.The above methods have been verified on a self-built 6-DoF industrial robot vision sorting system.The experimental results show that the proposed algorithm can well meet the requirements of recognition and 6-DoF posture estimation of common workpieces in complex environments.

作者胡广华欧美彤李振东 HU Guanghua;OU Meitong;LI Zhendong(School of Mechanical and Automotive Engineering,South China University of Technology,Guangzhou 510640,Guangdong,China)

机构地区华南理工大学机械与汽车工程学院

出处《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2024年第4期42-50,共9页 Journal of South China University of Technology(Natural Science Edition)

基金广东省自然科学基金资助项目(2022A1515010806) 广州市科技计划项目(2023B01J0046)。

关键词目标识别位置测量 6-DoF位姿估计机器人自动分拣 RGB-D图像 object recognition position measurement 6-DoF pose estimation robot automatic sorting RGB-D image

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1王高,陈晓鸿,柳宁,李德平.一种基于视角选择经验增强算法的机器人抓取策略[J].华南理工大学学报（自然科学版）,2022,50(9):126-137. 被引量：5
2翟敬梅,黄乐.机器人无序分拣技术研究[J].包装工程,2022,43(8):66-75. 被引量：3

二级参考文献10

1王德明,颜熠,周光亮,李勇奇,刘成菊,林立民,陈启军.基于实例分割网络与迭代优化方法的3D视觉分拣系统[J].机器人,2019,41(5):637-648. 被引量：17
2聂海涛,龙科慧,马军,刘金国.采用改进尺度不变特征变换在多变背景下实现快速目标识别[J].光学精密工程,2015,23(8):2349-2356. 被引量：28
3颜培清,何炳蔚,雷阿唐,张立伟,韩国强.基于深度信息的多目标抓取规划方法研究[J].电子测量与仪器学报,2016,30(9):1342-1350. 被引量：4
4伍锡如,黄国明,孙立宁.基于深度学习的工业分拣机器人快速视觉识别与定位算法[J].机器人,2016,38(6):711-719. 被引量：54
5李晓菲.库柏特:让工业机器人更聪明[J].支点,2018,0(1):78-81. 被引量：1
6马灼明,朱笑笑,孙明镜,曹其新.面向物流分拣任务的自主抓取机器人系统[J].机械设计与研究,2019,35(6):10-16. 被引量：13
7彭刚,廖金虎.插件元器件分拣机器人系统设计与实现[J].华中科技大学学报（自然科学版）,2020,48(1):108-114. 被引量：15
8田立勋,刘雄飞,张彩芹,王文佳,傅建中.基于深度学习的低成本堆叠物料定位系统[J].北京理工大学学报,2020,40(9):963-969. 被引量：5
9周祺杰,刘满禄,李新茂,张华.基于深度强化学习的固体放射性废物抓取方法研究[J].计算机应用研究,2020,37(11):3363-3367. 被引量：3
10张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42. 被引量：10

共引文献6

1杨惠,杨爱慧,吕春贺.基于产品语义学的物流机器人造型设计研究[J].工业设计,2023(10):28-31. 被引量：2
2陈泽瑜,李向国,曹登锋,朱灯林.面向无序抓取的DPC聚类多目标检测方法研究[J].计算机工程与应用,2023,59(23):175-182.
3王利祥,郭向伟,卢明星.FPN算法在视觉感知机器人抓取控制的应用研究[J].机械设计与制造,2024(4):303-307.
4刘帅,邓强国.面向机器人加工复杂轮廓误差控制的策略研究[J].机床与液压,2024,52(11):40-46.
5张续冲,杨俊.基于视觉的仿人机器人自主抓取研究[J].华南理工大学学报（自然科学版）,2024,52(7):53-61.
6张燚佟,高锐,余文泉.工业机器人在竹加工领域中的应用[J].世界竹藤通讯,2024,22(4):119-123.

1江屾,殷时蓉,罗天洪,郑讯佳,张洪杰.基于改进YOLOv4的多目标车辆检测算法[J].计算机工程与设计,2024,45(4):1181-1188.
2张印,胡挺,李猷兴,王剑,苑立波.基于条件对抗生成网络数据增强的相敏光时域反射仪模式识别[J].光学学报,2024,44(1):409-419.
3钟兵.UHF RFID血液实时盘库系统的设计与实现[J].电子技术（上海）,2024,53(1):42-45.
4机修问答[J].中外缝制设备,2024(3):55-56.
5夏楠,马昕昕,王思琦.强干扰下基于三阶互累积量的FMCW雷达信号DOA估计算法[J].电子学报,2024,52(2):510-517. 被引量：1
6刘俊芳.扩展现实(XR)技术应用于国际中文教育中的现状及展望[J].云南师范大学学报（对外汉语教学与研究版）,2024,22(2):60-70. 被引量：1
7李天皓,姚磊,张帅龙.模块化多电平变换器改进两段式模型预测控制[J].电力自动化设备,2024,44(4):96-104. 被引量：1
8紫金矿业:刚果(金)项目因铀超标停产[J].股市动态分析,2024(8):40-40.
9程涛,杨明,吴小龙.基于压缩感知的兰姆波下采样和损伤定位[J].机械设计与制造,2024(4):77-80.
10薛小锋,赵淼龑,杜倩宜,冯蕴雯,樊俊铃,焦婷.基于人员和环境因素定量化的检测可靠性[J].航空学报,2024,45(6):298-308.

华南理工大学学报（自然科学版）

2024年第4期

浏览历史

内容加载中请稍等...

基于合成数据集的多目标识别与6-DoF位姿估计

参考文献2

二级参考文献10

共引文献6

相关作者

相关机构

相关主题

浏览历史