-
题名用于6D姿态估计的轻量级全流双向融合网络
- 1
-
-
作者
林浩田
李永昌
江静
秦广军
-
机构
北京联合大学智慧城市学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第22期282-291,共10页
-
基金
北京联合大学科研项目(ZKZD202301)。
-
文摘
六自由度(six degrees of freedom,6D)姿态估计是机器人抓取与操作、增强现实、自动驾驶等应用中的关键步骤。常规的6D姿态估计方法更多地侧重于设计复杂的网络来提高估计效果,而忽略了由于模型复杂度过高和参数数量庞大导致的实际部署困难问题。以FFB6D为基线,尝试设计了一个轻量级全流双向融合网络(lightweight full-flow bidirectional fusion network,LFFB6D),一种基于RGBD的轻量级6D姿态估计方法。该方法由卷积神经网络(convolutional neural network,CNN)与点云网络(point cloud network,PCN)两个并行的编码-解码网络组成。具体来说在CNN部分,引入FasterNet来代替3×3卷积。通过更换CNN的编码网络,提出了一个上采样模块FUPB(faster upsample block),以减少网络参数。在PCN部分,引入PoolFormer来处理和聚合点云特征。提出了一个新的池化模块PFPB(PoolFormer pooling block),以提高网络的性能。实验表明,LFFB6D的参数量相较FFB6D减少了46%。在仅使用1/13的LineMOD训练集和1/9的YCB-Video训练集的情况下,LFFB6D的6D姿态估计结果超越了PoseCNN、DenseFusion等方法,达到了与PVN3D和FFB6D相近的结果。
-
关键词
RGBD
姿态估计
轻量化
FasterNet
poolformer
-
Keywords
RGBD
pose estimation
lightweight
FasterNet
poolformer
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-