-
题名基于多模态关系建模的三维形状识别方法
被引量:2
- 1
-
-
作者
陈浩楠
朱映映
赵骏骐
田奇
-
机构
深圳大学计算机与软件学院
华为技术有限公司
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第5期2208-2219,共12页
-
基金
国家自然科学基金(62072318)
广东省自然科学基金(2021A1515012014)
深圳市科技研发资金重点项目B类(20220810142553001)。
-
文摘
为了充分利用点云和多视图两种模态数据之间的局部空间关系以进一步提高三维形状识别精度,提出一个基于多模态关系的三维形状识别网络,首先设计多模态关系模块(multimodal relation module,MRM),该模块可以提取任意一个点云的局部特征和一个多视图的局部特征之间的关系信息,以得到对应的关系特征.然后,采用由最大池化和广义平均池化组成的级联池化对关系特征张量进行处理,得到全局关系特征.多模态关系模块分为两种类型,分别输出点-视图关系特征和视图-点关系特征.提出的门控模块采用自注意力机制来发现特征内部的关联信息,从而将聚合得到的全局特征进行加权来实现对冗余信息的抑制.详尽的实验表明多模态关系模块可以使网络获得更优的表征能力;门控模块可以让最终的全局特征更具判别力,提升检索任务的性能.所提网络在三维形状识别标准数据集ModelNet40和ModelNet10上分别取得了93.8%和95.0%的分类准确率以及90.5%和93.4%的平均检索精度,在同类工作中处于先进水平.
-
关键词
三维形状识别
关系建模
多模态学习
-
Keywords
3D shape recognition
relation modeling
multimodal learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多任务学习的有限样本多视角三维形状识别算法
- 2
-
-
作者
周子钦
严华
-
机构
四川大学电子信息学院
-
出处
《计算机科学》
CSCD
北大核心
2020年第4期125-130,共6页
-
基金
四川省重点研发项目(2019YFG0409)。
-
文摘
随着三维扫描技术的快速发展,三维形状分析得到了学术界的广泛关注;尤其是深度学习在计算机视觉上取得的显著成功,使得基于多视图的三维形状识别方法成为了目前三维模型识别的主流方式。已有研究表明,三维数据集的数量对于最终的分类精度是一个非常重要的影响条件。然而,由于专业三维扫描设备的限制,三维形状数据难以采集。实际上,现有的公共基准三维数据集的规模远远小于二维数据集,三维形状分析的发展因此受到阻碍。为了解决这一问题,文中主要研究在极小数据样本情况下,三维形状识别问题的优化解策略。受多任务学习的启发,搭建了多分支的网络结构,并引入基于度量学习的辅助比较模块,用于挖掘类内和类间的相似性和差异性信息。网络模型包括主支路与辅助支路,分别使用不同的损失函数对应不同的训练任务,并使用权值超参数平衡多项损失。主支路获得预测分类,使用交叉熵损失函数进行更新;辅助支路得到不同样本间的相似性得分,使用均方差损失函数进行更新。为保证特征向量被投影到同一个空间中,主、辅助支路共享相同的特征提取模块,在训练阶段共同更新参数,在测试阶段仅使用主支路获得的分类结果。在两个公开的三维形状基准数据集上的大量实验结果表明,所提网络结构与训练策略相比传统方法,在少样本的情况下可以显著提高特征模块对不同类别的区分能力,获得更优的识别结果。
-
关键词
多视图三维形状
有限样本
辅助支路
多任务学习
三维形状识别
-
Keywords
Multi-view 3D shape
Limit data
Auxiliary branch
Multi-task learning
3D shape recognition
-
分类号
TP391.413
[自动化与计算机技术—计算机应用技术]
-
-
题名面向三维目标的矢量型卷积网络
被引量:1
- 3
-
-
作者
邱起璐
赵杰煜
陈瑜
-
机构
宁波大学信息科学与工程学院
浙江省移动网应用技术重点实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2022年第3期271-282,共12页
-
基金
国家自然科学基金项目(No.62071260,62006131,61603202)
浙江省自然科学基金项目(No.LZ22F020001,LY17F030002,LY20F030005)资助。
-
文摘
目前,三维目标识别方法大多基于卷积神经网络,在特征聚合过程中过多使用池化层,导致三维目标的空间信息丢失.针对上述问题,文中提出面向三维目标的矢量型卷积网络,用于完成三维目标的识别.首先,使用曲面多项式拟合网格目标的局部区域.然后,使用聚类算法得出曲面形状卷积核,通过卷积核和目标表面的相似度度量生成结构感知的特征向量,再利用多头自注意力机制模块实现局部区域到更大范围的特征聚集,得到部件层次特征向量.最后,使用三维矢量型网络实现目标分类.文中网络在SHREC10、SHREC11、SHREC15数据集上均取得较高的分类精度.此外,多分辨率目标对比实验和多采样点对比实验验证文中网络具有较强的泛化性和鲁棒性.
-
关键词
三维形状识别
矢量型卷积网络
结构感知
三维矢量网络
-
Keywords
3D Shape Recognition
Vector-Type Convolutional Network
Structure-Aware
3D Vector Network
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-