基于多视图循环神经网络的三维物体识别被引量：3

Recognition of 3D Object Based on Multi-View Recurrent Neural Networks

下载PDF

导出

摘要对于三维物体的识别任务,基于多视图卷积神经网络的方法(MVCNN)在准确性和训练速度等方面都优于基于三维数据表示的方法。但MVCNN依赖于三维模型,且采用了固定视角的视图,不符合实际的应用场景;此外,其视图特征融合采用了最大值池化操作,会损失部分原始特征信息。针对这一问题,该文提出了一种基于多视图循环神经网络(MVRNN)的三维物体识别方法,从3个方面对MVCNN进行改进。首先,在交叉熵损失函数中引入特征辨识度指标,以提高不同物体特征之间的辨识度;其次,使用循环神经网络代替MVCNN的最大值池化操作来融合多个自由视觉视图特征,得到一个更加紧凑且物体外观信息完备的融合特征;最后,利用二分类网络对自由视角单视图特征和融合特征进行匹配,实现三维物体的细粒度识别。为了验证MVRNN的性能,分别在公开数据集ModelNet和自建数据集MV3D上进行对比实验。实验结果表明,与MVCNN相比,MVRNN提取的多视图特征具有更高的辨识度,在两个数据集上的识别准确率均较有明显提升。 Multi-view convolutional neural networks(MVCNN)is more accurate and faster than those methods based on state-of-the-art 3D shape descriptors in 3D object recognition tasks.However,the input of MVCNN are views rendered from cameras at fixed positions,which is not the case of most applications.Furthermore,MVCNN uses max-pooling operation to fuse multi-view features and the information of original features may be lost.To address those two problems,a new recognition method of 3D objects based on multi-view recurrent neural networks(MVRNN)is proposed based on MVCNN with improvements on three aspects.First,a new item which is defined as the measure of discrimination is introduced into the cross-entropy loss function to enhance the discrimination of features from different objects.Second,a recurrent neural networks(RNN)is used to fuse multi-view features from free positions into a compact one,instead of the max-pooling operation in MVCNN.RNN can keep the completeness of information about appearance feature.At last,single view feature from free positon is matched with fused features via a bi-classification network to attain fine-grained recognition of 3D objects.Experiments are conducted on the open dataset ModelNet and the private dataset MV3D separately to validate the performance of MVRNN.The results show that MVRNN can exact multi-view features with higher degree of discrimination,and achieve higher accuracy than MVCNN on both datasets.

作者董帅李文生张文强邹昆 DONG Shuai;LI Wen-sheng;ZHANG Wen-qiang;ZOU Kun(Zhongshan Institute,University of Electronic Science and Technology of China Zhongshan Guangdong 528406)

机构地区电子科技大学中山学院

出处《电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期269-275,共7页 Journal of University of Electronic Science and Technology of China

基金国家青年科学基金(61502088) 广东省自然科学基金(2016A030313018) 广东省高等学校优秀青年教师培养计划(Yq2013206)。

关键词三维物体特征提取特征融合图像检索多视图 3D object feature extraction feature fusion image retrieval multi-view

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献23

1甄勇,刘伟,赵拥军,陈建宏.大场景SAR图像舰船目标快速检测[J].信息工程大学学报,2016,17(5):535-540. 被引量：4
2姚琼,徐翔,邹昆.基于异质多视图主动学习的高光谱地物分类[J].计算机应用与软件,2018,35(2):1-6. 被引量：3
3唐超,王文剑,王晓峰,张琛,邹乐.基于多视图半监督学习的人体行为识别[J].模式识别与人工智能,2019,32(4):376-384. 被引量：7
4张宜浩,朱小飞,徐传运,董世都.基于用户评论的深度情感分析和多视图协同融合的混合推荐方法[J].计算机学报,2019,42(6):1316-1333. 被引量：57
5朱正伟,张静,饶鹏,陈忻.一种用于三维重建的多视图前景目标自动分割算法[J].计算机应用与软件,2019,36(6):209-213. 被引量：2
6洪敏,贾彩燕,李亚芳,于剑.样本加权的多视图聚类算法[J].计算机研究与发展,2019,56(8):1677-1685. 被引量：12
7刘永利,郭呈怡,刘静,吴岩.结合FCS的多视图模糊聚类算法[J].西安电子科技大学学报,2019,46(4):99-106. 被引量：3
8邓轩,廖开阳,郑元林,袁晖,雷浩,陈兵.基于深度多视图特征距离学习的行人重识别[J].计算机应用,2019,39(8):2223-2229. 被引量：5
9杨亚楠,赵文辉,张健,谭珅,张贝贝.基于多视图协同的政策文本可视化研究[J].数据分析与知识发现,2019,3(6):30-41. 被引量：5
10刘辰,肖志勇,杜年茂.改进的卷积神经网络在医学图像分割上的应用[J].计算机科学与探索,2019,13(9):1593-1603. 被引量：27

引证文献3

1柯青青,李润生,胡庆,牛朝阳,刘伟.基于YOLOv3深度卷积神经网络的遥感图像飞机目标识别[J].信息工程大学学报,2020,21(5):526-533. 被引量：3
2杨凡,饶雨泰.基于双向稀疏的多视图子空间学习算法[J].计算机应用与软件,2023,40(6):266-275. 被引量：1
3鲁芬,郁伯铭.复杂网络下机械零件三维轻量级识别方法[J].机械设计与制造,2023(8):148-151.

二级引证文献4

1李仕佳.基于深度学习的遥感影像目标检测研究[J].科技创新导报,2021,18(24):109-111.
2何远,彭积超,何启友.基于深度学习的无人机遥感图像目标识别方法研究[J].工程与建设,2022,36(6):1615-1618. 被引量：5
3严恩萍,莫登奎.基于改进Mask RCNN的散坟火灾隐患点自动检测与空间分析[J].自然灾害学报,2023,32(2):99-107. 被引量：2
4许春荣,买买提依明·哈斯木.案例教学模式下的稀疏矩阵的概念与应用[J].电脑迷,2023(17):79-81.

1岁月生.“敦煌歌辞写本整理与研究”简介[J].商丘师范学院学报,2019,35(11).
2张尧娉.弗仑提努斯《论水道》及其史料价值[J].史学史研究,2019,0(4):56-63.
3张贝娜,冯震华,张丰,杜震洪,刘仁义,周芹.基于时空多视图BP神经网络的城市空气质量数据补全方法研究[J].浙江大学学报（理学版）,2019,46(6):737-744. 被引量：4
4石广丰,王雪,王淑坤,郭丰杰,于大伟.基于机器视觉的金刚石原石检测系统[J].金刚石与磨料磨具工程,2019,39(6):7-12. 被引量：3
5佟少华.胺碘酮联合美托洛尔在心律失常临床治疗中的应用价值体会[J].临床医药文献电子杂志,2019,6(91):173-173. 被引量：1
6董啸雷,郭世豪.PSO-AHC聚类算法在图像检索中的应用研究[J].数码设计,2019,8(15):41-41.
7乔婷婷,李鲁群.结合数据增广和迁移学习的高分辨率遥感影像场景分类[J].测绘通报,2020(2):37-42. 被引量：13
8刘万军,王凤,曲海成.融合多尺度特征的目标检测模型[J].激光与光电子学进展,2019,56(23):116-126. 被引量：5
9陈世杰,吴贤国,姚春桥,冯宗宝,王丙苗,韩鹏.基于压缩感知隧道结构健康监测与可靠性评价[J].铁道标准设计,2019,63(11):101-109. 被引量：5
10彭明霞,夏俊芳,彭辉.融合FPN的Faster R-CNN复杂背景下棉田杂草高效识别方法[J].农业工程学报,2019,35(20):202-209. 被引量：58

电子科技大学学报

2020年第2期

浏览历史

内容加载中请稍等...

基于多视图循环神经网络的三维物体识别被引量：3

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视图循环神经网络的三维物体识别 被引量：3

同被引文献23

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多视图循环神经网络的三维物体识别被引量：3