基于深度学习的三维体素重建改进方法被引量：1

Improved 3D voxel reconstruction method based on deep learning

下载PDF

导出

摘要针对利用深度学习进行三维体素重建时网络结构通常较为复杂且训练过程需要大量标注的问题,提出了基于深度学习的三维体素重建改进方法。该方法在训练或测试时不需要任何图像注释或对象标签,且网络模型中去除了冗杂的残差模块。为进一步提升重建模型精度,网络首先利用标准的CNN结构对输入图像编码为低维特征,然后利用LSTM单元选择性的更新它们的单元状态或维持原状态,最后解码器解码LSTM单元的隐藏状态并完成3D概率体素重建。使用端到端的网络从大量的合成数据中学习目标物体图像到其3D形状的映射,通过训练编码器和解码器,使得训练模型能够接收目标物体的一个或多个任意角度的图像,并输出该物体的体素模型。在ShapeNet数据集上的实验证明了,此改进方法能在无残差模块且占用较少资源情况下获得更好的重建效果。 An improved method for 3D voxel reconstruction based on deep learning is proposed to address the problem that the network structure is usually complex and the training process requires a large number of annotations when using deep learning for 3D voxel reconstruction.The method does not require any image annotation or object labe-ling during training or testing,and the redundant residual modules are removed from the network model.To further im-prove the reconstruction model accuracy,the network first encodes the input images as low-dimensional features using standard CNN structures,then selectively updates their cell states or maintains the original states using LSTM cells,and finally the decoder decodes the hidden states of the LSTM cells and completes the 3D probabilistic voxel recon-struction.The end-to-end network is used to learn the mapping of the target object image to its 3D shape from a large amount of synthetic data by training the encoder and decoder so that the training model can receive one or more arbi-trary angles of the target object and output the voxel model of the object.Experiments on the ShapeNet dataset demon-strate that this improved method can achieve better reconstruction results without residual modules and with less re-source consumption.

作者朱德榕贺赛先 ZHU Derong;HE Saixian(Electronic Information School,Wuhan University,Wuhan 430000,China)

机构地区武汉大学电子信息学院

出处《激光杂志》 CAS 北大核心 2021年第8期39-44,共6页 Laser Journal

关键词深度学习三维重建 LSTM 体素模型 deep learning 3D reconstruction LSTM Voxel model

分类号 TN209 [电子电信—物理电子学]

引文网络
相关文献

参考文献4

1侯晓芬,邢帅,马东洋,耿迅,李鹏程,葛忠孝.面向序列影像的三维场景重建方法[J].测绘科学,2016,41(2):126-129. 被引量：12
2蒋昂波,王维维.ReLU激活函数优化研究[J].传感器与微系统,2018,37(2):50-52. 被引量：103
3陈加,张玉麒,宋鹏,魏艳涛,王煜.深度学习在基于单幅图像的物体三维重建中的应用[J].自动化学报,2019,45(4):657-668. 被引量：27
4任进军,王宁.人工神经网络中损失函数的研究[J].甘肃高师学报,2018,23(2):61-63. 被引量：42

二级参考文献20

1POLLEFEYS M,KOCH R,VERGAUWEN M.Automated reconstruction of 3Dscenes from sequences of images[J].ISPRS Journal of Photogrammetry&Remote Sensing,2000,55:251-267.
2KOCH R,POLLEFEYS M,VAN GOOL L.Realistic surface reconstruction of 3Dscenes from uncalibrated image sequences[J].The Journal of Visualization and Computer Animation,2000,11:115-127.
3KOLMOGOROV V,ZABIH R.Multi-camera scene reconstruction via graph cuts[C]//ECCV,2002,3:82-96.
4HERNANDEZ C,SCHMITT F.Silhouette and stereo fusion for 3Dobject modeling[J].CVIU,2004,96(3):367-392.
5FURUKAWA Y,PONCE J.High fidelity image based modeling[R].UIUC,2006.
6FURUKAWA Y,PONCE J.Accurate dense and robust multi-view stereopsis[C]//CVPR,2007.
7LOWE D G.Distinctive image features from scale invariant key points[J].IJCV,2004,60(2):91-110.
8BENTLEY J L.Multidimensional binary search trees used for associative searching[J].Communications of the ACM,1975,18(9):509-517.
9SILPA-ANAN C,HARTLEY R.Optimized KD-trees for fast image descriptor matching[C]//IEEE Conference on Computer Vision and Pattern Recognition,2008:1-8.
10FISCHLER M A,BOLLES R C.Random sample consensus:aparadigm for model fitting with application to image analysis and automated cartography[J].Communication Association Machine,1981,24(6):381-395.

共引文献180

1何戡,曲超,宗学军,杨忠君,李长新,娄伦武.面向复合肥生产智能管控平台研究与应用[J].控制工程,2020,27(S01):13-18.
2郝本利,张龙波,王雷,常春红,邢艺馨.改进特征匹配策略的感兴趣区域三维重建[J].智能计算机与应用,2020(7):23-28.
3陈立波,聂倩,陶鹏杰.基于LiDAR点云控制的倾斜影像高精度几何定向技术研究[J].测绘地理信息,2021,46(S01):49-52. 被引量：5
4周敏,张俊然,李南欣.基于轴向空间注意力和中间融合表示的单图像三维重建模型[J].半导体光电,2023,44(1):122-127. 被引量：1
5李昕.适应一个更温暖的世界[J].国外科技动态,2000(1):38-39.
6孙家燕,吴红.设计部门编制施工图预算是控制工程造价方法的探讨[J].黑龙江科技信息,2000(5):66-66. 被引量：2
7于海洋,曾春伟,马慧慧,高永红.基于SfM-MVS的高山区无人机航摄数据处理[J].河南城建学院学报,2017,26(2):83-87. 被引量：2
8唐封强,韩理光,张晓露,闫恩诚.建筑园林三维测绘场景真实性建模仿真[J].计算机仿真,2017,34(7):412-415. 被引量：7
9段晓芳,滕树勤.高层住宅场景可视化三维真实性建模仿真[J].计算机仿真,2017,34(9):218-221. 被引量：2
10李金明.多视觉动画图像三维重建特征点匹配优化仿真[J].计算机仿真,2017,34(9):341-344. 被引量：12

同被引文献8

1张壮雅,赵珂,段明德.基于体素模型的多孔结构骨支架快速建模[J].机械设计与研究,2018,34(6):129-133. 被引量：3
2陈利平,彭彩红.游戏模拟法在软件工程课程设计中的应用分析[J].科技创新导报,2016,13(6):130-130. 被引量：1
3李想,唐东明.多指标分析的游戏物品随机合成系统的设计与实现[J].西南民族大学学报（自然科学版）,2020,46(3):291-302. 被引量：2
4周正,司占军,秦雷.开放世界类型游戏的设计与制作[J].电脑知识与技术,2020,16(22):1-2. 被引量：2
5于万国,胡宗森,隋丽娜,迟剑,蔡永华,傅冬颖.新工科下软件工程专业实践案例构建研究——以基于Cocos2d-x引擎的跨平台游戏开发为例[J].计算机技术与发展,2021,31(2):191-196. 被引量：7
6左万娟,董燕,黄晨,王小丽.航天嵌入式软件代码逻辑分析[J].计算机系统应用,2021,30(8):274-280. 被引量：3
7龚鑫,乔爱玲.基于游戏的体验式学习对计算思维的影响[J].现代教育技术,2021,31(11):119-126. 被引量：8
8吴晓军,刘伟军,王天然.基于三维体素模型的功能梯度材料信息建模[J].计算机集成制造系统-CIMS,2004,10(3):270-275. 被引量：15

引证文献1

1崔梦天,董国庆,姜玥,何健圣,李裕岚,吴蕾蕾.基于代码层游戏规则设计的体素游戏表现力研究[J].西南民族大学学报（自然科学版）,2022,48(3):303-312.

1杜金星,麻安鹏,王君,杨本娟.基于主动学习的深度医学图像分析算法综述[J].计算机时代,2021(2):8-11.
2郭文康,梅剑东,孙荣川,郁树梅,孙立宁.基于三角剖分的内窥镜肠道手术机器人体素地图构建方法[J].机器人,2021,43(4):395-405.
3肖思昌,靳经,潘敏,柳明.基于机器学习的多类目标识别方法分析[J].中国设备工程,2021(16):24-25. 被引量：6
4徐家伟,刘瑞芳,高升,李思.面向中文成语的阅读理解方法研究[J].中文信息学报,2021,35(7):118-125. 被引量：2
5吴凯枫,张立新,王军昂,王赛.基于树莓派的人脸识别门禁系统[J].电子测试,2021,32(17):5-7. 被引量：9
6吴杨,张海翔,马汉杰,蒋明峰,冯杰.3D形状体素的多尺度残差特征编码方法研究[J].无线电工程,2021,51(9):848-856.
7朱育正,张亚萍,冯乔生.基于深度学习的单视图彩色三维重建[J].激光与光电子学进展,2021,58(14):199-207. 被引量：8
8张必慧.基于小波变换的图像压缩[J].应用数学进展,2021,10(8):2847-2852.
9周靖,刘煜,霍林生.基于机器视觉的螺栓松动旋转角度测量[J].机械设计与研究,2021,37(4):159-162. 被引量：18
10伊小蝶,吴帮玉,孟德林,曹相湧.数据增广和主动学习在波阻抗反演中的应用[J].石油地球物理勘探,2021,56(4):707-715. 被引量：8

激光杂志

2021年第8期

浏览历史

内容加载中请稍等...

基于深度学习的三维体素重建改进方法被引量：1

参考文献4

二级参考文献20

共引文献180

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的三维体素重建改进方法 被引量：1

参考文献4

二级参考文献20

共引文献180

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的三维体素重建改进方法被引量：1