基于双向递归卷积神经网络的单目红外视频深度估计被引量：11

Depth Estimation from Monocular Infrared Video Based on Bi-Recursive Convolutional Neural Network

导出

摘要考虑到红外视频的深度特征具有单帧图像的独特性和视频全局的连续性,在单目红外视频深度估计问题上提出一种基于双向递归卷积神经网络(BrCNN)的深度估计方法。BrCNN在卷积神经网络(CNN)能够提取单帧图像特征的基础之上引入循环神经网络(RNN)传递序列信息机制,使其既具有CNN良好的图像特征提取能力,能够自动提取视频中每一帧图像的局部特征,又具有RNN良好的序列特征提取能力,能够自动提取视频中每一帧图像所包含的序列信息,并向后递归传递这种信息。采用双向递归的视频序列信息传递机制来估计红外视频的深度,提取到的每一帧图像的特征都包含了视频前后文的序列信息。实验结果表明,相对于传统CNN提取单帧图像特征进行的估计,使用BrCNN能够提取更具有表达能力的特征,估计出更精确的深度。 For depth estimation from monocular infrared video, a method based on bi-recursive convolutional neural network （BrCNN） is proposed considering the uniqueness of a single frame and the continuity of the entire infrared video. BrCNN introduces the sequence information transfer mechanism of recurrent neural network （RNN） on the basis of the single frame feature extracted by the convolutional neural network （CNN）. Thus, BrCNN possesses the feature extraction ability of CNN for a single image, which can automatically extract the local features of each frame in the infrared video, and the sequence information extraction ability of RNN, which can automatically extract the sequence information contained in each frame of the infrared video and recursiveIy transfer this information. By introducing the bi-recursive sequence information transfer mechanism to estimate the depth of monocular infrared video, features extracted from each image containing the context information. The experimental results show that BrCNN can extract more expressive features and estimate the depth from the infrared video more precisely than the traditional CNN, which estimate the depth by extracting the feature of a single frame.

作者吴寿川赵海涛孙韶媛

机构地区华东理工大学信息科学与工程学院东华大学信息科学与技术学院

出处《光学学报》 EI CAS CSCD 北大核心 2017年第12期246-254,共9页 Acta Optica Sinica

基金国家自然科学基金(61375007) 上海市科委基础研究项目(15JC1400600)

关键词机器视觉双向递归卷积深度估计单目红外视频深度神经网络 machine vision bi-recursive convolution depth estimation monocular infrared video deep neural network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1席林,孙韶媛,李琳娜,邹芳喻.基于SVM模型的单目红外图像深度估计[J].激光与红外,2012,42(11):1311-1315. 被引量：12
2许路,赵海涛,孙韶媛.基于深层卷积神经网络的单目红外图像深度估计[J].光学学报,2016,36(7):188-197. 被引量：26

二级参考文献29

1Daniel Scharstein, Richard Szeliski. A taxonomy and eval-uation of dense two-frame stereo correspondence algo-rithms [J]. International Journal of Computer Vision,2002,47(1):7 -42.
2Horn B K B. Obtaining shape from shading information,chapter 4 in the psychology of computer vision [ M] . NewYork:McGraw Hill, 1975: 115 - 155.
3Ashutosh Saxena, Andrew Ng, Sung Chung. Learningdepth from single monocular images[ C]. NIPS,2005 ,18 :44-58.
4Derek Hoiem,Alexei A Efros,Martial Hebert. Automaticphoto pop-up [ J]. ACM Transactions on Graphics,2005,24(3) :577 -584.
5古小婧.基于图像分析的自然彩色夜视成像方法研究[D].上海:东华大学,2011.
6Hendrix Claudia,Barfield Woodrow. Relationship betweenmonocular and binocular depth cues for judgements ofspatial information and spatial instrument design[ J] . Dis-plays, 1995 ,16(3) :103-113.
7Saxena A, Chung S H, Ng A Y. 3-D depth reconstruction from a single still image[J]. International Journal of Computer Vision, 2008, 76(1): 53-69.
8Horn B K P. Obtaining shape from shading information[M]. New York: MIT Press, 1989: 123-171.
9Saxena A, Chung S H, Ng A Y. Learning depth from single monocular images [C]. Advances in Neural Information Processing Systems, 2005: 1161-1168.
10Saxena A, Sun M, Ng A Y. Make 3D: Learning 3D scene structure from a single still image[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(5): 824-840.

共引文献35

1孙韶媛,席林,赵海涛.车载红外图像彩色化的立体感实现方法[J].东华大学学报（自然科学版）,2013,39(3):344-348. 被引量：1
2孙韶媛,李琳娜,赵海涛.采用KPCA和BP神经网络的单目车载红外图像深度估计[J].红外与激光工程,2013,42(9):2348-2352. 被引量：12
3宋晓炜,杨蕾,吴源昭,杨满意,刘洲峰.基于双目会聚型立体摄像机的目标深度测量[J].激光与红外,2015,45(7):844-849. 被引量：2
4沈振一,孙韶媛,赵海涛.基于PP-MRF模型的单目车载红外图像三维重建[J].东华大学学报（自然科学版）,2015,41(3):341-347. 被引量：9
5许路,赵海涛,孙韶媛.基于深层卷积神经网络的单目红外图像深度估计[J].光学学报,2016,36(7):188-197. 被引量：26
6何建争,简慧杰,马孟超,王克逸.基于虚拟双球面的仿生复眼系统标定[J].光学学报,2017,37(7):220-230. 被引量：3
7叶国林,孙韶媛,高凯珺,赵海涛.基于加速区域卷积神经网络的夜间行人检测研究[J].激光与光电子学进展,2017,54(8):117-123. 被引量：25
8高琳,王俊峰,范勇,陈念年.基于卷积神经网络与一致性预测器的稳健视觉跟踪[J].光学学报,2017,37(8):222-231. 被引量：8
9姚广顺,孙韶媛,方建安,赵海涛.基于红外与雷达的夜间无人车场景深度估计[J].激光与光电子学进展,2017,54(12):158-164. 被引量：9
10侯聪聪,何宇清,姜晓恒,潘静.基于二分支卷积单元的深度卷积神经网络[J].激光与光电子学进展,2018,55(2):186-192. 被引量：4

同被引文献45

1朱黎博,孙韶媛,谷小婧,夏如镜,叶茂锹.基于色彩传递与扩展的图像着色算法[J].中国图象图形学报,2010,15(2):200-205. 被引量：22
2代中华,孙韶媛,许真,谷小婧.一种车载红外视频彩色化算法[J].红外技术,2010,32(10):595-600. 被引量：8
3谯帅,孙韶媛,谷小婧,戈曼.基于轮廓跟踪的车载红外视频彩色化方法[J].应用光学,2012,33(4):727-732. 被引量：5
4田延冰,白剑,黄治.基于全景环带立体成像系统的深度信息估计[J].光学学报,2013,33(6):71-79. 被引量：8
5孙韶媛,李琳娜,赵海涛.采用KPCA和BP神经网络的单目车载红外图像深度估计[J].红外与激光工程,2013,42(9):2348-2352. 被引量：12
6韩冰,仇文亮.一种特征显著性编码的极光图像分类方法[J].西安电子科技大学学报,2013,40(6):180-186. 被引量：6
7丁伟利,李勇,王文锋,曹秀燕.基于轮廓特征理解的城市道路图像深度估计[J].光学学报,2014,34(7):165-171. 被引量：9
8郭连朋,陈向宁,刘彬,刘田间.基于Kinect传感器多深度图像融合的物体三维重建[J].应用光学,2014,35(5):811-816. 被引量：20
9王倩,胡红桥,胡泽骏,丘琪.基于全天空图像的极光活动变化检测方法研究[J].地球物理学报,2015,58(9):3038-3047. 被引量：3
10宋亚婷,韩冰,高新波.基于张量动态纹理模型的极光视频分类[J].南京大学学报（自然科学版）,2016,52(1):184-193. 被引量：2

引证文献11

1鲍振强,李艾华,崔智高,袁梦.深度学习在视觉定位与三维结构恢复中的研究进展[J].激光与光电子学进展,2018,55(5):62-70. 被引量：2
2顾婷婷,赵海涛,孙韶媛.基于帧间信息提取的单幅红外图像深度估计[J].激光与光电子学进展,2018,55(6):163-172. 被引量：8
3安喆,徐熙平,杨进华,乔杨,刘洋.结合图像语义分割的增强现实型平视显示系统设计与研究[J].光学学报,2018,38(7):77-83. 被引量：21
4李佳豪,孙韶媛,吴雪平,李大威.基于双通道循环生成对抗网络的无人车夜视红外视频彩色化[J].激光与光电子学进展,2018,55(9):319-325. 被引量：2
5刘杰平,周华盛,余朗衡,丁树浩,梁亚玲.基于视觉词典的深度图生成算法[J].光学学报,2018,38(9):268-276. 被引量：3
6张浩,陈昌红.基于深度学习的极光序列自动分类方法[J].激光与光电子学进展,2018,55(11):340-348. 被引量：4
7袁建中,周武杰,潘婷,顾鹏笠.基于深度卷积神经网络的道路场景深度估计[J].激光与光电子学进展,2019,56(8):171-179. 被引量：7
8刘孝保,陆宏彪,阴艳超,陈志成.基于多元神经网络融合的分布式资源空间文本分类研究[J].计算机集成制造系统,2020,26(1):161-170. 被引量：8
9陈裕如,赵海涛.基于自适应像素级注意力模型的场景深度估计[J].应用光学,2020,41(3):490-499. 被引量：4
10朱思敏,赵海涛.基于注意力机制与图卷积神经网络的单目红外图像深度估计[J].应用光学,2021,42(1):49-56. 被引量：3

二级引证文献60

1冯明驰,卜川夏,萧红.面向AR-HUD的多任务卷积神经网络研究[J].仪器仪表学报,2021,42(3):241-250. 被引量：5
2安喆,徐熙平,杨进华,刘洋,闫宇轩.基于语义目标匹配的三维跟踪注册方法[J].光学学报,2018,38(12):163-168. 被引量：3
3安喆,徐熙平,杨进华,刘洋.光学透射式AR-HUD系统的标定方法研究[J].光子学报,2019,48(4):120-131. 被引量：5
4卓刘,陈晓琪,谢振平,蒋晓军,毕道鹍.基于深度神经网络的迷彩目标发现仿真学习方法[J].激光与光电子学进展,2019,56(7):154-160. 被引量：7
5陈思宇,毛琳,杨大伟.一种3D残差神经网络视频行人动作分类改进方法[J].大连民族大学学报,2019,21(3):225-229. 被引量：1
6褚晶辉,李晓川,张佳祺,吕卫.一种基于级联卷积网络的三维脑肿瘤精细分割[J].激光与光电子学进展,2019,56(10):67-76. 被引量：26
7刘卓亚.基于单一图像实现城市场景下的建筑三维布局[J].计算技术与自动化,2019,38(1):160-166. 被引量：3
8汪萍.基于多尺度条件随机场的语义图像分割深度卷积网络[J].宿州学院学报,2019,34(7):69-74. 被引量：2
9贾瑞明,刘立强,刘圣杰,崔家礼.基于编解码卷积神经网络的单张图像深度估计[J].图学学报,2019,40(4):718-724. 被引量：10
10张祥甫,刘健,石章松,吴中红,王智.基于深度学习的语义分割问题研究综述[J].激光与光电子学进展,2019,56(15):12-26. 被引量：26

1李璐,万怡.产品市场竞争与审计问题研究文献综述[J].审计月刊,2017,0(11):44-47.
2姚广顺,孙韶媛,方建安,赵海涛.基于红外与雷达的夜间无人车场景深度估计[J].激光与光电子学进展,2017,54(12):158-164. 被引量：9
3郑伟.人脸识别图像特征提取方法及其应用[J].智库时代,2017(16). 被引量：3
4陈曦.网络治理信息机制的智能化构建[J].领导科学,2017(24):20-20.
5刘辰,郭邵忠,殷乐.基于RNN结构下的字母级别语言模型的研究与实现[J].网络安全技术与应用,2018(1):36-38.
6屈雁秋,陈锋.基于随机丛林的人体部件分类方法[J].计算机工程,2018,44(1):247-251.
7余侃华,陈延艺,武联,刘勇.乡村4.0:互联网视角下乡村变革与转型的规划应对探讨——以陕西省礼泉县官厅村为例[J].城市发展研究,2017,24(11):15-21. 被引量：13
8孙佳男,孙俊.融合深度特征表达与似物性采样的目标跟踪算法[J].小型微型计算机系统,2018,39(1):84-88. 被引量：6
9钱文晓,张俊双,李硕,刘辰,涂洁,潘哲哲.极寒条件下输电线路弧垂在线监测技术研究应用[J].电测与仪表,2018,55(1):60-64. 被引量：19
10杨婵,舒崇军.电力企业与人民银行征信系统共享客户征信信息机制研究[J].广西电力,2017,40(6):69-72. 被引量：1

光学学报

2017年第12期

浏览历史

内容加载中请稍等...

基于双向递归卷积神经网络的单目红外视频深度估计被引量：11

参考文献2

二级参考文献29

共引文献35

同被引文献45

引证文献11

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

基于双向递归卷积神经网络的单目红外视频深度估计 被引量：11

参考文献2

二级参考文献29

共引文献35

同被引文献45

引证文献11

二级引证文献60

相关作者

相关机构

相关主题

浏览历史

基于双向递归卷积神经网络的单目红外视频深度估计被引量：11