基于残差卷积注意力网络的视频修复被引量：4

Video inpainting based on residual convolution attention network

下载PDF

导出

摘要视频修复旨在填补视频中的缺失区域,由于很难精确保持修复内容的时空一致性,故视频修复仍具有挑战性。针对现有视频修复中存在的修复结果语义信息不连续,出现视频模糊和时间伪影,以及网络设计越来越复杂,网络整体速度变慢的问题,本文提出了一种基于残差网络的卷积注意力网络(RCAN)用以视频修复。通过将自注意力机制和全局注意力机制引入进残差网络,增强网络对所有输入帧的时空特征的学习能力,并采用时空对抗损失函数进行优化,提高视频修复的质量。同时网络还能够高度自由地定义层数和参数量,提高网络的实际应用能力。实验结果表明,该网络在DAVIS和YouTube-VOS数据集上取得了PSNR为30.68 dB,SSIM为0.961,FID为0.113的平均修复结果,基本符合实际场景对模型的修复质量要求,为视频修复提供了一种新思路。 Video inpainting,which aims at filling in missing regions of a video,remains challenging due to the difficulty of preserving the precise spatial and temporal coherence of video contents.In order to solve the problems of discontinuous semantic information,video blurriness and temporal artifact,and more and more complex network design,the overall speed of the network becoming slow,this paper proposes a residual convolution attention network(RCAN)for video inpainting.By introducing the self-attention mechanism and the global attention mechanism into the residual network,the ability of the network to learn the spatio-temporal features of all input frames is enhanced.This method proposes a spatial-temporal adversarial loss function to optimize RCAN,which improves the quality of video inpainting.At the same time,the network can define the number of layers and parameters with a high degree of freedom to improve the practical application ability of the network.Experimental results show that the network can achieve an average inpainting result in that the PSNR is 30.68 dB,the SSIM is 0.961,and the FID is 0.113 on DAVIS and YouTube-VOS data sets.This method meets the inpainting quality requirements of the actual scene on the model and provides a new idea for video inpainting.

作者李德财严群姚剑敏林志贤董泽宇 LI De-cai;YAN Qun;YAO Jian-min;LIN Zhi-xian;DONG Ze-yu(College of Physics and Information Engineering, Fuzhou University, Fuzhou 350108, China;Jinjiang RichSence Electronic Technology Company Limited, Jinjiang 362200, China)

机构地区福州大学物理与信息工程学院晋江市博感电子科技有限公司

出处《液晶与显示》 CAS CSCD 北大核心 2022年第1期86-96,共11页 Chinese Journal of Liquid Crystals and Displays

基金国家重点研发计划(No.2016YFB0401503) 广东省科技重大专项(No.2016B090906001) 福建省科技重大专项(No.2014HZ003-1) 广东省光信息材料与技术重点实验室开放基金(No.2017B030301007)。

关键词深度学习视频修复自注意力机制残差网络生成对抗网络 deep learning video inpainting self-attention mechanism residual networks generative adversarial networks

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TH691.9 [机械工程—机械制造及自动化]

引文网络
相关文献

参考文献5

1徐展,曹哲.复杂运动摄像机拍摄视频的背景修复技术[J].计算机应用,2014,34(12):3540-3544. 被引量：1
2付傲威,赵敏,罗令,邢妍,邓欢,王琼华.自由立体显示中基于深度卷积神经网络的虚拟视点生成方法[J].液晶与显示,2019,34(11):1031-1036. 被引量：3
3吴磊,吕国强,赵晨,盛杰超,冯奇斌.基于多尺度残差网络的CT图像超分辨率重建[J].液晶与显示,2019,34(10):1006-1012. 被引量：16
4陈宗航,胡海龙,姚剑敏,严群,林志贤.基于改进生成对抗网络的单帧图像超分辨率重建[J].液晶与显示,2021,36(5):705-712. 被引量：7
5于冰,丁友东,谢志峰,黄东晋,马利庄.基于时空生成对抗网络的视频修复[J].计算机辅助设计与图形学学报,2020,32(5):769-779. 被引量：5

二级参考文献28

1赵悟翔,王琼华,李大海,陶宇虹,王芳宁.阶梯光栅多视点自由立体显示的子像素排列[J].四川大学学报（工程科学版）,2009,41(6):216-218. 被引量：8
2WEXLER Y, SHECHTMAN E, IRANI M. Space-time completion of video[ J]. IEEE Transactions on Pattern Analysis and Machine In- telligence, 2007, 29(3): 463-476.
3JIA Y T, HU S M, MARTIN R R. Video completion using tracking and fragment merging[ J]. The Visual Computer, 2005, 21 (8/9/ 10): 601-610.
4SHIRATORI T, MATSUSHITA Y, TANG X, et al . Video completion by motion field transfer[ C]// Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2006, 1:411-418.
5GRANADOS M, TOMPKIN J, KIM K, et al. How not to be seen- object removal from videos of crowded scenes[ C]// Eurographics 2012: Computer Graphics Forum. Oxford: Blackwell Publishing, 2012:219-228.
6PATWARDHAN K A, SAPIRO G, BERTALMIO M. Video inpainting under constrained camera motion[ J]. IEEE Transactions on Image Processing, 2007, 16(2) : 545 -553.
7SHEN Y, LU F, CAO X, et al. Video completion for perspective camera under constrained motion[ C]// Proceedings of the 18th International Conference on Pattern Recognition. Piscataway: IEEE, 2006, 3:63 - 66.
8GRANADOS M, KIM K I, TOMPKIN J, et al. Background inpainting for videos with dynamic objects and a free-moving camera[M]. Heidelberg: Springer, 2012:682-695.
9AGARWALA A, HERTZMANN A, SALESIN D H, et al. Keyframe-based tracking for rotoscoping and animation [ J]. ACM Transactions on Graphics, 2004, 23(3): 584-591.
10LIU C, FREEMAN W T, ADELSON E H, et al. Human-assisted motion annotation[ C]// Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2008:1-8.

共引文献26

1周国华,蒋晖,顾晓清,殷新春.多视角判别度量学习的乳腺影像检索方法[J].液晶与显示,2020,35(6):619-630. 被引量：3
2梁超,黄洪全.基于卷积神经网络的轻量级图像超分辨率[J].计算机与现代化,2020(11):23-27.
3陈斌,朱晋宁,东一舟.基于残差整流增强卷积神经网络的表情识别[J].液晶与显示,2020,35(12):1299-1308. 被引量：7
4陈清江,屈梅.基于双残差卷积网络的低照度图像增强[J].液晶与显示,2021,36(2):305-316. 被引量：3
5董本志,于明聪,赵鹏.基于小波域的图像超分辨率重建方法[J].液晶与显示,2021,36(2):317-326. 被引量：10
6高姬岭,沈风奇,王秀丽,赵喜家.高分辨率CT在肺结核空洞诊断中的应用[J].中国医学创新,2021,18(3):158-162. 被引量：3
7陈宗航,胡海龙,姚剑敏,严群,林志贤.基于改进生成对抗网络的单帧图像超分辨率重建[J].液晶与显示,2021,36(5):705-712. 被引量：7
8江妍,马瑜,芦玥,王原,梁远哲,李霞.基于ANTs配准的多图谱分割算法比较研究[J].液晶与显示,2021,36(5):723-732. 被引量：2
9周涛,霍兵强,陆惠玲,马宗军,叶鑫宇,董雅丽,刘珊.融合多尺度图像的密集神经网络肺部肿瘤识别算法[J].光学精密工程,2021,29(7):1695-1708. 被引量：9
10陈胜娣.基于生成对抗网络的医学图像超分辨率重建[J].计算机时代,2021(10):15-19. 被引量：5

同被引文献35

1马燕,余海军,钟发生,刘丰林.基于残差编解码网络的CT图像金属伪影校正[J].仪器仪表学报,2020,41(8):160-169. 被引量：17
2吴从中,陈曦,詹曙.结合残差编解码网络和边缘增强的遥感图像去噪[J].遥感学报,2020,24(1):27-36. 被引量：16
3丁辉,潘巍,张树东.基于小波分析的视频图像修复算法[J].电视技术,2011,35(11):17-18. 被引量：2
4管焰秋,鄢秋荣,杨晟韬,李冰,曹芊芊,方哲宇.基于残差编解码网络的单光子压缩成像[J].光学学报,2020,40(1):284-292. 被引量：6
5于冰,丁友东,谢志峰,黄东晋,马利庄.基于时空生成对抗网络的视频修复[J].计算机辅助设计与图形学学报,2020,32(5):769-779. 被引量：5
6李华军,刘光宇,余善恩.微小管道两相流流动图像畸变校正研究[J].仪器仪表学报,2020(4):239-245. 被引量：9
7牟新刚,陆俊杰,周晓.基于残差编解码网络的红外图像自适应校正算法[J].红外技术,2020,42(9):833-839. 被引量：8
8陈文艺,许洁,杨辉,杨小宝,惠小强.基于深度学习的单张图像畸变校正[J].激光与光电子学进展,2020,57(24):323-330. 被引量：12
9杨飞璠,李晓光,卓力.基于注意力残差编解码网络的动态场景图像去模糊[J].应用光学,2021,42(4):685-690. 被引量：6
10胡均平,宋菲菲,罗春雷,黄强.一种基于自适应角点检测的非量测畸变校正方法[J].激光与光电子学进展,2021,58(12):159-165. 被引量：10

引证文献4

1杨子勋,陈广新,李长荣,曹文超.基于计算机辅助诊断的皮肤癌良恶性诊断研究[J].新一代信息技术,2022,5(8):134-138.
2黄福杰,罗斌.基于光流的视频缺陷检测及修复方法[J].计算机应用研究,2023,40(1):299-303. 被引量：2
3白雪松,叶剑飞.视频小波分析修复算法——以民俗体育记录视频为例[J].河南城建学院学报,2023,32(5):84-90.
4戈铁柱,赵越,陈贺,华泽勋,籍慧琴,杨豪放.基于残差编解码网络的矿用摄像仪视频图像畸变校正方法[J].自动化与仪器仪表,2023(10):241-245. 被引量：2

二级引证文献4

1陈婧,王恺星,左雨亭,林琦,曾焕强.基于深度学习的视频修复方法综述[J].信号处理,2024,40(6):1171-1184.
2杨骁.无人机航测遥感图像边缘畸变自适应校正方法研究[J].科技资讯,2024,22(11):62-64.
3赵庆林.电声信号编解码技术在网络多媒体传输中的应用[J].电声技术,2024,48(6):97-99.
4林维修,李峰,王海峰,许育燕,金科扬.基于图像处理的光伏组件热斑缺陷检测方法[J].计算技术与自动化,2024,43(3):121-126.

1吕旋,王标,邹佳运,田洋川.改进注意力机制实现车牌图像清晰化[J].无线电工程,2021,51(10):1169-1175.
2廖静.关于矿山地质灾害治理及生态环境修复的探究[J].世界有色金属,2021,46(18):123-124. 被引量：6
3田玲娣.浅谈中小河流的水生态修复对策[J].风景名胜,2021(8):0167-0168.
4阿海.阿海的诗[J].西部（新文学）（上）,2018,0(4):24-28.
5简丽丽.最初的选择,最终的守护——评《通往未来的门》[J].出版广角,2018(4):88-90.
6魏俣童,鲍秉坤,张子祺,朱进.不稳定传输中受损视频的低延迟修复方法[J].中国科学技术大学学报,2021,51(10):717-724. 被引量：1
7瓦渣约古莫.浅析小学数学教学的生活化[J].南北桥,2020(19):79-79.
8司步磊.基于学科核心素养视角的高中化学教学策略研究[J].课堂内外（高中教研）,2021(3):42-43.
9陈晨.情景教学法在小学数学教学中的应用探究[J].好日子,2020(18):153-153.
10赵丹清.“巧引妙问”优化小学数学教学[J].数码设计,2020,9(14):223-224.

液晶与显示

2022年第1期

浏览历史

内容加载中请稍等...

基于残差卷积注意力网络的视频修复被引量：4

参考文献5

二级参考文献28

共引文献26

同被引文献35

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于残差卷积注意力网络的视频修复 被引量：4

参考文献5

二级参考文献28

共引文献26

同被引文献35

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于残差卷积注意力网络的视频修复被引量：4