-
题名结合背景图的高分辨率视频人像实时抠图网络
被引量:1
- 1
-
-
作者
彭泓
张家宝
贾迪
安彤
蔡鹏
赵金源
-
机构
辽宁工程技术大学电子与信息工程学院
辽宁工程技术大学电气与控制工程学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2024年第2期478-490,共13页
-
基金
国家自然科学基金项目(61601213)
辽宁省教育厅项目(LJ2020FWL004)。
-
文摘
目的 近年来,采用神经网络完成人像实时抠图已成为计算机视觉领域的研究热点,现有相关网络在处理高分辨率视频时还无法满足实时性要求,为此本文提出一种结合背景图的高分辨率视频人像实时抠图网络。方法 给出一种由基准网络和精细化网络构成的双层网络,在基准网络中,视频帧通过编码器模块提取图像的多尺度特征,采用金字塔池化模块融合这些特征作为循环解码器网络的输入;在循环解码器中,通过残差门控循环单元聚合连续视频帧间的时间信息,以此生成蒙版图、前景残差图和隐藏特征图,采用残差结构降低模型参数量并提高网络的实时性。为提高高分辨率图像实时抠图性能,在精细化网络中,设计高分辨率信息指导模块,通过高分辨率图像信息指导低分辨率图像的方式生成高质量人像抠图结果。结果 与近年来的相关网络模型进行实验对比,实验结果表明,本文方法在高分辨率数据集Human2K上优于现有相关方法,在评价指标(绝对误差、均方误差、梯度、连通性)上分别提升了18.8%、39.2%、40.7%、20.9%。在NVIDIA GTX 1080Ti GPU上处理4 K分辨率影像运行速率可达26帧/s,处理HD(high definition)分辨率影像运行速率可达43帧/s。结论 本文模型能够更好地完成高分辨率人像实时抠图任务,可以为影视、短视频社交以及网络会议等高级应用提供更好的支持。
-
关键词
人像实时抠图
神经网络
多尺度特征
时间信息
高分辨率
-
Keywords
real-time human figure matting
neural network
multiscale features
time information
high resolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-