-
题名面向图像内补与外推问题的迭代预测统一框架
- 1
-
-
作者
郭冬升
顾肇瑞
郑冰
董军宇
郑海永
-
机构
中国海洋大学信息科学与工程学部
山东浪潮科学研究院有限公司
-
出处
《中国图象图形学报》
CSCD
北大核心
2024年第2期491-505,共15页
-
基金
国家自然科学基金项目(62171421)
山东省泰山学者青年专家计划(tsqn202306096)。
-
文摘
目的 图像内补与外推可看做根据已知区域绘制未知区域的问题,是计算机视觉领域研究热点。近年来,深度神经网络成为解决内补与外推问题的主流方法。然而,当前解决方法多分别对待内补与外推问题,导致二者难以统一处理;且模型多采用卷积神经网络(convolutional neural network,CNN)构建,受到视野局部性限制,较难绘制远距离内容。针对这两个问题,本文按照分而治之思想联合CNN与Transformer构建深度神经网络,提出图像内补与外推统一处理框架及模型。方法 将内补与外推问题的解决过程分解为“表征、预测、合成”3个部分,表征与合成采用CNN完成,充分利用其局部相关性进行图像到特征映射和特征到图像重建;核心预测由Transformer实现,充分发挥其强大的全局上下文关系建模能力,并提出掩膜自增策略迭代预测特征,降低Transformer同时预测大范围未知区域特征的难度;最后引入对抗学习提升绘制图像逼真度。结果 实验给出在多种数据集下内补与外推对比评测,结果显示本文方法各项性能指标均超越对比方法。通过消融实验发现,模型相比采用非分解方式具有更佳表现,说明分而治之思路功效显著。此外,对掩膜自增策略进行详细的实验分析,表明迭代预测方法可有效提升绘制能力。最后,探究了Transformer关键结构参数对模型性能的影响。结论 本文提出一种迭代预测统一框架解决图像内补与外推问题,相较对比方法性能更佳,并且各部分设计对性能提升均有贡献,显示了迭代预测统一框架及方法在图像内补与外推问题上的应用价值与潜力。
-
关键词
图像内补
图像外推
分而治之
迭代预测
TRANSFORMER
卷积神经网络(CNN)
-
Keywords
image inpainting
image outpainting
divide-and-conquer
iterative prediction
Transformer
convolutionalneural network(CNN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-