-
题名深度融合图像文本特征的文本引导图像修复
被引量:1
- 1
-
-
作者
兰红
郭福城
-
机构
江西理工大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第7期2223-2228,共6页
-
基金
2021年江西省研究生创新专项资金资助项目(YC2021-S582)。
-
文摘
为解决现有文本引导图像修复模型在处理文本图像融合时模态间信息缺乏高效融合导致修复结果不真实且语义一致性差的问题,提出一种通过条件批量归一化融合图像文本特征实现文本引导的图像修复模型BATF。首先,通过空间区域归一化编码器对破损和未破损区域分别归一化,减少了直接特征归一化对均值方差偏移的影响;其次,将提取的图像特征与文本特征向量通过深度仿射变换进行融合,增强了生成器网络特征图的视觉语义嵌入,使图像和文本特征得到更有效的融合;最后,为增强修复图像的纹理真实性及语义一致性,设计了一种高效鉴别器并引入了目标感知鉴别器。在CUB bird这个带有文本标签的数据集上进行定量和定性实验表明,提出模型在PSNR(peak signal-to-noise ratio)、SSIM (structural similarity)以及MAE(mean absolute error)度量指标分别达到了20.86、0.836和23.832。实验结果表明,BATF模型对比现有的MMFL和ALMR模型效果更好,修复的图像既符合给定文本属性的要求又具有高度语义一致性。
-
关键词
文本引导
图像修复
文本图像融合
批量归一化
语义一致性
-
Keywords
text guidance
image inpainting
text image fusion
batch normalization
semantic consistency
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-