深度融合图像文本特征的文本引导图像修复被引量：1

Text-guided image inpainting with deep fusion of image text features

下载PDF

导出

摘要为解决现有文本引导图像修复模型在处理文本图像融合时模态间信息缺乏高效融合导致修复结果不真实且语义一致性差的问题,提出一种通过条件批量归一化融合图像文本特征实现文本引导的图像修复模型BATF。首先,通过空间区域归一化编码器对破损和未破损区域分别归一化,减少了直接特征归一化对均值方差偏移的影响;其次,将提取的图像特征与文本特征向量通过深度仿射变换进行融合,增强了生成器网络特征图的视觉语义嵌入,使图像和文本特征得到更有效的融合;最后,为增强修复图像的纹理真实性及语义一致性,设计了一种高效鉴别器并引入了目标感知鉴别器。在CUB bird这个带有文本标签的数据集上进行定量和定性实验表明,提出模型在PSNR(peak signal-to-noise ratio)、SSIM (structural similarity)以及MAE(mean absolute error)度量指标分别达到了20.86、0.836和23.832。实验结果表明,BATF模型对比现有的MMFL和ALMR模型效果更好,修复的图像既符合给定文本属性的要求又具有高度语义一致性。 In order to solve the problem that the existing text guided image inpainting models lack efficient fusion of information between modes when dealing with text image fusion,resulting in unreal repair results and poor semantic consistency,this paper proposed a text guided image inpainting model BATF,which integrated image text features through conditional batch normalization.Firstly,it normalized the damaged and undamaged regions respectively by the spatial region normalization encoder to reduce the influence of direct feature normalization on the mean variance shift.Secondly,through the depth affine transformation,it fused the extracted image features and the text feature vectors to enhance the visual semantic embedding of the generator network feature map,so that the image and the features could be fused more effectively.Finally,it designed an efficient discriminator and introduced a target perception discriminator in this paper to enhance the texture authenticity and semantic consistency of the repaired image.Quantitative and qualitative experiments on CUB bird,a text-labeled dataset,show that the proposed model achieves 20.86,0.836,and 23.832 for PSNR,SSIM,and MAE,respectively.BATF model is better than the existing models MMFL and ALMR,and the repaired images both meet the requirements of given text attributes and have high semantic consistency.

作者兰红郭福城 Lan Hong;Guo Fucheng(College of Information Engineering,Jiangxi University of Science&Technology,Ganzhou Jiangxi 341000,China)

机构地区江西理工大学信息工程学院

出处《计算机应用研究》 CSCD 北大核心 2023年第7期2223-2228,共6页 Application Research of Computers

基金 2021年江西省研究生创新专项资金资助项目(YC2021-S582)。

关键词文本引导图像修复文本图像融合批量归一化语义一致性 text guidance image inpainting text image fusion batch normalization semantic consistency

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1邬开俊,单宏全,梅源,徐泽浩,王梦思.基于注意力和卷积特征重排的图像修复[J].计算机应用研究,2023,40(2):617-622. 被引量：4
2王倩娜,陈燚.面向图像修复的增强语义双解码器生成模型[J].中国图象图形学报,2022,27(10):2994-3009. 被引量：5

二级参考文献4

1刘坤华,王雪辉,谢玉婷,胡坚耀.Edge-guided GAN:边界信息引导的深度图像修复[J].中国图象图形学报,2021,26(1):186-197. 被引量：7
2刘洪瑞,李硕士,朱新山,孙浩,张军.风格感知和多尺度注意力的人脸图像修复[J].哈尔滨工业大学学报,2022,54(5):49-56. 被引量：7
3曹承瑞,刘微容,史长宏,张浩琛.多级注意力传播驱动的生成式图像修复方法[J].自动化学报,2022,48(5):1343-1352. 被引量：8
4强振平,何丽波,陈旭,徐丹.深度学习图像修复方法综述[J].中国图象图形学报,2019,0(3):447-463. 被引量：45

共引文献7

1李筱玉,张乾,周遵富,王轩云,何兴.融合CBAM注意力机制的区域归一化图像修复[J].信息技术与信息化,2023(10):136-143.
2葛奕麟,孙丽萍,王頔.基于匹配语义感知的单板缺陷图像修复研究[J].森林工程,2024,40(1):98-105. 被引量：3
3崔浩然,苗壮,王家宝,余沛毅,王培龙.基于生成逆推的大气湍流退化图像复原方法[J].计算机应用研究,2024,41(1):282-287.
4杨云,张小璇,杨欣悦.基于语义先验和双通道特征提取的图像修复[J].计算机应用研究,2023,40(12):3810-3815.
5宋杰,刘彩霞,李慧婷.基于U-Net网络的医学图像分割研究综述[J].计算机技术与发展,2024,34(1):9-16.
6郭冬升,顾肇瑞,郑冰,董军宇,郑海永.面向图像内补与外推问题的迭代预测统一框架[J].中国图象图形学报,2024,29(2):491-505.
7郭斌.面向图像高清传输的解码器同步触发信号调制技术[J].计算机测量与控制,2024,32(7):301-307.

同被引文献3

1邵杭,王永雄.基于并行对抗与多条件融合的生成式高分辨率图像修复[J].模式识别与人工智能,2020,33(4):363-374. 被引量：10
2李海燕,吴自莹,吴俊,李海江,李红松.基于双网络及多尺度判决器的图像修复算法[J].工程科学与技术,2022,54(5):240-248. 被引量：4
3强振平,何丽波,陈旭,徐丹.深度学习图像修复方法综述[J].中国图象图形学报,2019,0(3):447-463. 被引量：45

引证文献1

1彭晏飞,顾丽睿,李健,张曼婷.基于上下文特征的渐进式图像修复方法[J].计算机应用研究,2023,40(11):3437-3442.

1蔡梦云,王岚,王龙耀.气升式多通道膜反应器气促湍动过程的研究[J].现代化工,2020,40(1):207-210. 被引量：1
2纪开燕,杨玲,吴姣姣,蒋明星,韩秀林,鲁涛.MarR家族蛋白Orf17在自溶链霉菌格尔德霉素生物合成中的调控作用[J].云南大学学报（自然科学版）,2021,43(4):788-795.
3杨杰,邢欢,高峰,刘志友.磁共振失超故障案例分析[J].北京生物医学工程,2023,42(2):217-217.
4李海燕,晁艳静,李海江,郭磊,李红松.并行生成卷积网络图像修复算法[J].国防科技大学学报,2023,45(3):127-135.
5李然,钟杏苑,陈泉,李海燕.基于高效注意力的密集残差卷积修复算法[J].计算机科学与应用,2023,13(5):1148-1156.
6Ye-Dan Li,Hong Meng,Kun-Jing Pang,Mu-Zi Li,Nan Xu,Hao Wang,Shou-Jun Li,Jun Yan.Echocardiography in the diagnosis of Shone’s complex and analysis of the causes for missed diagnosis and misdiagnosis[J].World Journal of Clinical Cases,2022,10(11):3369-3378.
7夏亮,梁志鹏,张俊.基于循环生成对抗网络生成头颅磁共振sDWI图像的方法研究[J].磁共振成像,2023,14(7):121-126.
8余磊,廖伟,周游龙,杨文,夏桂松.基于事件相机的合成孔径成像[J].自动化学报,2023,49(7):1393-1406. 被引量：1
9谢梦,杨春蕾,顾明剑,胡勇.基于深度学习的风云四号卫星图像超分辨率重建[J].红外,2023,44(7):46-52. 被引量：1
10高山凤,陈燕霞,黄欲晓.蔡连香教授治疗未破损型异位妊娠经验总结[J].中国医药导报,2023,20(9):135-138. 被引量：3

计算机应用研究

2023年第7期

浏览历史

内容加载中请稍等...

深度融合图像文本特征的文本引导图像修复被引量：1

参考文献2

二级参考文献4

共引文献7

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

深度融合图像文本特征的文本引导图像修复 被引量：1

参考文献2

二级参考文献4

共引文献7

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

深度融合图像文本特征的文本引导图像修复被引量：1