融合注意力机制的多模态动漫风格迁移方法

Multimodal Animation Style Transfer Method Fused with Attention Mechanism

下载PDF

导出

摘要由于没有与图像的内容结构相匹配,目前的一些方法在针对具有复杂语义信息和显著性特征的图像的动漫风格迁移时,生成图像存在风格色彩不丰富、伪影、部分内容细节信息丢失等现象,提出一种融合注意力机制的多模态动漫风格迁移方法MastGAN-CBAM,将动漫图像特征聚类成若干子特征分量,并利用GraphCut算法使得这些特征分量和各局部内容图像特征相匹配,再利用Gram矩阵计算这些特征的风格损失,从而构造了一种多模态风格损失函数,由于这种风格损失适应了图像的多模态特征,因此能更有效地对网络参数进行优化和调整,此外方法还引入了混合域注意力机制,提高了模型的效率和准确性,进一步提升了动漫风格迁移效果。实验结果表明,该方法的生成图像细节更完整,动漫风格更显著,且减少了伪影,动漫化效果有一定程度的提高,在《千与千寻》等三组动漫数据集实验中FID评价指标分别达到了164.89、162.02、199.37,在视频动漫风格迁移中也取得了较好的效果。 Due to the lack of matching with the content structure of the image,when some current methods transfer the animation style of the image with complex semantic information and salient features,the generated image has the phenomena of insufficient style color,artifact,loss of some content details,etc.This paper proposes a multi-modal animation style transfer method fused with attention mechanism,mastgan CBAM,which clusters the animation image features into several sub feature components,The graphcut algorithm is used to match these feature components with the local content image features,and then the Gram matrix is used to calculate the style loss of these features,so a multimodal style loss function is constructed.Because this style loss adapts to the multimodal features of the image,the network parameters can be optimized and adjusted more effectively.In addition,the method also introduces a hybrid domain attention mechanism,It improves the efficiency and accuracy of the model,and further improves the effect of animation style migration.The experimental results show that the image details generated by this method are more complete,the animation style is more significant,and the artifact is reduced,and the animation effect is improved to a certain extent.In the experiments of three groups of animation data sets such as“Chihiro”,the FID evaluation indicators have reached 164.89,162.02 and 199.37 respectively,and good results have been achieved in the style transfer of video animation.

作者聂雄锋王俊英董方敏臧兆祥江曙 NIE Xiongfeng;WANG Junying;DONG Fangmin;ZANG Zhaoxiang;JIANG Shu(College of Computer and Information Technology,China Three Gorges University,Yichang,Hubei 443002,China;Hubei Construction Quality Inspection Equipment Engineering Technology Research Center,China Three Gorges University,Yichang,Hubei 443002,China;Hubei Key Laboratory of Intelligent Vision Based Monitoring for Hydroelectric Engineering,China Three Gorges University,Yichang,Hubei 443002,China)

机构地区三峡大学计算机与信息学院三峡大学湖北省建筑质量检测装备工程技术研究中心三峡大学水电工程智能视觉监测湖北省重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2023年第15期223-234,共12页 Computer Engineering and Applications

基金国家自然科学基金新疆联合基金重点项目(U1703261) 湖北省水电工程智能视觉监测开放基金(2017SDSJ04)。

关键词深度学习动漫风格迁移生成对抗网络多模态匹配注意力机制 deep learning animation style transfer generative adversarial networks multimodal matching attention mechanism

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1王一凡,赵乐义,李毅.基于生成对抗网络的图像动漫风格化[J].计算机工程与应用,2022,58(18):104-110. 被引量：8
2孙天鹏,周宁宁,黄国方.新的基于GAN的局部写实感漫画图像风格迁移[J].计算机工程与应用,2022,58(14):167-176. 被引量：6
3魏富强,古兰拜尔·吐尔洪,买日旦·吾守尔.生成对抗网络及其应用研究综述[J].计算机工程与应用,2021,57(19):18-31. 被引量：22

二级参考文献8

1Xian Wu,Kun Xu,Peter Hall.A Survey of Image Synthesis and Editing with Generative Adversarial Networks[J].Tsinghua Science and Technology,2017,22(6):660-674. 被引量：19
2李健伟,曲长文,彭书娟,江源.基于生成对抗网络和线上难例挖掘的SAR图像舰船目标检测[J].电子与信息学报,2019,41(1):143-149. 被引量：37
3陈淑環,韦玉科,徐乐,董晓华,温坤哲.基于深度学习的图像风格迁移研究综述[J].计算机应用研究,2019,36(8):2250-2255. 被引量：36
4王海涌,梁红珠.基于改进的GAN的局部遮挡人脸表情识别[J].计算机工程与应用,2020,56(5):141-146. 被引量：21
5吴春梅,胡军浩,尹江华.利用改进生成对抗网络进行人体姿态识别[J].计算机工程与应用,2020,56(8):96-103. 被引量：12
6彭晏飞,高艺,杜婷婷,桑雨,訾玲玲.生成对抗网络的单图像超分辨率重建方法[J].计算机科学与探索,2020,14(9):1612-1620. 被引量：19
7王曙燕,金航,孙家泽.GAN图像对抗样本生成方法[J].计算机科学与探索,2021,15(4):702-711. 被引量：7
8陈淮源,张广驰,陈高,周清峰.基于深度学习的图像风格迁移研究进展[J].计算机工程与应用,2021,57(11):37-45. 被引量：21

共引文献31

1李莹华,刘悦,刘颖.基于学习的图像超分辨率技术回顾与展望[J].西安邮电大学学报,2022,27(2):72-87. 被引量：1
2王威,李玉洁,郭富林,刘岩,何俊霖.生成对抗网络及其文本图像合成综述[J].计算机工程与应用,2022,58(19):14-36. 被引量：7
3刘鹤丹,叶汉平,徐梦真,赵旭磊.生成对抗网络研究综述[J].物联网技术,2022,12(11):93-97. 被引量：3
4董永生,范世朝,张宇,马尽文.生成对抗网络的发展与挑战[J].信号处理,2023,39(1):154-175. 被引量：3
5李海涛,胡泽涛,张俊虎.基于NS-StyleGAN2的鱼类图像扩充方法[J].计算机与现代化,2023(1):13-17.
6李颖婷.生成式人工智能给图书馆带来的机遇、挑战及应对策略[J].图书与情报,2023(2):42-48. 被引量：28
7周宏伟,张人水.基于生成对抗网络的健身榨汁杯设计研究[J].艺术与设计（理论版）,2023(4):123-126.
8杨攀,苏波,刘敏贤,张伟,胡谊玲.BPVis:面向DPoS区块链网络安全态势感知的可视化系统[J].计算机应用研究,2023,40(6):1641-1647. 被引量：5
9姚珺.基于GAN的多变量时间序列异常检测方法[J].安庆师范大学学报（自然科学版）,2023,29(2):68-74.
10鲍先富,强赞霞,杨关.功能解耦和谱特征融合的雪霾消除模型[J].计算机工程与应用,2023,59(13):211-219. 被引量：2

1孟德芳,张继晓.α世代儿童STEAM玩具与波普风格色彩的关系研究[J].艺术与设计（理论版）,2023(5):108-111.
2李凯歌,蔡鹏飞,周忠.基于特征交互和聚类的行为识别方法[J].计算机辅助设计与图形学学报,2023,35(6):903-914.
3海日.宫崎骏电影中的“善”与“恶”——以《千与千寻》为例[J].广告大观,2023(6):25-27.
4重庆[J].文学天地,2019(3):18-21.
5唐辛子.欠宫崎骏一张电影票[J].新周刊,2019(14):108-108.
6朱小红,郑怡凡,张晶,李妍,司书毅.BAM复合体及其靶向性抗革兰阴性菌药物研究进展[J].中国抗生素杂志,2023,48(6):617-624. 被引量：1
7杨曙光.中国多民族歌唱艺术的践行者——胡松华[J].人民音乐,2023(3):21-26.
8常富红,李麒,张文丰.考虑数据特征聚类的电力系统网络运行安全态势感知[J].无线互联科技,2023,20(11):159-161. 被引量：2
9周美玲.纯真的暗黑童话——蒂姆·伯顿动画电影色彩应用探析[J].流行色,2023(6):67-69. 被引量：1
10龙有强.汽车起重机车架的轻量化设计的运用[J].汽车周刊,2023(8):105-107.

计算机工程与应用

2023年第15期

浏览历史

内容加载中请稍等...

融合注意力机制的多模态动漫风格迁移方法

参考文献3

二级参考文献8

共引文献31

相关作者

相关机构

相关主题

浏览历史