GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型被引量：8

GP-WIRGAN:A Novel Image Recurrent Generative Adversarial Network Model Based on Wasserstein and Gradient Penalty

下载PDF

导出

摘要通常情形下,现有的图像生成模型都采用单次前向传播的方式生成图像,但实际中,画家通常是反复修改后才完成一幅画作的;生成对抗模型(Generative Adversarial Networks,GAN)能生成图像,但却很难训练.在保证生成图像质量的前提下,效仿作画时的不断更新迭代,以提升生成样本多样性并增强样本语义,同时引入Wasserstein距离,提出了Wasserstein图像循环生成对抗网络模型,简称WIRGAN(Wasserstein Image Recurrent Generative Adversarial Networks Model).WIRGAN定义了生成模型和判别模型,其中,生成模型是由一系列结构相同的神经网络模型组成的循环结构,用时间步骤T控制生成模型的循环次数,用于迭代式生成图像,并以最后一个循环结构的生成图像作为整个生成模型的输出;判别模型也由神经网络构建,结合权重剪枝技术,用来判别输入图像是生成的还是真实的.WIRGAN利用Wasserstein距离作为目标函数,将生成模型和判别模型进行博弈对抗训练.另外,由于模型存在难以优化的问题,本文引入了梯度惩罚来解决此类问题,进一步提出了梯度惩罚优化的Wasserstein图像循环生成对抗网络模型(Gradient Penalty Optimized Wasserstein Image Recurrent Generative Adversarial Networks Model,GP-WIRGAN).最后,WIRGAN和GP-WIRGAN在MNIST、CIFAR10、CeUN四个数据集上进行了基础学习能力、模型间GAM自比较、模型内GAM自比较、初始得分比较、图像生成可视化、时间效率比较等6组实验,采用生成对抗矩阵(Generative Adversarial Metric,GAM)和起始分数(Inception Scores)进行评估,结果表明,本文提出的WIRGAN、GP-WIRGAN具有良好的稳定性,可以生成高质量的图像. Most image generation models use a one-time image generation method,which obtains output through a single forward of generation model.But in practice,for example,painters usually repeatedly modify their paintings from coarse to fine during their creation time,which is a multi-stage process.Generative model reduces the manual marking requirements on image data,and can understand semantic meaning of the images well.The generative model can synthesize approximate real data from its learned data distribution.One of the main stream generative model is called Generative Adversarial Network(GAN).By utilizing game theory and deep learning,we can ultimately synthesize high-grade data samples based on two types of networks called generator and discriminator inside GAN model.GAN is well known for generating images,but has difficulty in training stably due to the irrational distance metric in optimizing target,which results in poorly generated sample diversity.Besides,most generative models generate images at a single cycle,but in fact,when the painter paints,he completes a painting on the basis of previous modifications.In order to guarantee the quality of the generated image and enhance the generation of sample diversity and the semantics of the sample,we simulate the process of repeating iterations and multiple modifications by the artist during painting,and generate samples using method we called“multi-generation”.We chose Wasserstein distance to measure the distance between the real data distribution and the generated data distribution,proposed a framework named Wasserstein Image Recurrent Generative Adversarial Networks(WIRGAN).WIRGAN defines a generative model and a discriminative model,the generative model is used to gradually generate images,which consists of a recurrent feedback loop structure and can handle a time step parameter T of generation to control the complexity of model.Sample generated at time t is combined with the output of time t-1 by simply adding together,the generator takes the image generated from the last time step as output.The discriminator model is also constructed by a neural network,combining weight clipping to determine whether the input image is generated or true.WIRGAN uses Wasserstein distance as cost function,which aims to decrease the discrepancy between synthesized samples and real samples,training WIRGAN in an adversarial way.In addition,gradient penalty is also used in this paper to deal training difficulty that produced by weight clipping in WIRGAN.We further propose a Gradient Penalty Optimized Wasserstein Image Recurrent Generative Adversarial Networks Model(GP-WIRGAN).Finally,we adopt Generative Adversarial Metric(GAM)and inception score to evaluate the performance of our models on the quality and diversity of the generated samples.WIRGAN and GP-WIRGAN conducted five sets of comparative experiments on four datasets including MNIST,CIFAR10,CelebA and LSUN,which are the basic learning abilities comparison,the GAM comparisons within the model,the GAM comparisons between the models,the inception score comparisons,visualization,Time efficiency comparison.Extensive experiments show the proposed model has achieved good results in both evaluation criteria,which identify that WIRGAN and GP-WIRGAN has good stability and can generate high quantity images.

作者冯永张春平强保华张逸扬尚家兴 FENG Yong;ZHANG Chun-Ping;QIANG Bao-Hua;ZHANG Yi-Yang;SHANG Jia-Xing(College of Computer Science,Chongqing University,Chongqing 400030;Key Laboratory of Dependable Service Computing in Cyber Physical Society,Ministry of Education,Chongqing University,Chongqing 400030;Guangxi Key Laboratory of Trusted Software,Guilin University of Electronic Technology,Guilin,Guangxi 541004;Guangxi Key Laboratory of Optoelectronic Information Processing,Guilin University of Electronic Technology,Guilin,Guangxi 541004)

机构地区重庆大学计算机学院重庆大学信息物理社会可信服务计算教育部重点实验室桂林电子科技大学广西可信软件重点实验室桂林电子科技大学广西光电信息处理重点实验室培育基地

出处《计算机学报》 EI CSCD 北大核心 2020年第2期190-205,共16页 Chinese Journal of Computers

基金国家自然科学基金(61762025) 国家重点研发计划(2017YFB1402400) 重庆市基础与前沿研究计划(cstc2017jcyjAX0340) 广西可信软件重点实验室开放课题(kx201701) 广西光电信息处理重点实验室(培育基地)基金(GD18202) 重庆市重点产业共性关键技术创新专项(cstc2017zdcy-zdyxx0047) 重庆市社会事业与民生保障科技创新专项(cstc2017shmsA20013)资助.

关键词图像生成生成对抗网络 Wasserstein距离深度学习权重剪枝梯度惩罚 image generating generative adversarial networks Wasserstein distance deep learning weight clipping gradient penalty

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃.生成式对抗网络GAN的研究进展与展望[J].自动化学报,2017,43(3):321-332. 被引量：324

二级参考文献8

1王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：333
2王飞跃.计算实验方法与复杂系统行为分析和决策评估[J].系统仿真学报,2004,16(5):893-897. 被引量：147
3王飞跃.关于复杂系统的建模、分析、控制和管理[J].复杂系统与复杂性科学,2006,3(2):26-34. 被引量：64
4王飞跃,刘德荣,熊刚,程长建,赵冬斌.复杂系统的平行控制理论及应用[J].复杂系统与复杂性科学,2012,9(3):1-12. 被引量：49
5王飞跃.平行控制:数据驱动的计算控制方法[J].自动化学报,2013,39(4):293-302. 被引量：131
6王坤峰,苟超,王飞跃.平行视觉:基于ACP的智能视觉计算方法[J].自动化学报,2016,42(10):1490-1500. 被引量：49
7李力,林懿伦,曹东璞,郑南宁,王飞跃.平行学习—机器学习的一个新型理论框架[J].自动化学报,2017,43(1):1-8. 被引量：98
8白天翔,王帅,沈震,曹东璞,郑南宁,王飞跃.平行机器人与平行无人系统:框架、结构、过程、平台及其应用[J].自动化学报,2017,43(2):161-175. 被引量：62

共引文献323

1熊伟,高娟娟,刘锴.基于GAN模型优化的神经机器翻译[J].计算机系统应用,2022,31(12):95-103. 被引量：3
2宁宁,金鑫,张晓昆,李艳楠.基于GAN的人脸图像光照迁移[J].北京电子科技学院学报,2019(4):33-41.
3于德山.人工智能时代的视觉真相及其反思[J].社会科学战线,2020(1):224-233. 被引量：3
4李可,祁阳,宿磊,顾杰斐,苏文胜.基于改进ACGAN的钢表面缺陷视觉检测方法[J].机械工程学报,2022,58(24):32-40. 被引量：2
5支双双,赵庆会,金大海,唐琎.基于CNN和DLTL的步态虚拟样本生成方法[J].计算机应用研究,2020,37(1):291-295. 被引量：1
6吴雅琴,陈林,侯云峰.基于CNN-GAN的信道状态信息室内定位算法[J].电子测量技术,2023,46(24):119-126.
7王可新,王力.基于生成对抗网络的图像修复算法[J].智能计算机与应用,2020(4):9-12. 被引量：1
8王守相,陈海文,潘志新,王建明.采用改进生成式对抗网络的电力系统量测缺失数据重建方法[J].中国电机工程学报,2019,39(1):56-64. 被引量：88
9王坤峰,鲁越,王雨桐,熊子威,王飞跃.平行图像:图像生成的一个新型理论框架[J].模式识别与人工智能,2017,30(7):577-587. 被引量：35
10刘昕,王晓,张卫山,汪建基,王飞跃.平行数据:从大数据到数据智能[J].模式识别与人工智能,2017,30(8):673-681. 被引量：40

同被引文献42

1贾宝林,尹世群,王宁朝.基于门控多层感知机的端到端实体关系联合抽取[J].中文信息学报,2023,37(3):143-151. 被引量：3
2刘钟情.基于Qt/Embedded的机房环境监控系统[J].现代电子技术,2014,37(8):38-39. 被引量：13
3张翔,陆永华,李阳.基于PLC的柔性检测线传输与监控系统设计[J].自动化与仪器仪表,2018,0(12):80-82. 被引量：13
4朱燕玲,丁黄达,姚玉刚.基于Excel软件流程化输出环境空气质量指数(AQI)功能实现的研究[J].环境科学与管理,2016,41(11):117-120. 被引量：6
5刘连光,潘明明,田世明,吴博.无线传感器网络分布式能量非合作博弈优化技术[J].武汉大学学报（工学版）,2017,50(3):384-389. 被引量：16
6杨毅,卢诚波,徐根海.面向不平衡数据集的一种精化Borderline-SMOTE方法[J].复旦学报（自然科学版）,2017,56(5):537-544. 被引量：24
7王智颖,蒋明华,郝慧明,杨凯,万鲁河.基于微信公众平台的空气质量显示系统的设计与实现研究[J].环境科学与管理,2017,42(11):43-46. 被引量：2
8殷亚博,杨文忠,杨慧婷,许超英.基于卷积神经网络和KNN的短文本分类算法研究[J].计算机工程,2018,44(7):193-198. 被引量：42
9张艺瀛,金志刚.一种高维多模态优化的量子粒子群优化算法[J].哈尔滨工业大学学报,2018,50(11):50-58. 被引量：21
10齐小刚,王振宇,刘立芳,刘兴成,马久龙.无线传感器和执行器网络可靠高效路由[J].浙江大学学报（工学版）,2018,52(10):1964-1972. 被引量：10

引证文献8

1张浩,康海燕.基于特征优化生成对抗网络的在线交易反欺诈方法研究[J].郑州大学学报（理学版）,2022,54(1):69-74. 被引量：1
2侯鑫烨,董增寿,刘鑫.基于伪标签的弱监督迁移学习模型[J].机床与液压,2021,49(24):185-189. 被引量：1
3芦佳明,李晨龙,魏毅强.自注意力时序点过程生成模型的Wasserstein学习方法[J].计算机应用研究,2022,39(2):456-460. 被引量：1
4焦爽,范亚冰,孙立群,丁小龙.基于深度细节加强网络模型的去雨方法研究[J].电脑知识与技术,2021,17(35):80-84.
5盖昊宇,张震,姚庆锋,胡贵恒.基于LoRa技术的工业洁净室环境全覆盖监控系统[J].成都工业学院学报,2022,25(2):20-23. 被引量：1
6李志鹏,国雍,陈耀佛,王耀威,曾炜,谭明奎.基于数据生成的类别均衡联邦学习[J].计算机学报,2023,46(3):609-625. 被引量：5
7曹洁,尹浩楠,王进花.MACDCGAN的发电机轴承故障诊断方法[J].振动与冲击,2024,43(11):227-235.
8张强,曾俊玮,陈锐.基于对比学习与梯度惩罚的实体关系联合抽取模型[J].吉林大学学报（理学版）,2024,62(5):1155-1162.

二级引证文献9

1夏毅.大数据融合时代运营商构建反欺诈堡垒[J].互联网周刊,2021(24):28-30.
2卞玮,李晨龙,侯红卫.基于条件生成对抗网络的深度点过程二次预测[J].计算机工程,2022,48(12):127-133.
3潘志祥.基于GPS技术的公共广播通信导航监控覆盖方法[J].电子元器件与信息技术,2023,7(1):185-187.
4杜社林,黄炳赫,李荣鹏,宋学力,肖玉柱.基于加权分类损失和核范数的领域自适应模型[J].计算机应用研究,2023,40(6):1734-1738.
5李海洋,郭晶晶,刘玖樽,刘志全.隐私保护的拜占庭鲁棒联邦学习算法[J].西安电子科技大学学报,2023,50(4):121-131.
6崔腾,张海军,代伟.基于分布共识的联邦增量迁移学习[J].计算机学报,2024,47(4):821-841.
7侯泽超,董建刚.去中心化场景下的隐私保护联邦学习优化方法[J].计算机应用研究,2024,41(8):2419-2426.
8李红娇,王宝金,王朝晖,胡仁豪.基于模型相似度与本地损失的双重客户端选择算法[J].计算机工程,2024,50(8):153-164.
9沈哲远,杨珂珂,李京.基于双流神经网络的个性化联邦学习方法[J].计算机应用,2024,44(8):2319-2325.

1马书群.计算机图像处理技术在UI设计中的应用[J].信息记录材料,2020,21(1):95-97. 被引量：6
2张鹏升,解易,刘钊.基于条件流的人脸正面化生成对抗模型[J].计算机应用与软件,2019,36(12):156-161.
3唐勇,相银,张亚臣,柏萍,张燚.Endocan因子在冠状动脉慢性完全闭塞性血管侧枝循环生成中的作用[J].中华实用诊断与治疗杂志,2019,33(12):1155-1157. 被引量：2
4任国兴.小学数学个性化教学的有效实施[J].山西教育（教学版）,2020,0(1):18-19. 被引量：1
5李世宏.高中数学教学中核心素养的培养[J].数学学习与研究,2019,0(23):103-103. 被引量：1
6邢晓敏,刘威.二阶段端到端的图像去雾生成网络[J].计算机辅助设计与图形学学报,2020,32(1):164-172. 被引量：3
7罗凌(文/图),钟毅(文/图).省林草局:驻汶川扶贫工作组临时党支部指导大寺村疫情防控和脱贫攻坚工作[J].绿色天府,2020,0(3):46-46.
8胡慧敏,钱亚冠,雷景生,马丹峰.基于卷积神经网络的污点攻击与防御[J].浙江科技学院学报,2020,32(1):38-43.
9林莹.美团:场景化营销的迭代式创新——访大众点评商业化部市场总经理吴荻[J].中国广告,2020,0(2):29-32.
10赵瑜,谭海宁,刘志方,武超.基于生成对抗模型的异质信息网络语义表征方法研究[J].中文信息学报,2019,33(11):83-94. 被引量：1

计算机学报

2020年第2期

浏览历史

内容加载中请稍等...

GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型被引量：8

参考文献1

二级参考文献8

共引文献323

同被引文献42

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型 被引量：8

参考文献1

二级参考文献8

共引文献323

同被引文献42

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

GP-WIRGAN:梯度惩罚优化的Wasserstein图像循环生成对抗网络模型被引量：8