-
题名基于多级残差映射器的文本驱动人脸图像生成和编辑
被引量:3
- 1
-
-
作者
李宗霖
张盛平
刘杨
张兆心
张维刚
黄庆明
-
机构
哈尔滨工业大学计算机科学与技术学院
中国科学院大学计算机科学与技术学院
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第5期2101-2115,共15页
-
基金
国家自然科学基金(61872112,61976069)。
-
文摘
尽管生成对抗网络在人脸图像生成和编辑领域取得了巨大的成功,但在其潜在编码空间中寻找可以操作人脸语义属性的方向仍然是计算机视觉的一大挑战,这一挑战的实现需要大量标记数据不断进行网络调优,而搜集、标注类似数据存在诸多难点,比如较高的技术门槛以及大量的人工成本.最近的一些工作都在试图借助预训练模型来克服标记数据短缺的问题.虽然这种做法已经被验证能够完成上述任务,但在操作的准确性和结果的真实性上都无法满足真实人脸编辑场景的需求.借助对比语言-图像预训练模型(CLIP)的图像文本联合表示能力将图像和文本内容编码在一个共享的潜在编码空间中,借助于精心设计的网络结构和损失函数,所提框架可以精准识别相关面部属性并学习一个多级残差映射网络,所提网络可根据图像和文本内容编码预测潜在编码残差,再借助图像生成预训练模型StyleGAN2完成高质量的人脸图像生成和编辑任务.大量实验也证明了所提方法在操作准确性、视觉真实性和无关属性保留方面的优异表现.
-
关键词
多模态学习
预训练模型
人脸图像生成
人脸图像编辑
对抗生成网络
-
Keywords
multimodal learning
pre-trained model
face image generation
face image manipulation
generative adversarial network(GAN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于区域敏感生成对抗网络的自动上妆算法
被引量:14
- 2
-
-
作者
包仁达
庾涵
朱德发
黄少飞
孙瑶
刘偲
-
机构
中国科学院信息工程研究所
北京航空航天大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2019年第4期896-913,共18页
-
基金
国家自然科学基金(U1536203
61572493
61876177)~~
-
文摘
自动上妆旨在通过计算机算法实现人脸妆容的编辑与合成,隶属于人脸图像分析领域.其在互动娱乐应用、图像视频编辑、辅助人脸识别等多方面起着重要作用.然而作为人脸编辑任务,其仍难以在保证图像的编辑结果自然、真实的同时又很好地满足编辑需求,并且仍有难以精确控制编辑区域、图像编辑前后一致性差、图像质量不够精细等问题.针对以上难点,创新性地提出了一种掩模控制的自动上妆生成对抗网络,该网络利用掩模方法,能够重点编辑上妆区域,约束人脸妆容编辑中无需编辑的区域不变,保持主体信息.同时其又能单独编辑人脸的眼影、嘴唇、脸颊等局部区域,实现特定区域上妆,丰富了上妆功能.此外,该网络能够进行多数据集联合训练,除妆容数据集外,还可以使用其他人脸数据集作为辅助,增强模型的泛化能力,得到更加自然的上妆结果.最后,依据多种评价标准,进行了充分的定性及定量实验,并与目前的主流算法进行了对比,综合评价了所提方法的性能.
-
关键词
生成对抗网络
自动上妆
人脸图像编辑
深度学习
-
Keywords
generative adversarial nets
automatic makeup
face image editing
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-