-
题名零样本图像分类综述
被引量:5
- 1
-
-
作者
刘靖祎
史彩娟
涂冬景
刘帅
-
机构
华北理工大学人工智能学院
深圳大学电子与信息工程学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2021年第5期812-824,共13页
-
基金
国家自然科学基金(61502143)
华北理工大学杰出青年基金(JQ201715)
河北省研究生示范课项目(KCJSX2019097)。
-
文摘
面对人工标注大量样本费时费力,一些稀有类别样本难于获取等问题,零样本图像分类成为计算机视觉领域的一个研究热点。首先,对零样本学习,包括直推式零样本学习和归纳式零样本学习进行了简单介绍;其次,重点介绍了基于空间嵌入零样本图像分类方法和基于生成模型零样本图像分类方法以及它们的子类方法,并对这些方法的机制、优缺点和适用场景等进行了分析和总结;然后,简单介绍了零样本图像分类常用数据集和评估方法,并对典型零样本图像分类方法进行了性能比较;接着,指出了现有零样本图像分类中存在的领域漂移、枢纽点和语义鸿沟等问题及相应的解决思路;最后,对零样本图像分类未来发展趋势和研究热点,如判别性区域的准确定位、生成高质量不可见类视觉特征、广义零样本图像分类等进行了探讨。
-
关键词
零样本学习
零样本图像分类
嵌入空间
生成模型
深度学习
-
Keywords
zero-shot learning
zero-shot image classification
embedding space
generative model
deep learning
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名Re-GAN:残差生成式对抗网络算法
被引量:13
- 2
-
-
作者
史彩娟
涂冬景
刘靖祎
-
机构
华北理工大学人工智能学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2021年第3期594-604,共11页
-
基金
国家自然科学基金项目(61502143)
华北理工大学杰出青年基金项目(JQ201715)
河北省研究生示范课项目(KCJSX2019097)。
-
文摘
目的生成式对抗网络(generative adversarial network,GAN)是一种无监督生成模型,通过生成模型和判别模型的博弈学习生成图像。GAN的生成模型是逐级直接生成图像,下级网络无法得知上级网络学习的特征,以至于生成的图像多样性不够丰富。另外,随着网络层数的增加,参数变多,反向传播变得困难,出现训练不稳定和梯度消失等问题。针对上述问题,基于残差网络(residual network,Res Net)和组标准化(group normalization,GN),提出了一种残差生成式对抗网络(residual generative adversarial networks,Re-GAN)。方法 Re-GAN在生成模型中构建深度残差网络模块,通过跳连接的方式融合上级网络学习的特征,增强生成图像的多样性和质量,改善反向传播过程,增强生成式对抗网络的训练稳定性,缓解梯度消失。随后采用组标准化(GN)来适应不同批次的学习,使训练过程更加稳定。结果在Cifar10、Celeb A和LSUN数据集上对算法的性能进行测试。Re-GAN的IS(inception score)均值在批次为64时,比DCGAN (deep convolutional GAN)和WGAN (Wasserstein-GAN)分别提高了5%和30%,在批次为4时,比DCGAN和WGAN分别提高了0.2%和13%,表明无论批次大小,Re-GAN生成图像具有很好的多样性。Re-GAN的FID(Fréchet inception distance)在批次为64时比DCGAN和WGAN分别降低了18%和11%,在批次为4时比DCGAN和WGAN分别降低了4%和10%,表明Re-GAN生成图像的质量更好。同时,Re-GAN缓解了训练过程中出现的训练不稳定和梯度消失等问题。结论实验结果表明,在图像生成方面,Re-GAN的生成图像质量高、多样性强;在网络训练方面,Re-GAN在不同批次下的训练具有更好的兼容性,使训练过程更加稳定,梯度消失得到缓解。
-
关键词
图像生成
深度学习
卷积神经网络
生成式对抗网络
残差网络
组标准化
-
Keywords
image generation
deep learning
convolutional neural network(CNN)
generative adversarial network(GAN)
residual network(Res Net)
group normalization(GN)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-