-
题名耦合变分自编码器及其在图像对生成中的应用
被引量:2
- 1
-
-
作者
侯璎真
翟俊海
申瑞彩
-
机构
河北大学数学与信息科学学院
河北大学河北省机器学习与计算智能重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2626-2631,共6页
-
基金
河北省重点研发计划项目(19210310D)资助
河北省自然科学基金项目(F2017201026)资助
河北大学研究生创新项目(hbu2019ss077)资助。
-
文摘
随着深度学习的发展,图像生成技术有了长足的进展,但大多数图像生成模型只能生成单一图像.针对这一问题,本文提出了一种耦合变分自编码器,它可以生成具有不同属性的人脸元组.现有的方法需要训练集的不同域中存在对应图像的元组,但是本文提出的方法不需要任何对应图像的元组,就可以生成具有不同属性的图像元组.本文的方法是在耦合生成对抗网络的灵感下提出的,与原有方法不同,它通过训练耦合变分自编码器模型来学习不同属性的特征表示,以生成对应图像元组.相比较原方法,它可以通过学习高级特征表示更精确的生成图像元组.此外,本文还用耦合变分自编码器实现了无监督人脸属性转换以及人脸的相互转换.将提出的方法应用于多个学习任务,包括生成不同属性的人脸元组、无监督的人脸属性转换以及图像相互转换.
-
关键词
深度学习
变分自编码器
元组
高级特征
属性转换
-
Keywords
deep learning
variational autoencoder
tuples
high-level features
attribute conversion
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于随机森林和投票机制的大数据样例选择算法
被引量:7
- 2
-
-
作者
周翔
翟俊海
黄雅婕
申瑞彩
侯璎真
-
机构
河北大学数学与信息科学学院
河北省机器学习与计算智能重点实验室(河北大学)
-
出处
《计算机应用》
CSCD
北大核心
2021年第1期74-80,共7页
-
基金
河北省重点研发计划项目(19210310D)
河北大学研究生创新资助项目(hbu2020ss045)。
-
文摘
针对大数据样例选择问题,提出了一种基于随机森林(RF)和投票机制的大数据样例选择算法。首先,将大数据集划分成两个子集,要求第一个子集是大型的,第二个子集是中小型的。然后,将第一个大型子集划分成q个规模较小的子集,并将这些子集部署到q个云计算节点,并将第二个中小型子集广播到q个云计算节点。接下来,在各个节点用本地数据子集训练随机森林,并用随机森林从第二个中小型子集中选择样例,之后合并在各个节点选择的样例以得到这一次所选样例的子集。重复上述过程p次,得到p个样例子集。最后,用这p个子集进行投票,得到最终选择的样例子集。在Hadoop和Spark两种大数据平台上实现了提出的算法,比较了两种大数据平台的实现机制。此外,在6个大数据集上将所提算法与压缩最近邻(CNN)算法和约简最近邻(RNN)算法进行了比较,实验结果显示数据集的规模越大时,与这两个算法相比,提出的算法测试精度更高且时间消耗更短。证明了提出的算法在大数据处理上具有良好的泛化能力和较高的运行效率,可以有效地解决大数据的样例选择问题。
-
关键词
大数据
样例选择
决策树
随机森林
投票机制
-
Keywords
big data
instance selection
decision tree
Random Forest(RF)
voting mechanism
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名多生成器生成对抗网络
被引量:2
- 3
-
-
作者
申瑞彩
翟俊海
侯璎真
-
机构
河北大学数学与信息科学学院
-
出处
《河北大学学报(自然科学版)》
CAS
北大核心
2021年第6期734-744,共11页
-
基金
河北省科技计划重点研发计划项目(19210310D)
河北省自然科学基金资助项目(F2021201020)。
-
文摘
生成对抗网络(Generative adversarial networks,GAN)广泛应用于各种领域,尤其在图像生成方面.该模型由生成网络与判别网络2部分组成,在无监督的训练方式下,2个网络相互竞争相互提高.然而,GAN在训练时经常出现模式崩溃问题,进而导致模型收敛较慢,生成样本多样性较差.为解决这一问题,在深度卷积神经网络的基础上提出了一种多生成器生成对抗网络模型.该模型包含多个生成网络,每个生成网络均使用残差网络进行搭建,同时在生成网络间引入协作机制,以加快模型获取信息并减少参数量,最后将各生成网络的特征图进行融合得到最终图像输入到判别网络中.GAN在训练过程中还会出现梯度消失、训练不稳定问题.为避免出现这些问题,将Wasserstein距离和梯度惩罚引入模型的损失函数.通过在多个数据集上与多种相关方法进行实验比较,结果表明提出的模型在缓解模式崩溃问题、加快模型收敛速度以及减少参数量上均明显优于其他几种方法.
-
关键词
生成对抗网络
残差网络
集成学习
模式崩溃
Wasserstein距离
-
Keywords
generative adversarial networks(GAN)
residual networks
ensemble learning
pattern collapse
Wasserstein distance
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名选择性集成学习多判别器生成对抗网络
被引量:2
- 4
-
-
作者
申瑞彩
翟俊海
侯璎真
-
机构
河北大学数学与信息科学学院
河北大学河北省机器学习与计算智能重点实验室
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第6期1429-1438,共10页
-
基金
河北省科技计划重点研发项目(19210310D)
河北省自然科学基金(F2021201020)。
-
文摘
生成对抗网络(GAN)在图像生成方面具有广泛应用,但基于无监督方式与有监督方式的网络生成样本仍有较大差距。为解决生成对抗网络在无监督环境中生成样本多样性差、质量较低以及模型训练时间过长等问题,提出了具有选择性集成学习思想的生成对抗网络模型。将生成对抗网络中的判别网络采用集成判别系统的形式,有效减少了由单判别器判别性能不佳导致判别误差的情况;同时考虑到若集成判别网络均采用统一网络设置,则在模型训练中基判别网络将趋近于一种表现形式,为鼓励判别网络判别结果多样且避免网络陷入雷同,设置拥有不同网络结构的判别网络,并在集成判别网络中引入具有动态调整基判别网络投票权重的多数投票策略,对集成判别网络的判别结果进行投票,有效地促进了模型的收敛且较大减少了实验误差。最后将提出的模型与同方向的模型在不同数据集上使用不同评价指标进行评价,实验结果表明提出的模型无论在生成样本多样性、生成样本质量还是在模型收敛速度上均明显优于几种竞争模型。
-
关键词
生成对抗网络(GAN)
集成判别系统
选择性集成学习
多数投票策略
-
Keywords
generative adversarial networks(GAN)
integrated discrimination system
selective ensemble learning
majority voting strategy
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名大数据环境下的投票特征选择算法
被引量:1
- 5
-
-
作者
周翔
翟俊海
黄雅婕
申瑞彩
侯璎真
-
机构
河北大学数学与信息科学学院
河北大学河北省机器学习与计算智能重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第5期936-942,共7页
-
基金
国家自然科学基金项目(71371063)资助
河北省科技计划重点研发项目(19210310D)资助
+1 种基金
河北省自然科学基金项目(F2017201026)资助
河北大学研究生创新项目(hbu2020ss045)资助。
-
文摘
随着数据的爆炸式增长,大数据问题越来越受到关注,然而由于大数据具有维度较高、数据复杂且变化迅速的特性,导致传统的机器学习算法不再适用,故解决大数据特征选择问题迫在眉睫.本文基于投票机制和决策树算法提出了大数据环境下的投票特征选择算法.具体步骤为,随机划分大数据集U为L个子集,将划分后的L个子集发送到L个map节点,在每个map节点上使用决策树算法进行特征选择.在reduce节点,用每个map节点选择出来的特征进行投票,将得票数大于阙值的特征选择出来.将提出的算法在Hadoop和Spark两个开源大数据平台进行了实验,发现两个大数据平台的运行机制有诸多异同.此外,将提出的大数据投票特征选择算法和单变量特征选择算法与基于遗传算法的特征选择算法在5个高维数据集上进行了实验比对.经过对实验结果的分析,发现提出的算法相较于两个相关算法分类精度和执行效率都有更优的表现.证明了提出的算法优于这两个算法,可以有效地解决高维数据的特征选择问题.
-
关键词
大数据
特征选择
决策树
机器学习
投票机制
-
Keywords
big data
feature selection
decision tree
machine learning
voting mechanism
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-