聚类辅助特征对齐的域适应方法被引量：2

Clustering Assist Feature Alignment for Unsupervised Domain Adaptation

下载PDF

导出

摘要有监督深度学习在有大量标记数据的领域可以取得不错的效果,但实际上很多领域只有大量未标记的数据。如何利用大量无标记数据,成为了深度学习发展的一个关键问题,领域自适应就是解决这一问题的一种有效方法。目前,基于对抗训练的域适应方法取得了较好的效果,这类方法利用领域分类损失对源域和目标域的特征分布进行对齐,降低了两个领域特征表示的分布差异,使采用源域数据训练的模型可以应用在目标域数据上。现有的域适应方法是在适配后的特征上进行模型训练的,没有充分利用目标域数据的原始信息,当两个领域差异较大时,会降低目标域特征的域内可鉴别性。针对现有方法的弱点,文中基于对抗判别域适应方法(ADDA),提出了一种基于对目标域数据聚类辅助特征对齐的域适应方法(CAFA-DA)。该方法通过聚类获得目标域数据伪标记,并在域适应阶段约束特征编码器训练,利用目标域数据的原始信息提高目标域特征的可鉴别性;将聚类和域适应两个过程训练的分类器进行集成学习,用高置信度样本进行训练,以提升模型的最终效果。CAFA-DA可用在任何基于对抗损失的领域自适应方法上。最后,在领域自适应的4个标准数据集上将CAFA-DA方法与目前几种先进的领域自适应方法进行了对比实验,结果表明:CAFA-DA方法的实验结果比其他几种方法都好;相对于ADDA方法,该方法在2个对比实验上的准确率分别提升了3.2%和17.2%。 Supervised deep learning can reach good results in the areas with large amounts of labeled data,but the rea- lity is that there are only a lot of unlabeled data in many areas.How to take advantages of large amounts of unlabeled data has become a key issue in the development of deep learning.Domain adaptation is an effective way to solve this problem.At present,domain adaptation methods based on adversarial training have achieved a good effect.This method uses domain classification loss to align the feature distribution of source domain,and target domain and reduce the difference of distribution between the feature representations of two domain,so the classifier trained with source domain data can be applied to target domain data.The existing domain adaptation method trains the model on the features after domain adaptation and does not make full use of the original information of the target domain data.When the differences between two domains are large,the intra-domain discriminability of target domain features will be reduced.In view of the disadvantages of the present methods,this paper proposed a method for clustering target domain data to assist feature alignment(CAFA-DA) based on the adversarial discriminative domain adaptation (ADDA). Pseudo-labels of target domain data are obtained by clustering and the feature encoder training is constrained in the domain adaptation stage,and the original information of the target domain data is used to improve the discriminability of target domain features.Classifiers trained in the two processes of clustering and domain adaptation are used for ensemble learning and high confidence samples are trained to improve the final effect of the model.The CAFA-DA can be applied to any domain adaption method based on adversarial loss.Finally,this paper compared CAFA-DA with several advanced domain adaption methods on four standard domain adaption data sets.The results show that the accuracy of the CAFA-DA method is better than other methods.Compared with the ADDA method,the results of two comparative experiments are improved by 3.2% and 17.2% respectively.

作者袁丁王茜邓李维 YUAN Ding;WANG Qian;DENG Li-wei(College of Computer Science,Chongqing University,Chongqing 400044,China)

机构地区重庆大学计算机学院

出处《计算机科学》 CSCD 北大核心 2019年第3期221-226,共6页 Computer Science

基金国家自然科学基金(61701051)资助

关键词域适应特征对齐聚类集成学习特征表示 Domain adaption Feature alignment Clustering Ensemble learning Feature representation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1王越,王泉,吕奇峰,曾晶.基于初始聚类中心优化和维间加权的改进K-means算法[J].重庆理工大学学报（自然科学）,2013,27(4):77-80. 被引量：7

二级参考文献10

1李业丽,秦臻.一种改进的k-means算法[J].北京印刷学院学报,2007,15(2):63-65. 被引量：9
2袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
3HAN Jia wei, KAMBER M. Data Mining Concepts and Techniques[ M ]. [ S. 1 ] :Morgan Kaufman Publishers,2001.
4孟岩,刘希玉,刘艳丽.一种基于蚁群算法的K-means算法——在公路运输枢纽宏观布局规划中的应用[J].计算机工程与应用,2008,44(1):179-182. 被引量：8
5连凤娜,吴锦林,唐琦.一种改进的K-means聚类算法[J].电脑与信息技术,2008,16(1):38-40. 被引量：23
6曹文平.一种有效k-均值聚类中心的选取方法[J].计算机与现代化,2008(3):95-97. 被引量：9
7赖玉霞,刘建平,杨国兴.基于遗传算法的K均值聚类分析[J].计算机工程,2008,34(20):200-202. 被引量：71
8顾洪博,张继怀.聚类算法初始聚类中心的优化[J].西安工程大学学报,2010,24(2):222-226. 被引量：7
9路彬彬,贾振红,何迪,杨杰,庞韶宁.基于新的遗传算法的模糊C均值聚类用于遥感图像分割[J].激光杂志,2010,31(6):15-17. 被引量：11
10韩存鸽.聚类挖掘在高校图书馆管理系统中的应用[J].重庆理工大学学报（自然科学）,2012,26(11):83-87. 被引量：5

共引文献6

1杨格兰,金辉霞,孟令中,朱幸辉.基于图的半监督降维算法[J].计算机科学,2014,41(4):280-282. 被引量：2
2陈望,贾振红,覃锡忠,曹传玲,常春.基于改进K-means聚类算法的室内WLAN定位研究[J].激光杂志,2014,35(7):11-14. 被引量：14
3张小川,严杰,朱常鹏.聚类算法在市政绩效评估中的应用[J].软件导刊,2015,14(11):48-51. 被引量：2
4程欣欣,陶晓英.基于大数据的客户触达效率提升研究[J].信息通信技术,2017,11(4):53-59.
5王宏杰,师彦文.结合初始中心优化和特征加权的K-Means聚类算法[J].计算机科学,2017,44(B11):457-459. 被引量：19
6郜丽鹏,纪风有.基于联合概率关联的雷达信号分选方法[J].应用科技,2019,46(1):69-75. 被引量：4

同被引文献16

1孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：619
2毛典辉.基于MapReduce的Canopy-Kmeans改进算法[J].计算机工程与应用,2012,48(27):22-26. 被引量：65
3郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：201
4韦盛斌,王少卿,周常河,刘昆,范鑫.用于三维重建的点云单应性迭代最近点配准算法[J].光学学报,2015,35(5):244-250. 被引量：40
5张博,史忠植,赵晓非,张建华.一种基于跨领域典型相关性分析的迁移学习方法[J].计算机学报,2015,38(7):1326-1336. 被引量：28
6赵国朕,宋金晶,葛燕,刘永进,姚林,文涛.基于生理大数据的情绪识别研究进展[J].计算机研究与发展,2016,53(1):80-92. 被引量：45
7姜海燕,刘昊天,舒欣,徐彦,伍艳莲,郭小清.基于最大均值差异的多标记迁移学习算法[J].信息与控制,2016,45(4):463-470. 被引量：11
8王斐,吴仕超,刘少林,张亚徽,魏颖.基于脑电信号深度迁移学习的驾驶疲劳检测[J].电子与信息学报,2019,41(9):2264-2272. 被引量：21
9赖虹宇,冯静雯,王毅,邓伟,曾金坤,李涛,张军鹏,刘凯.抑郁症和精神分裂症患者静息态脑电信号的分类研究[J].生物医学工程学杂志,2019,36(6):916-923. 被引量：13
10罗靖宇.基于脑电信号的情绪识别概述[J].现代计算机,2020,26(8):68-71. 被引量：2

引证文献2

1姚明海,黄展聪.基于主动学习的半监督领域自适应方法研究[J].高技术通讯,2020,30(8):783-789. 被引量：5
2韩劲,薄华,曹芳.基于模型迁移的跨被试脑电情感分类算法[J].计算机应用与软件,2024,41(8):92-100.

二级引证文献5

1石教祥,朱礼军,魏超,张玄玄.融合迁移学习与主动学习的金融科技实体识别方法[J].中国科技资源导刊,2022,54(2):35-45. 被引量：1
2韩彦净,马米米,张淑莉.基于几何感知双流网络的无监督域自适应模型[J].计算机应用与软件,2023,40(7):203-214.
3孙川钘,朱镕申,张凌云.基于Python技术的半监督文本语义分类方法研究[J].计算机仿真,2023,40(7):496-500. 被引量：1
4邱春红,邵晓根.基于同伴辅助学习分类器的部分域自适应方法[J].计算机应用与软件,2024,41(1):168-176.
5吴博,李永胜,王睿,徐正林,冉祥金,薛林福.基于自训练的多标签岩矿石薄片分类方法[J].黄金,2024,45(2):61-67.

1高灿,周杰,高天宇,赖志辉.不完备弱标记数据的粗糙协同学习模型[J].模式识别与人工智能,2018,31(10):950-957. 被引量：4
2李素艳,周晓莉.重视书面表达的过程训练逐步提高学生的写作能力[J].考试与招生,2018,0(10):41-46.
3韩树发,于颖,唐堂,陈明,王亮,夏跃利.基于联合领域自适应卷积神经网络的多工况故障诊断[J].微型电脑应用,2019,35(1):4-9. 被引量：6
4库浩华,周萍,蔡晓东,杨海燕,梁晓曦.基于区域特征对齐与k倒排编码的行人再识别方法[J].计算机工程,2019,45(3):207-211. 被引量：4
5涂曼姝,潘接林.关于深度神经网络在交叉领域的情感分类任务中的可迁移性探究[J].情报工程,2018,4(6):13-24. 被引量：1
6冯雪.中文分词模型词典融入方法比较[J].计算机应用研究,2019,36(1):8-10. 被引量：6
7王超.浅析我国警务战术实战训练与发展方向[J].法制博览,2018(3):245-245. 被引量：2
8李欣.新疆高校学生科学文明综合素质模型构建与实证研究[J].科技促进发展,2018,14(8):765-772.
9刘星,陈坚,杨东方,贺浩.场景耦合的空对地多任务遥感影像智能检测算法[J].光学学报,2018,38(12):254-262. 被引量：4
10刘婷.基于空间关联的中国PM_(2.5)污染数据统计研究[J].环境科学与管理,2019,44(2):137-140.

计算机科学

2019年第3期

浏览历史

内容加载中请稍等...

聚类辅助特征对齐的域适应方法被引量：2

参考文献1

二级参考文献10

共引文献6

同被引文献16

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

聚类辅助特征对齐的域适应方法 被引量：2

参考文献1

二级参考文献10

共引文献6

同被引文献16

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

聚类辅助特征对齐的域适应方法被引量：2