基于相似度衡量的决策树自适应迁移被引量：9

Self-adaptive Transfer for Decision Trees Based on Similarity Metric

下载PDF

导出

摘要如何解决迁移学习中的负迁移问题并合理把握迁移的时机与方法,是影响迁移学习广泛应用的关键点.针对这个问题,提出一种基于相似度衡量机制的决策树自适应迁移方法 (Self-adaptive transfer for decision trees based on a similarity metric,STDT).首先,根据源任务数据集是否允许访问,自适应地采用成分预测概率或路径预测概率对决策树间的相似性进行判定,其亲和系数作为量化衡量关联任务相似程度的依据.然后,根据多源判定条件确定是否采用多源集成迁移,并将相似度归一化后依次分配给待迁移源决策树作为迁移权值.最后,对源决策树进行集成迁移以辅助目标任务实现决策.基于UCI机器学习库的仿真结果说明,与多源迁移加权求和算法(Weighted sum rule,WSR)和MS-TrAdaBoost相比,STDT能够在保证决策精度的前提下实现更为快速的迁移. Negative transfer, transfer opportunity and transfer method are the most key problems affecting the learning perfor- mance of transfer learning. In order to solve these problems, a self-adaptive transfer for decision trees based on a similarity metric （STDT） is proposed. At first, according to whether the source task datasets to be allowed to access, a prediction prob- ability based on constituents or paths is adaptively used to cal- culate the affinity coefficient between decision trees, which can quantify the similarity degree of related tasks. Secondly, a judg- ment condition of multi-sources is used to determine whether the multi-source integrated transfer is adopted. If do, the sim- ilarity degrees are normalized, which can be viewed as transfer weights assigned to source decision trees to be transferred. At last, the source decision trees are transferred to assist the tar- get task in making decisions. Simulation results on UCI and text classification datasets illustrate that, compared with multi- source transfer algorithms, i.e., weighted sum rule （WSR） and MS-TrAdaBoost, the proposed STDT has a faster transfer speed with the assurance of high decision accuracy.

作者王雪松潘杰程玉虎曹戈

机构地区中国矿业大学信息与电气工程学院徐州

出处《自动化学报》 EI CSCD 北大核心 2013年第12期2186-2192,共7页 Acta Automatica Sinica

基金国家自然科学基金(61072094,61273143) 教育部博士点基金(20110095110016,20120095110025) 江苏省研究生科研创新计划(CXZZ12 0932)资助~~

关键词迁移学习决策树相似度亲和系数 Transfer learning, decision tree, similarity metric,affinity coefficient

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1洪佳明,印鉴,黄云,刘玉葆,王甲海.TrSVM:一种基于领域相似性的迁移学习算法[J].计算机研究与发展,2011,48(10):1823-1830. 被引量：17

二级参考文献11

1Pan S J, Yang Q. A survey on transfer learning [J]. IEEE Trans on Knowledge and Data Engineering, 2010, 22(10): 1345-1359.
2Vapnik V. An overview of statistical learning theory [J]. IEEE Trans on NeuraI Networks, 1999, 10(5): 988-999.
3Shi Y, Lan Z, Liu W, et al. Extending semi-supervised learning methods for inductive transfer learning [C] //Proc of the 9th IEEE Int Conf on Data Mining. Los Alamitos: IEEE Computer Society, 2009:483-492.
4Burges C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.
5Dai W, Yang Q, Xue G, et al. Boosting for transfer learning [C] //Proc of the 24th Int Conf on Machine Learning. New York: ACM, 2007: 193-200.
6Pan S J, Kwok J T, Yang Q. Transfer learning via dimensionality reduction [C] //Proc of AAAI. Menlo Park, CA: AAAI, 2008: 677-682.
7Xie S, Fan W, Peng J, et al. Latent space domain transfer between high dimensional overlapping distributions [C] // Proc of the 18th Int Conf on World Wide Web. New York: ACM, 2009:91-100.
8Ben-David S, Blitzer J, Crammer K, et al. A theory of learning from different domains [J]. Machine Learning, 2010, 79(1/2): 151-175.
9Boyd S, Vandenberghe L. Convex Optimization [M]. Cambridge: Cambridge University Press, 2004.
10Platt J C. Sequential minimal optimization: A fast algorithm for training support vector machines, MST-TR-98-14 [R]. Redmond, WA: Microsoft Research, 1998.

共引文献16

1许敏,王士同,史荧中.一种新的面向迁移学习的L_2核分类器[J].电子与信息学报,2013,35(9):2059-2065. 被引量：1
2倪彤光,王士同,应文豪,邓赵红.迁移组概率学习机[J].电子学报,2013,41(11):2207-2215. 被引量：2
3倪彤光,王士同,史荧中,张景祥.面向共享数据的迁移组概率学习机[J].控制与决策,2014,29(8):1363-1371.
4倪彤光,王士同.适用于不确定类标签数据学习的迁移支持向量机[J].控制与决策,2014,29(10):1751-1757. 被引量：3
5杨兴明,吴克伟,孙永宣,谢昭.可迁移测度准则下的协变量偏移修正多源集成方法[J].电子与信息学报,2015,37(12):2913-2920. 被引量：2
6董爱美,毕安琪,王士同.基于迁移共享空间的分类新算法[J].计算机研究与发展,2016,53(3):632-643. 被引量：3
7文益民,唐诗淇,冯超,高凯.基于在线迁移学习的重现概念漂移数据流分类[J].计算机研究与发展,2016,53(8):1781-1791. 被引量：15
8周国华,巢海鲸,申燕萍.安全迁移支持向量机[J].计算机科学,2017,44(B11):381-384. 被引量：2
9唐诗淇,文益民,秦一休.一种基于局部分类精度的多源在线迁移学习算法[J].软件学报,2017,28(11):2940-2960. 被引量：10
10杨奇奇,张玉红,胡学钢.一种基于多桥映射的跨领域文本分类方法[J].计算机应用研究,2018,35(4):996-1000. 被引量：2

同被引文献65

1宋军英,崔益伟,李欣然,钟伟,邹鑫,李培强.基于欧氏动态时间弯曲距离与熵权法的负荷曲线聚类方法[J].电力系统自动化,2020(15):87-98. 被引量：31
2杨尔辅,周强,胡益锋,徐用懋.基于PCA-RBF神经网络的工业裂解炉收率在线预测软测量方法[J].系统仿真学报,2001,13(z1):194-197. 被引量：15
3林舒杨,李翠华,江弋,林琛,邹权.不平衡数据的降采样方法研究[J].计算机研究与发展,2011,48(S3):47-53. 被引量：31
4蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
5徐建源,朗福成,林莘.高压断路器机械特性在线监测技术的现状与发展趋势[J].华通技术,2005,24(2):17-22. 被引量：24
6黄纯,江亚群.谐波分析的加窗插值改进算法[J].中国电机工程学报,2005,25(15):26-32. 被引量：107
7孙来军,胡晓光,纪延超,吕超.小波包-特征熵在高压断路器故障诊断中的应用[J].电力系统自动化,2006,30(14):62-65. 被引量：18
8胡晓光,孙来军,纪延超.基于线圈电流和触点状态的断路器故障分析[J].电力自动化设备,2006,26(8):5-7. 被引量：31
9郑小霞,钱锋.基于证据框架的最小二乘支持向量机在精对苯二甲酸生产中的应用[J].化工学报,2006,57(7):1612-1616. 被引量：10
10孙来军,胡晓光,纪延超.基于支持向量机的高压断路器机械状态分类[J].电工技术学报,2006,21(8):53-58. 被引量：35

引证文献9

1邱云飞,刘世兴,林明明,邵良杉.基于分布和逆文本类别指数的特征迁移加权算法[J].计算机应用,2015,35(6):1643-1648. 被引量：1
2刘佳,邵诚,朱理.基于迁移学习工况划分的裂解炉收率PSO-LS-SVM建模[J].化工学报,2016,67(5):1982-1988. 被引量：9
3舒醒,于慧敏,郑伟伟,谢奕,胡浩基,唐慧明.基于边际Fisher准则和迁移学习的小样本集分类器设计算法[J].自动化学报,2016,42(9):1313-1321. 被引量：12
4陈莹,黄永彪,谢瑾.桥梁结构的未标记模态特征稀疏编码深度学习监测[J].计算机应用研究,2016,33(12):3725-3729. 被引量：1
5唐诗淇,文益民,秦一休.一种基于局部分类精度的多源在线迁移学习算法[J].软件学报,2017,28(11):2940-2960. 被引量：10
6覃刚,王艳晗,冀晓东.基于稀疏惩罚交叉熵因子的DRBM桥梁监测[J].控制工程,2018,25(8):1397-1402.
7金鑫晨,崔鹤松,武建文,马速良,冯英,袁洋,梁传涛.基于小波包能量谱和延时时间的断路器故障诊断[J].高压电器,2019,55(6):38-44. 被引量：12
8张永清,卢荣钊,乔少杰,韩楠,GUTIERREZ Louis Alberto,周激流.一种基于样本空间的类别不平衡数据采样方法[J].自动化学报,2022,48(10):2549-2563. 被引量：10
9崔益伟,苏宏伟,何文钦.k-means算法在电网项目后评价中的应用[J].电工技术,2023(13):84-86.

二级引证文献54

1田鹏,崔其会,张建华,吕妍,吕学宾,曹什.基于电流-振动信号和GA-SVM的隔离开关故障诊断[J].高电压技术,2023,49(S01):179-185.
2张利军,王国清.石脑油裂解产物分布支持向量机模型的建立[J].石油化工,2017,46(8):1022-1027.
3王通,段泽文,李琨.基于改进AdaBoost的油井动液面自适应集成建模[J].电子测量与仪器学报,2017,31(8):1342-1348. 被引量：7
4许夙晖,慕晓冬,柴栋,罗畅.基于极限学习机参数迁移的域适应算法[J].自动化学报,2018,44(2):311-317. 被引量：18
5李芳.基于稀疏监测理论的间接带间串扰检测方法[J].武警工程大学学报,2018,34(2):9-13.
6崔鹏,赵莎莎.基于稀疏编码和背景差分的迁移学习行人检测算法[J].光电子．激光,2018,29(9):1012-1020. 被引量：2
7付荣荣,侯培国,李曼迪.基于Fisher准则的单次运动想象脑电信号意图识别研究[J].生物医学工程学杂志,2018,35(5):774-778. 被引量：4
8杜永贵,李思思,阎高伟,程兰.基于流形正则化域适应湿式球磨机负荷参数软测量[J].化工学报,2018,69(3):1244-1251. 被引量：15
9梁修荣,杨正益.基于聚类和SVM的数据分类方法与实验研究[J].西南师范大学学报（自然科学版）,2018,43(3):91-96. 被引量：8
10秦一休,文益民,何倩.概念漂移数据流分类中的多源在线迁移学习算法[J].计算机科学,2019,46(1):64-72. 被引量：3

1杨玉丽,彭新光,黄名选,边婧.基于离散粒子群优化的云工作流调度[J].计算机应用研究,2014,31(12):3677-3681. 被引量：10
2刘胜男,宁纪锋.基于超像素的点互信息边界检测算法[J].计算机应用,2016,36(8):2296-2300. 被引量：4
3谭勇.一个基于SPRINT的分类算法的实现[J].湖北民族学院学报（自然科学版）,2004,22(2):72-75.
4何兵,郝爱民,赵沁平.一种基于不确定信息的决策方法[J].计算机学报,2004,27(2):281-285. 被引量：11
5刘晋胜,彭志平,周靖.一种多策略并行遗传算法及其收敛性分析[J].计算机测量与控制,2011,19(8):2022-2025. 被引量：3
6匡春临,夏清强.基于SVM-KNN的文本分类算法及其分析[J].计算机时代,2010(8):29-31. 被引量：3
7蔡肯,梁晓莹.基于内容的视频检索技术[J].现代计算机,2007,13(12):59-61. 被引量：1
8计永昶,卜添,陈国良.并行播送和求和算法在几种实际计算模型上的设计和分析[J].中国科学技术大学学报,1996,26(2):195-203. 被引量：3
9张少宏,李继巧,罗嘉怡,谢冬青,王婧.基于信息融合的网页文本聚类距离选择方法[J].广州大学学报（自然科学版）,2016,15(1):80-89.
10张晶.基于结构相似度衡量的图像超分辨率重建[J].哈尔滨商业大学学报（自然科学版）,2016,32(4):476-478. 被引量：1

自动化学报

2013年第12期

浏览历史

内容加载中请稍等...

基于相似度衡量的决策树自适应迁移被引量：9

参考文献1

二级参考文献11

共引文献16

同被引文献65

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于相似度衡量的决策树自适应迁移 被引量：9

参考文献1

二级参考文献11

共引文献16

同被引文献65

引证文献9

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

基于相似度衡量的决策树自适应迁移被引量：9