融合无监督和监督学习策略生成的多分类决策树被引量：13

Construction of Multi-classification Decision Tree Combining Unsupervised and Supervised Learning Strategy

下载PDF

导出

摘要提出了一种融合无监督和监督两种学习策略生成多分类决策树的方法 .它首先利用无监督聚类方法能够发现待分类样本之间的内在联系和规律的特点 ,确定出最为符合多类样本分布特征的决策树的树型 ,继而利用监督学习支持向量机的方法对样本进行准确的分类 .通过采用核函数和不对称的 L agrangian系数限制条件 ,支持向量机很好的解决了样本特征空间上的线性不可分性和决策树型确定过程中出现的训练样本不对称性的影响 .该方法具有较高的计算效率和准确性。 In this paper, a new method which combines unsupervised and supervised learning strategy is put forward to construct the multi classification decision tree. It firstly uses the unsupervised clustering to determine the structure of the multi classification decision tree, whose each node has a binary branch. The unsupervised clustering is able to find out the relationship between the multi classes, therefore the decision tree's structure determined by it is the best one that fits to the distribution of multi classes in feature space. Then, a supervised learning method, i.e. support vector machine, is used to classify the two groups of samples of each node of the decision tree. Most cases the multi classes cannot be classified by a linear hyperplane, kernel functions are therefore introduced into to solve it. Simultaneously, unsymmetrical constrains of Lagrangian coefficients are set to overcome the negative influences of unbalanced train samples. These efforts guarantee the efficiency and accuracy of the multi classification decision tree. Satisfying results were obtained in experiment.

作者邱德红陈传波

机构地区华中科技大学计算机科学和技术学院

出处《小型微型计算机系统》 CSCD 北大核心 2004年第4期555-559,共5页 Journal of Chinese Computer Systems

关键词多分类决策树无监督聚类支持向量机 multi classification decision tree unsupervised cluster support vector machine

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李晓黎,刘继敏,史忠植.基于支持向量机与无监督聚类相结合的中文网页分类器[J].计算机学报,2001,24(1):62-68. 被引量：108

二级参考文献1

1李晓黎,史忠植.用数据采掘方法获取汉语词性标注规则[J].计算机研究与发展,2000,37(12):1409-1414. 被引量：10

共引文献107

1王世卫,李爱国.报税欺诈检测研究[J].仪器仪表学报,2005,26(z1):900-901.
2童亚拉,陈益.一种基于混沌粒子群算法的网页分类规则抽取方法[J].微电子学与计算机,2009,26(2):193-196. 被引量：2
3郑松峰,徐维朴,刘维湘,郑南宁.基于无监督聚类的约简支撑向量机[J].计算机工程与应用,2004,40(14):74-76. 被引量：1
4贾自艳,何清,张海俊,李嘉佑,史忠植.一种基于动态进化模型的事件探测和追踪算法[J].计算机研究与发展,2004,41(7):1273-1280. 被引量：59
5江宝林,申展,张川,葛家翔,胡运发.结合网站内容和结构进行的Web日志挖掘[J].计算机工程,2004,30(16):30-32. 被引量：9
6张莉,康耀红,王曙光,张春元.中文网页自动分类现状的研究[J].福建电脑,2004,20(5):3-4. 被引量：1
7包骏杰,马燕.一种基于互联网智能元搜索引擎的研究[J].计算机科学,2004,31(6):103-105. 被引量：1
8黄发良,钟智.用于分类的支持向量机[J].广西师范学院学报（自然科学版）,2004,21(3):75-78. 被引量：14
9王丽侠,房福亭.分级聚类与平面划分结合方法在网页分类中的应用[J].计算机工程与应用,2004,40(35):139-141. 被引量：2
10梁春燕,郭力,夏诏杰,杨章远.网络搜索引擎的性能优化策略和相关技术[J].计算机工程与应用,2004,40(36):179-182. 被引量：5

同被引文献133

1邹吉宇,庞立健,吕晓东.基于数据挖掘的《临证指南医案》治疗喘证用药规律探究[J].辽宁中医杂志,2022,49(3):11-15. 被引量：4
2高中贵,彭补拙.我国农用地分等定级研究综述[J].经济地理,2004,24(4):514-519. 被引量：47
3张喆,常桂然,黄小原.一种基于遗传算法的多重决策树组合分类方法[J].系统工程理论与实践,2004,24(4):63-69. 被引量：6
4蔡林峰,傅冬绵,蒙璐.案例推理技术在企业资信评估中的应用[J].微机发展,2004,14(7):118-121. 被引量：3
5王永炎.完善中医辨证方法体系的建议[J].中医杂志,2004,45(10):729-731. 被引量：243
6查青林,林色奇,吕爱平.多元统计分析在中医证候研究中的应用探析[J].江西中医学院学报,2004,16(6):79-80. 被引量：46
7林小莹,王占岐,殳浩.回归分析在农用土地分等中的应用[J].资源环境与工程,2005,19(1):65-69. 被引量：10
8张娴静,陈政,赵耐青,罗力,张黎明,王颖,陈进根,张广鹏,邓益川,孙梅,李春芳,马进,谢洪明,华颖,包江波,劭晶晶,郝模.上海市嘉定区农村居民就诊单位选择的影响因素分析——决策树和多分类无序反应变量的logistic回归相结合的方法[J].中国卫生统计,2005,22(2):80-84. 被引量：29
9司文武,钱沄涛.一种基于谱聚类的半监督聚类方法[J].计算机应用,2005,25(6):1347-1349. 被引量：11
10唐发明,王仲东,陈绵云.支持向量机多类分类算法研究[J].控制与决策,2005,20(7):746-749. 被引量：90

引证文献13

1张国云,章兢.基于模糊支持向量机的多级二叉树分类器的水轮机调速系统故障诊断[J].中国电机工程学报,2005,25(8):100-104. 被引量：36
2黄勇,郑春颖,宋忠虎.多类支持向量机算法综述[J].计算技术与自动化,2005,24(4):61-63. 被引量：33
3陈志民,杨敬锋,陈其昌,张嘉琪,陈强.融合监督学习与凝聚层次聚类的土地评价方法[J].计算机工程与应用,2007,43(18):188-190. 被引量：3
4李海霞,孙占全,王阶,胡元会,何庆勇,西广成.基于扩展熵的无监督聚类的中医辨证[J].中国中医基础医学杂志,2007,13(8):627-629. 被引量：12
5那健,丁大伟,丁俊松.支持向量机的多类分类算法[J].科技咨询导报,2007(29):230-230. 被引量：1
6郎宇宁,蔺娟如.基于支持向量机的多分类方法研究[J].中国西部科技,2010,9(17):28-29. 被引量：19
7赵志刚,吕慧显,李玉景,李京.一种基于聚类思想的SVM多类分类方法[J].青岛理工大学学报,2011,32(1):73-76. 被引量：3
8李鑫颉,贾振华,吴以岭.数据挖掘方法在中医医案研究中的现状分析[J].中国中医基础医学杂志,2012,18(1). 被引量：21
9张世君,齐冬梅,李运伦,聂文婷,朱丽娟.中医证候规范化研究中无监督方法探讨[J].长春中医药大学学报,2016,32(1):1-5. 被引量：9
10余新华.累积适应度遗传算法在SVM多分类决策树中的优化研究[J].绵阳师范学院学报,2018,37(8):107-111.

二级引证文献138

1吕秀莲,高国臣,石瑛.吉化“五性”工作法──生产经营中的思想政治工作方法探索[J].石油政工研究,2002(2):15-16.
2张公永,李伟.基于灰色最小二乘支持向量机的变压器油溶解气体预测[J].电力学报,2012,27(2):111-115. 被引量：3
3庄玮,段锁林,徐亭婷.基于SVM的4类运动想象的脑电信号分类方法[J].常州大学学报（自然科学版）,2014,26(1):42-46. 被引量：5
4王春林,周昊,周樟华,凌忠钱,李国能,岑可法.基于支持向量机的大型电厂锅炉飞灰含碳量建模[J].中国电机工程学报,2005,25(20):72-76. 被引量：98
5肖燕彩,陈秀海,朱衡君.基于最小二乘支持向量机的变压器油中气体浓度预测[J].电网技术,2006,30(11):91-94. 被引量：15
6徐启华,师军.Fault Diagnosis for Aero-engine Applying a New Multi-class Support Vector Algorithm[J].Chinese Journal of Aeronautics,2006,19(3):175-182. 被引量：4
7陈江波,付锡年,聂德鑫,伍志荣.UHV变压器故障监测与诊断的信息决策平台[J].高电压技术,2006,32(12):108-111. 被引量：4
8陶文斌,张粒子,潘弘,李振元,郑华.基于双层贝叶斯分类的空间负荷预测[J].中国电机工程学报,2007,27(7):13-17. 被引量：39
9王春林,周昊,李国能,邱坤赞,岑可法.基于支持向量机与遗传算法的灰熔点预测[J].中国电机工程学报,2007,27(8):11-15. 被引量：42
10王春林,周昊,李国能,凌忠钱,岑可法.基于遗传算法和支持向量机的低NO_x燃烧优化[J].中国电机工程学报,2007,27(11):40-44. 被引量：67

1汪海锐,李伟.基于关联规则的决策树算法[J].计算机工程,2011,37(9):104-106. 被引量：13
2郭四稳.基于决策树分类器的归纳并行算法[J].计算机与数字工程,2006,34(9):25-26.
3何升.支持向量机在基于内容的图像检索中的应用[J].考试周刊,2007(16):87-88.
4范莹,计华,张化祥.一种新的基于模糊聚类的组合分类器算法[J].计算机应用,2008,28(5):1204-1207. 被引量：3
5韩灵珊.基于图的半监督学习方法综述[J].科教导刊（电子版）,2016,0(10):160-161.
6徐爱琴,张德贤.基于神经网络的分类决策树构造[J].计算机工程与应用,2000,36(10):43-45. 被引量：5
7张军,刘文杰.一种新的基于邻居样本分布特征的异常值检测算法研究[J].科技通报,2017,33(1):86-88. 被引量：4
8王晓国,黄韶坤,朱炜,李启炎.应用C4.5算法构造客户分类决策树的方法[J].计算机工程,2003,29(14):89-91. 被引量：37
9谢芬.遗传算法优化的肿瘤基因表达谱分类研究[J].福建电脑,2010,26(3):2-3.
10孟上,高陈强,杨璐毓.一种基于深度图像的手势识别算法[J].数字通信,2014,41(2):22-26. 被引量：1

小型微型计算机系统

2004年第4期

浏览历史

内容加载中请稍等...

融合无监督和监督学习策略生成的多分类决策树被引量：13

参考文献1

二级参考文献1

共引文献107

同被引文献133

引证文献13

二级引证文献138

相关作者

相关机构

相关主题

浏览历史

融合无监督和监督学习策略生成的多分类决策树 被引量：13

参考文献1

二级参考文献1

共引文献107

同被引文献133

引证文献13

二级引证文献138

相关作者

相关机构

相关主题

浏览历史

融合无监督和监督学习策略生成的多分类决策树被引量：13