模型决策树：一种决策树加速算法被引量：13

Model Decision Tree: An Accelerated Algorithm of Decision Tree

下载PDF

导出

摘要决策树算法采用递归方法构建,训练效率较低,过度分类的决策树可能产生过拟合现象.因此,文中提出模型决策树算法.首先在训练数据集上采用基尼指数递归生成一棵不完全决策树,然后使用一个简单分类模型对其中的非纯伪叶结点(非叶结点且结点包含的样本不属于同一类)进行分类,生成最终的决策树.相比原始的决策树算法,这样产生的模型决策树能在算法精度不损失或损失很小的情况下,提高决策树的训练效率.在标准数据集上的实验表明,文中提出的模型决策树在速度上明显优于决策树算法,具备一定的抗过拟合能力. The decision tree algorithm is constructed in a recursive style. Therefore, the low training efficiency is yielded and the over-classification of decision tree may produce overfitting. An accelerated algorithm called model decision tree （MDT） is proposed in this paper. An incomplete classification decision tree is established via the Gini index on the training dataset firstly. Then a simple model is utilized to classify impure pseudo leaf nodes, which are neither leaf nodes nor in the same class. Consequently, the final MDT is generated. Compared with DT, MDT improves the training efficiency with smaller loss of classification accuracy or even no loss. The experimental results on benchmark datasets show that the proposed MDT is much faster than DT and it has a certain ability to avoid overfitting.

作者尹儒门昌骞王文剑刘澍泽 YIN Ru;MEN Changqian;WANG Wenjian;LIU Shuze(School of Computer and Information Technology,Shanxi University,Taiyuan 030006;Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan 030006;Department of Computer Science,Rensselaer Polytechnic Institute,Troy,NY 12180)

机构地区山西大学计算机与信息技术学院山西大学计算智能与中文信息处理教育部重点实验室 Department of Computer Science

出处《模式识别与人工智能》 EI CSCD 北大核心 2018年第7期643-652,共10页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.61673249)、山西省回国留学人员科研基金项目(No.2016-004)、赛尔网络下一代互联网技术创新项目(No.NGIL20170601)

关键词基尼指数决策树(DT) 模型决策树分类 Gini Index Decision Tree Model Decision Tree Classification

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1John Durkin,蔡竞峰,蔡自兴.决策树技术及其当前研究方向[J].控制工程,2005,12(1):15-18. 被引量：62

二级参考文献30

1Stone P,Veloso M.A layered approach to learning client behaviors in the RoboCup soccer server[J].Applied Artificial Intelligence(AAI),1998,12(2-3):165-187.
2Ankerst M,Elsen C,Ester M,et al.Visual classification:an interactive approach to decision tree construction[C].San Diego:In Proceedings of International Conference on Knowledge Discovery and Data Mining,1999.
3Fournier D,Cremilleux B.A quality index for decision tree pruning[J].Knowledge-based Systems,2002,15(1):37-43.
4Sebban M,Nock R,Chauchat J H,et al.Impact of learning set quality and size on decision tree performances[J].IJCSS,2000,1(1):85-105.
5Oates T,Jensen D.The effects of training set size on decision tree complexity[C].Nashville,Tennessee:Proc of the 14th International Conference on Machine Learning,1997.
6Brodley C E,Friedl M A.Identifying and eliminating mislabeled training instances[C].USA:Proceedings of the Thirteenth National Conference on Artificial Intelligence,1996.
7Elouedi Z,Mellouli K,Smets Ph.Decision trees using the belief function theory[C].Madrid,Spain:Proceedings of the Eighth International Conference IPMU,2000.
8Yildiz O T,Alpaydin E.Omnivariate decision trees[J].IEEE Transactions on Neural Networks,2001,12(6):1539-1546.
9Swere E,Mulvaney D J.Robot navigation using decision trees[R].Loughborougk,UK:Electronic Systems and Control Division Research,2003.
10Brezillon P,Pasquier L,Pomerol J.Context and decision graphs in incident management on a subway line[C].Trento,Italy:Proceedings of the 2nd International and Interdisciplinary Conference on Modeling and Using Context,1999.

共引文献61

1邢晓颖,张家慧,陈永晔,赵强,房景超,郎宁,袁慧书.寰枢椎转移瘤和脊索瘤的影像学诊断及鉴别诊断[J].临床放射学杂志,2021,40(3):564-569. 被引量：1
2陈健.决策树挖掘技术在医学上的应用[J].福建商业高等专科学校学报,2009(2):73-75. 被引量：3
3江汶乡,于海英,赵晓芬,许思铭.用于地震预警系统的单台站防误触发算法研究[J].自然灾害学报,2015,24(2):23-31. 被引量：8
4吴桐水,贺亮.基于决策树的航空公司客户流失分析[J].商场现代化,2006(12Z):381-383. 被引量：4
5闫建辉,王熙照,隋春荣,王硕,苑俊英.基于最大熵选取示例的增量决策树归纳[J].计算机工程与应用,2006,42(35):160-162. 被引量：1
6饶秀琪,张国基.基于KPCA的决策树方法及其应用[J].计算机工程与设计,2007,28(7):1612-1613. 被引量：4
7王大鹏,王周龙,崔青春,李德一.基于决策树的龙口市土地利用/覆盖分类研究[J].水土保持研究,2007,14(4):250-252. 被引量：4
8鲁为,王枞.决策树算法的优化与比较[J].计算机工程,2007,33(16):189-190. 被引量：19
9迟庆云.一种动态的决策树算法研究[J].邵阳学院学报（自然科学版）,2007,4(3):39-41. 被引量：3
10马雪梅,雷秀丽,李希峰,张保华.基于数据挖掘技术的流域不透水面及变化信息提取[J].测绘通报,2007(12):34-37. 被引量：15

同被引文献74

1罗椿意,李维,刘双全.内质网应激与感染性疾病研究进展[J].中南医学科学杂志,2020,0(2):218-220. 被引量：2
2刘丹红,徐勇勇.住院患者病情危重度的分类决策树研究[J].数理统计与管理,2005,24(1):121-127. 被引量：7
3陈卫中,倪宗瓒,潘晓平,刘元元,夏彦.用ROC曲线确定最佳临界点和可疑值范围[J].现代预防医学,2005,32(7):729-731. 被引量：208
4骆盈盈,王柯玲,陈川,毛云芳.结合递增式学习的CART算法改进[J].计算机工程与设计,2007,28(7):1520-1522. 被引量：10
5樊运新,张彦林,颜罡.电力机车网侧电流保护系统的设计[J].电力机车与城轨车辆,2008,31(2):15-17. 被引量：7
6徐鹏,林森.基于C4.5决策树的流量分类方法[J].软件学报,2009,20(10):2692-2704. 被引量：170
7牛晓博,赵虎,张玉册.基于决策树的海战场舰艇意图识别[J].兵工自动化,2010,29(6):44-46. 被引量：10
8刘刚,罗爱民,黄蒲剑.基于最小生成树的防空作战威胁估计[J].指挥信息系统与技术,2011,2(2):23-27. 被引量：5
9王立欣,贾希胜,李文生,史宪铭.炮兵战场目标选择仿真研究[J].计算机仿真,2012,29(12):17-20. 被引量：3
10杨大伟,杨士锋,于飞.一种空袭重点目标选择的方法[J].舰船电子工程,2013,33(2):29-32. 被引量：4

引证文献13

1尹儒,门昌骞,王文剑.一种模型决策森林算法[J].计算机科学与探索,2020,14(1):108-116. 被引量：15
2李亚钊,李文强,陈娜,肖海峰.基于改进决策树的战场目标辅助研判技术[J].指挥信息系统与技术,2020,11(1):62-67. 被引量：2
3付荣华.基于决策树关联算法在农村大学生信息系统中的应用[J].湖北农业科学,2020,59(10):150-153.
4彭田英,黄华勇,邹文洁,于紫英,彭正良.脓毒症患者预后的分类决策树分析[J].中南医学科学杂志,2020,48(5):544-547. 被引量：5
5江泽涛,马伟康.基于多步的多分类器在入侵检测中的研究[J].计算机应用与软件,2021,38(3):303-308. 被引量：5
6高虹雷,门昌骞,王文剑.一种特征值区间划分的模型决策树加速算法[J].小型微型计算机系统,2021,42(6):1136-1143. 被引量：4
7李学明,刘侃,徐绍龙,黄庆.列车牵引系统网侧过流故障实时诊断与保护策略研究[J].机车电传动,2021(6):81-86. 被引量：3
8谢鑫,张贤勇,杨霁琳.融合信息增益与基尼指数的决策树算法[J].计算机工程与应用,2022,58(10):139-144. 被引量：10
9高虹雷,门昌骞,王文剑.多核贝叶斯优化的模型决策树算法[J].国防科技大学学报,2022,44(3):67-76. 被引量：9
10陈明心,王炜,张岱,任伟宏.基于连续监测法快速检测HBsAg[J].临床检验杂志,2022,40(5):321-325.

二级引证文献57

1魏国平,布晓霞,曲江磊.脓毒症患者中医证型分布及其与免疫功能及预后的关系[J].四川中医,2022,40(4):41-44. 被引量：5
2刘子桦,马若炎.基于Python关于世界自杀率影响因素的分析以及机器学习预测[J].电子技术与软件工程,2019(17):150-151.
3赵妍,霍红,徐晗桐.二阶段随机森林分类方法在低频振荡监测中的应用[J].东北电力大学学报,2020,40(2):60-67. 被引量：10
4付荣华.基于决策树关联算法在农村大学生信息系统中的应用[J].湖北农业科学,2020,59(10):150-153.
5武炜杰,张景祥.融合分类信息的随机森林特征选择算法及应用[J].计算机工程与应用,2021,57(17):147-156. 被引量：14
6庄卫金,方国权,张廷忠,陈中.基于特征抽取的电力工控系统入侵检测方法[J].浙江电力,2021,40(9):85-91. 被引量：2
7邵文昭,张书强,王晓辉,张文新.基于决策树模型的高职学生录取类别与课程学习情况分析[J].邯郸职业技术学院学报,2021,34(3):79-82.
8张治,马辉,王林.采用AFCM-SMOTE-RF的光伏电站故障诊断方法[J].电源技术,2021,45(11):1495-1499. 被引量：1
9谢鑫,张贤勇,王旋晔,唐鹏飞.变精度邻域等价粒的邻域决策树构造算法[J].计算机应用,2022,42(2):382-388. 被引量：4
10阚学达,桂琼,张攀峰.基于决策边界的倾斜森林分类算法[J].计算机工程与设计,2022,43(2):391-398. 被引量：1

1徐伟,姜罗罗,汪秉宏.基于功率谱熵特征提取的脑电波大脑年龄预测[J].科技导报,2018,36(8):40-47. 被引量：1
2赖逸飞.通过计算基尼系数分析我国由收入差距拉大而产生的“拉美化”问题[J].商业文化,2018,0(8):28-30. 被引量：2
3邓军,雷昌奎,曹凯,马砺,王伟峰.煤自燃预测的支持向量回归方法[J].西安科技大学学报,2018,38(2):175-180. 被引量：21
4秦怀强,赵茂先.基于属性值加权的隐朴素贝叶斯算法[J].山东科技大学学报（自然科学版）,2018,37(3):73-78. 被引量：1
5牛哲文,余泽远,李波,唐文虎.基于深度门控循环单元神经网络的短期风功率预测模型[J].电力自动化设备,2018,38(5):36-42. 被引量：92
6黄世反,沈勇,王瑞芳,马华丽,陈长赓,张宇昊.决策树C4.5算法属性取值优化研究[J].计算机科学与应用,2015,5(5):171-178. 被引量：2
7杜剑,胡炳樑,张周锋.基于卷积神经网络与显微高光谱的胃癌组织分类方法研究[J].光学学报,2018,38(6):259-265. 被引量：14
8马爱琴,范晓倩.大数据背景下网络借贷信用风险评估[J].宜宾学院学报,2018,18(6):78-84. 被引量：3
9徐麟,朱志国,李会录,李敏.3G环境下基于客户价值分类的电信客户流失预测研究[J].数据挖掘,2016,6(1):28-36.
10杨成慧,万国峰.基于无线传感器网络(WSN)的目标跟踪和报警监控系统的研究[J].软件工程与应用,2013,2(1):35-41.

模式识别与人工智能

2018年第7期

浏览历史

内容加载中请稍等...

模型决策树：一种决策树加速算法被引量：13

参考文献1

二级参考文献30

共引文献61

同被引文献74

引证文献13

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

模型决策树：一种决策树加速算法 被引量：13

参考文献1

二级参考文献30

共引文献61

同被引文献74

引证文献13

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

模型决策树：一种决策树加速算法被引量：13