基于依赖决策熵的决策树分类算法被引量：2

Decision Tree Classification Algorithm Based on Dependency Decision Entropy

下载PDF

导出

摘要针对传统的基于信息熵的决策树算法所存在的问题,本研究从粗糙集理论的角度来考虑信息熵,定义了依赖决策熵的概念,并提出一种基于依赖决策熵的决策树算法DTDDE。在DTDDE算法中,采用依赖决策熵的概念来度量每个条件属性的重要性,并选择重要性最大的属性作为当前的分离属性。通过在多个UCI数据集上的实验表明:与现有的决策树算法相比,本研究所提出的算法能够获得更好的分类性能。 To solve the problems of traditional information entropy-based decision tree algorithms,in this paper we consider the issue of information entropy from the view of rough set theory.We define a new concept called dependency decision entropy,and propose a dependency decision entropy-based algorithm（called DTDDE）for constructing decision tree.In algorithm DTDDE,the concept of dependency decision entropy is used to measure the significance of each condition attribute,and the attribute with the maximum significance is selected as the current splitting attribute.Experimental results on several UCI data sets demonstrate that compared with the current decision tree algorithms,our algorithm can obtain better classification performance.

作者王希玲江峰张友强刘国柱

机构地区青岛科技大学信息科学技术学院

出处《青岛科技大学学报（自然科学版）》 CAS 2016年第6期687-692,共6页 Journal of Qingdao University of Science and Technology:Natural Science Edition

基金国家自然科学基金项目(60802042 61273180) 山东省自然科学基金项目(ZR2011FQ005 ZR2012FL17) 山东省高等学校科技计划项目(J11LG05)

关键词决策树信息熵粗糙集依赖决策熵属性重要性 decision tree information entropy rough sets dependency decision entropy significance of attribute rough sets

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1张薇.一种基于改进SLIQ决策树分类算法的应用研究[J].苏州大学学报（工科版）,2010,30(1):72-77. 被引量：4
2王莎莎,江峰,王文鹏.基于相对决策熵与加权相似性的粗糙集数据补齐方法[J].计算机科学,2014,41(2):245-248. 被引量：5
3徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
4苗夺谦,王珏.基于粗糙集的多变量决策树构造方法[J].软件学报,1997,8(6):425-431. 被引量：120
5江峰,王春平,曾惠芬.基于相对决策熵的决策树算法及其在入侵检测中的应用[J].计算机科学,2012,39(4):223-226. 被引量：14
6金利杰,张建军,李未.基于总线桥协议的异构机群并行虚拟机的构造[J].软件学报,1997,8(6):417-424. 被引量：6
7杨贵军,孟杰,王双喜.基于赤池信息准则的分类回归决策树剪枝算法[J].计算机应用,2014,34(A02):147-150. 被引量：10
8赵卫东,盛昭瀚,何建敏.粗糙集在决策树生成中的应用[J].东南大学学报（自然科学版）,2000,30(4):132-137. 被引量：28

二级参考文献53

1李萍,吴祈宗.基于概率相似度的不完备信息系统数据补齐算法[J].计算机应用研究,2009,26(3):881-883. 被引量：10
2叶东毅,陈昭炯.一个新的二进制可辨识矩阵及其核的计算[J].小型微型计算机系统,2004,25(6):965-967. 被引量：49
3魏红宁.决策树剪枝方法的比较[J].西南交通大学学报,2005,40(1):44-48. 被引量：43
4万源.一个基于SLIQ算法的模型及应用[J].信息技术,2005,29(12):60-62. 被引量：5
5徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
6潘巍,王阳生,杨宏戟.粗糙集理论中新的针对不完备信息系统的处理方法研究[J].计算机科学,2007,34(6):158-161. 被引量：11
7Rafael S Parpinelli , Heitor S Lopes ,Alex A Freitas. Data mining with a ant colony optimization algorithm [J]. IEEE Trans On Evolution Computing,2002,6(4).
8金利杰，The 19th Australia Computer Science Conference，1996年
9团体著者，基于总线桥多机互联协议的可扩展并行计算机群BBP_PVM技术文档，1996年
10李未，Proceedings of APPT’95，1995年

共引文献394

1马捷,葛岩,蒲泓宇.属性约简方法研究综述[J].数据分析与知识发现,2020,4(1):40-50. 被引量：11
2黄新焕,张岐山,林振思.基于数据挖掘技术的客户价值评价方法[J].中国管理科学,2005,13(z1):591-594.
3梁吉业,李超伟,魏巍.基于Rough Sets的特征选择研究进展[J].山西大学学报（自然科学版）,2012,35(2):211-218. 被引量：2
4王希雷,马永军,苏静.基于Rough集的数据挖掘中知识变化的研究[J].华中科技大学学报（自然科学版）,2012,40(S1):320-323.
5李华雄,周献中.基于0-1分辨矩阵的启发式属性约简[J].中南大学学报（自然科学版）,2009,40(S1):304-308. 被引量：2
6高学东,尹阿东,张健,宫雨,武森.利用上凸函数对决策树算法的改进[J].中国管理科学,2004,12(4):144-148. 被引量：2
7徐远纯,盛昭瀚,柳炳祥.一种基于决策树的客户流失危机分析方法[J].计算机与现代化,2004(8):1-4. 被引量：10
8杨明,孙志挥.改进的差别矩阵及其求核方法[J].复旦学报（自然科学版）,2004,43(5):865-868. 被引量：71
9江效尧,胡林生.基于粗糙集的RDT决策树生成算法的研究及应用[J].安徽工程科技学院学报（自然科学版）,2004,19(3):50-53. 被引量：1
10牛晓太,郭锋,邓其军,王玉华.CBR方法在谈判中的研究与应用[J].计算机工程与应用,2004,40(35):215-217. 被引量：2

同被引文献18

1徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
2陈波,于泠,吉根林.基于条件信息熵的网络攻击特征选择技术[J].小型微型计算机系统,2008,29(3):428-432. 被引量：7
3陈仕涛,陈国龙,郭文忠,刘延华.基于粒子群优化和邻域约简的入侵检测日志数据特征选择[J].计算机研究与发展,2010,47(7):1261-1267. 被引量：44
4杨传健,葛浩,汪志圣.基于粗糙集的属性约简方法研究综述[J].计算机应用研究,2012,29(1):16-20. 被引量：57
5江峰,王春平,曾惠芬.基于相对决策熵的决策树算法及其在入侵检测中的应用[J].计算机科学,2012,39(4):223-226. 被引量：14
6苗夺谦,范世栋.知识的粒度计算及其应用[J].系统工程理论与实践,2002,22(1):48-56. 被引量：174
7魏浩,丁要军.一种基于属性相关的C4.5决策树改进算法[J].中北大学学报（自然科学版）,2014,35(4):402-406. 被引量：13
8吴学辉.基于粗糙集的决策树在产品缺陷检测中的应用[J].太原师范学院学报（自然科学版）,2015,14(3):37-41. 被引量：3
9王伟,李磊,张志鸿.具有容噪特性的C4.5算法改进[J].计算机科学,2015,42(12):268-271. 被引量：10
10王靖,王兴伟,赵悦.基于变精度粗糙集决策树垃圾邮件过滤[J].系统仿真学报,2016,28(3):705-710. 被引量：14

引证文献2

1姚岳松,张贤勇,陈帅,邓切.基于属性纯度的决策树归纳算法[J].计算机工程与设计,2021,42(1):142-149. 被引量：8
2张旻宇.一种改进的决策树算法在入侵检测中的应用[J].现代信息科技,2020,4(23):147-152. 被引量：3

二级引证文献11

1王美芝,赖建英,刘财辉.改进的ID3算法及其在大学公共体育教学中的应用[J].赣南师范大学学报,2021,42(6):68-73.
2谢鑫,张贤勇,杨霁琳.邻域等价关系诱导的改进ID3决策树算法[J].计算机应用研究,2022,39(1):102-105. 被引量：10
3谢鑫,张贤勇,杨霁琳.融合信息增益与基尼指数的决策树算法[J].计算机工程与应用,2022,58(10):139-144. 被引量：11
4赖祎斌,刘财辉,周琪.三支决策模型应用方法研究进展[J].赣南师范大学学报,2023,44(3):1-10.
5魏明军,闫旭文,纪占林,陈钊.基于CNN与LightGBM的入侵检测研究[J].郑州大学学报（理学版）,2023,55(6):35-40. 被引量：1
6严军峰.基于权重项的决策树算法研究[J].无线互联科技,2023,20(23):115-117. 被引量：1
7刘永成,刘杰文,杨茜,宋汶秦,郭永吉,王兴贵.基于改进CART算法的退役动力电池等级筛选方法[J].燕山大学学报,2024,48(1):48-53. 被引量：1
8王建琴.基于改进决策树的数据挖掘与分析算法设计[J].电子设计工程,2024,32(4):84-88. 被引量：2
9魏威,江峰.基于加权复杂度的SMOTE算法及其在软件缺陷预测中的应用[J].计算机与数字工程,2024,52(5):1418-1422.
10程聪聪.元宇宙视域下链游犯罪案件的侦查难点及应对[J].湖南警察学院学报,2024,36(4):85-93.

1江峰,王莎莎,杜军威,眭跃飞.基于近似决策熵的属性约简[J].控制与决策,2015,30(1):65-70. 被引量：27
2胡峰,陈曦,王小燕.基于决策熵的不完备信息系统的知识约简方法[J].计算机工程与设计,2013,34(1):289-292. 被引量：4
3胡峰,张杰,吉朝明,易兴辉.基于决策熵的值约简算法[J].南京大学学报（自然科学版）,2010,46(5):477-486. 被引量：3
4孙海蓉,王蕊,耿军亚.基于信息熵的BP网络在热工系统建模中的应用[J].系统仿真学报,2017,29(1):226-233. 被引量：9
5徐久成,孙林.一种新的基于决策熵的决策表约简方法[J].重庆邮电大学学报（自然科学版）,2009,21(4):479-483. 被引量：9
6孙海蓉,王蕊,耿军亚.基于信息熵和BP神经网络的故障分类方法[J].电力科学与工程,2017,33(3):49-54. 被引量：5
7蒋思宇,卢炎生.两种新的决策表属性约简概念[J].小型微型计算机系统,2006,27(3):512-515. 被引量：16
8阎桂林,徐廷学,袁有宏,张众.再生分辨矩阵与决策熵的不完备决策系统属性约简[J].火力与指挥控制,2016,41(9):173-176. 被引量：3
9王越,万洪.一种新的应用变精度粗糙集的决策树构造方法[J].重庆理工大学学报（自然科学）,2013,27(11):58-64. 被引量：3
10徐章艳,宋威,杨炳儒,高静,侯伟.关于“两种新的决策表属性约简概念”的注记[J].小型微型计算机系统,2007,28(9):1686-1689. 被引量：5

青岛科技大学学报（自然科学版）

2016年第6期

浏览历史

内容加载中请稍等...

基于依赖决策熵的决策树分类算法被引量：2

参考文献8

二级参考文献53

共引文献394

同被引文献18

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于依赖决策熵的决策树分类算法 被引量：2

参考文献8

二级参考文献53

共引文献394

同被引文献18

引证文献2

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于依赖决策熵的决策树分类算法被引量：2