一种基于决策树ID3的改进算法被引量：7

An improved ID3 algorithm for decision tree

下载PDF

导出

摘要针对传统ID3算法无法处理属性值连续的数据集,设计了一种新的改进算法用于连续评价数据的处理。改进算法先用聚类算法对连续属性值进行离散化,再计算属性的粗糙度作为属性分裂的标准,最后用改进的ID3算法生成决策树。通过仿真验证了该方法的预测正确率,并探讨其应用条件。实验结果表明,在不降低正确率的情况下,该算法可处理属性值连续的数据且具有更好的可读性及更低的运算量。 The traditional ID3 algorithm can′t process the dataset with continuous attribute value.Therefore,an improved ID3 algorithm is designed to process the continuous evaluation data.The clustering algorithm is used in the improved algorithm to discrete the continuous attribute values,and then the roughness of the attribute is calculated as the divisive standard of the attribute.The improved ID3 algorithm is adopted to generate the decision tree.The prediction accuracy of the method is verified with simulation,and its application condition is discussed.The experimental result shows that the improved algorithm can process the data with continuous attribute value,and has high readability and less computational amount while maintaining the accuracy.

作者王子京刘毓 WANG Zijing;LIU Yu(School of Communications and Information Engineering,Xi’an University of Posts&Telecommunications,Xi’an 710121,China)

机构地区西安邮电大学通信与信息工程学院

出处《现代电子技术》北大核心 2018年第15期39-42,共4页 Modern Electronics Technique

基金陕西省工业攻关(2016GY-113)~~

关键词数据挖掘决策树粗糙集 ID3算法大数据算法改进 data mining decision tree rough set ID3 algorithm big data algorithm improvement

分类号 TN911.1-34 [电子电信—通信与信息系统] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1李泓波,白劲波,杨高明,黄少伟.决策树技术研究综述[J].电脑知识与技术,2015,11(8X):1-4. 被引量：9
2翟俊海,翟梦尧,李胜杰.基于相容粗糙集技术的连续值属性决策树归纳[J].计算机科学,2012,39(11):183-186. 被引量：8
3朱付保,霍晓齐,徐显景.基于粗糙集的ID3决策树算法改进[J].郑州轻工业学院学报（自然科学版）,2015,30(1):50-54. 被引量：9
4翟俊海,王华超,张素芳.一种基于模糊熵的模糊分类算法[J].计算机工程与应用,2010,46(20):176-180. 被引量：4
5巩固,吕俊怀,黄永青,郝国生.有效改进C5.0算法的方法[J].计算机工程与设计,2009,30(22):5197-5199. 被引量：6
6张亮,宁芊.CART决策树的两种改进及应用[J].计算机工程与设计,2015,36(5):1209-1213. 被引量：55
7王小巍,蒋玉明.决策树ID3算法的分析与改进[J].计算机工程与设计,2011,32(9):3069-3072. 被引量：37
8翟俊海,侯少星,王熙照.粗糙模糊决策树归纳算法[J].南京大学学报（自然科学版）,2016,52(2):306-312. 被引量：9
9周润物,李智勇,陈少淼,陈京,李仁发.面向大数据处理的并行优化抽样聚类K-means算法[J].计算机应用,2016,36(2):311-315. 被引量：45
10李晓瑜,俞丽颖,雷航,唐雪飞.一种K-means改进算法的并行化实现与应用[J].电子科技大学学报,2017,46(1):61-68. 被引量：49

二级参考文献133

1刘鹏,姚正,尹俊杰.一种有效的C4.5改进模型[J].清华大学学报（自然科学版）,2006,46(z1):996-1001. 被引量：28
2江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
3魏红宁.决策树剪枝方法的比较[J].西南交通大学学报,2005,40(1):44-48. 被引量：42
4John Durkin,蔡竞峰,蔡自兴.决策树技术及其当前研究方向[J].控制工程,2005,12(1):15-18. 被引量：62
5韩松来,张辉,周华平.基于关联度函数的决策树分类算法[J].计算机应用,2005,25(11):2655-2657. 被引量：36
6王艳兵,赵锐,姚青.基于可变精度的ID3改进算法[J].计算机工程与设计,2006,27(14):2683-2685. 被引量：9
7段玉春,朱晓艳,孙玉强.一种改进的ID3算法[J].南阳师范学院学报,2006,5(9):63-65. 被引量：10
8Matthew S Sullivan,Martin J Jones,David C Lee,et al.A comparison of predictive methods in extinction risk studies: Contrasts and decision trees [J]. Biodiversity and Conservation, 2006,15(6): 1977-1991.
9Mitchell TM.Machine leaming[M].Beijing:China Machine Press,2003:52-180.
10Tay E H,Shen L.A modified Chi2 algorithm for discretization of real value attributes [J]. IEEE Transactions on Knowledge and Data Engineering,2002,14(3):666-670.

共引文献209

1张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：18
2骆梅柳.基于大数据的校园舆情热点话题跟踪研究[J].智能计算机与应用,2020(8):287-289. 被引量：1
3史楠,韩丽娜,李振兴.基于CART决策树算法的犯罪类型决策研究[J].智能计算机与应用,2020,10(7):155-157. 被引量：3
4王胜.决策树ID3算法分析及改进[J].宜春学院学报,2012,34(4):7-9.
5李跃,李纶.鲜切花的保鲜包装技术研究初探[J].中国包装,2000,20(3):47-50. 被引量：8
6刘耀南.C4.5算法的分析及应用[J].东莞理工学院学报,2012,19(5):47-52. 被引量：15
7张伟丰.基于ID3算法的卷烟产品零售客户分类研究[J].湖北汽车工业学院学报,2012,26(3):52-54. 被引量：3
8高玉蓉,许红卫,丁晓东.基于C5.0的钱塘江流域地区土地利用/覆被信息提取研究[J].生态科学,2012,31(5):481-487. 被引量：3
9柴宏涛,李建华,沈迪.基于ID3算法的信息资源分类管理映射模型研究[J].计算机工程与设计,2013,34(3):1082-1086. 被引量：5
10张晓婷,李茵,唐晶磊.基于优化聚类算法的大数据分流系统设计仿真[J].计算机仿真,2018,35(12):204-207. 被引量：6

同被引文献46

1陈博欧,张锦华.社交能力与农民工工资性收入[J].财经研究,2021,47(11):124-138. 被引量：17
2石雁冰,邵勇,李树法.基于ID3算法的代谢综合征主要因素分析[J].中国老年学杂志,2014,34(1):180-182. 被引量：2
3李文杰.美国海军陆战队寻求可长时间巡逻的无人机[J].飞航导弹,2006(2):6-6. 被引量：1
4刘博,仲思东.一种基于自适应阈值的SUSAN角点提取方法[J].红外技术,2006,28(6):331-333. 被引量：33
5张伟,蒋宏,任章.自适应多阈值图像分割算法[J].自动化技术与应用,2007,26(8):71-73. 被引量：17
6毛雁明,兰美辉,王运琼,冯乔生.一种改进的基于Harris的角点检测方法[J].计算机技术与发展,2009,19(5):130-133. 被引量：42
7孙文昌,宋建社,杨檬,张琳.基于熵和独特性的角点提取算法[J].计算机应用,2009,29(B12):225-227. 被引量：5
8燕鹏,安如.基于FAST改进的快速角点探测算法[J].红外与激光工程,2009,38(6):1104-1108. 被引量：20
9叶鹏,王琰.一种改进的Harris多尺度角点检测[J].计算机技术与发展,2010,20(4):58-60. 被引量：14
10曹攀峰,崔升.基于随机策略的无人机巡逻路径规划[J].复旦学报（自然科学版）,2011,50(6):787-791. 被引量：4

引证文献7

1张华,许骏,付浩海.缺失值情况下基于决策树算法的长白山植被识别的研究[J].长春工程学院学报（自然科学版）,2018,19(4):80-84. 被引量：1
2郑少微,孔华锋.基于MapReduce的ID3决策树算法并行化[J].电脑编程技巧与维护,2019(7):97-99.
3张祥,陈军,余士龙,吴晨阳,许向运.基于ID3算法的飞行时间分析[J].气象水文海洋仪器,2021,38(2):13-15.
4陈登,邢积超,陈楚湘.基于决策树的无人机巡逻安全知识挖掘[J].军事运筹与评估,2023,38(2):37-41.
5陈韬宇,安海燕,陈杰.基于ID3算法对农民工城市融入影响因素分析[J].软件工程,2023,26(10):45-48.
6李明东,辜俊莹.基于决策树对网购消费者支付形式的分析[J].科技经济导刊,2019,0(20):202-203.
7邹倩颖,关杰文,肖航,符鑫珺.改进ORB-SLAM算法在户外离线即时导航的研究[J].实验室研究与探索,2019,38(9):73-78.

二级引证文献1

1张华,许骏,郑国勋.省重点实验室评价机制与基于机器学习的评价模型研究——以吉林省为例[J].长春工程学院学报（自然科学版）,2022,23(1):105-108.

1姜民政,段天玉,张迪,刘金堂,程天才.基于RS-LVQ的同井注采系统故障诊断研究[J].石油机械,2018,46(3):95-99. 被引量：3
2樊伊君,梁朝钢.基于CamShift的视频跟踪算法改进及实现[J].电子设计工程,2018,26(10):105-108. 被引量：4
3白光灿,李娅琦,张泽坤,郭慧清,王梓轩,李月,董玲,裴纹萱,马长华.采用HPLC指纹图谱技术及数据分析方法对不同产地枸杞进行质量评价研究[J].中南药学,2018,16(6):725-730. 被引量：7
4黄喜淦,王科社,吴雅朋,黄彦曌,段密克.改进的小波与Bayes阈值估计图像降噪算法[J].北京信息科技大学学报（自然科学版）,2018,33(3):95-98.
5王斌,冯慧芬,黄平,赵敬,易佳音.人工神经网络模型在预测重症手足口病中的应用研究[J].现代预防医学,2018,45(11):1921-1924. 被引量：9
6刘津霖,付光远,李海龙,汪洪桥.基于改进投票专家算法的专有协议模糊测试方法[J].计算机工程与应用,2018,54(12):93-99. 被引量：2
7申翠香,张晓宇.基于改进粒子群算法的苹果圆形度检测[J].食品与机械,2018,34(5):131-133. 被引量：3
8李俊丽,张继福.基于属性聚类的离群数据挖掘算法[J].中北大学学报（自然科学版）,2018,39(3):310-315. 被引量：3
9刁智华,刁春迎,袁万宾,毋媛媛.基于改进型模糊边缘检测的小麦病斑阈值分割算法[J].农业工程学报,2018,34(10):147-152. 被引量：14
10张永成,余群舟,方伟立.基于区间二型模糊的深基坑施工方案属性相似度计算方法[J].土木工程与管理学报,2018,35(2):135-139.

现代电子技术

2018年第15期

浏览历史

内容加载中请稍等...

一种基于决策树ID3的改进算法被引量：7

参考文献10

二级参考文献133

共引文献209

同被引文献46

引证文献7

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于决策树ID3的改进算法 被引量：7

参考文献10

二级参考文献133

共引文献209

同被引文献46

引证文献7

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于决策树ID3的改进算法被引量：7