一种基于模糊增益比例的决策树属性选择方法被引量：1

One choosing method of decision tree based on fuzzy gain ratio

下载PDF

导出

摘要节点属性的选择是决策树生成过程中的关键环节,以ID3和C4.5为代表的经典决策树算法中,树节点的选择是通过子集样本数计算信息增益或增益比例得到的。但是,对于连续性属性,由于离散化分割导致了子集边界元素在隶属关系上的模糊,使样本计算的方式存在了一定的不合理性,为解决这一问题,采用了模糊集理论并以模糊度的方式取代样本个数参与增益比例的计算,给出了一种获得决策树分类中不确定性尺度的可行途径。 The choosing of node attribute is the pivotal tache during the building process of decision tree.ID3 and C4.5 are the representations of classical decision tree arithmetic,in which tree node is chosen by computing the information gain or gain ratio on the basis of the number of subset.However,due to continuity attribute,dispersed partition result in the faintness of subjection of subset boundary element,which makes the method of sample computing illogical.Adopting fuzzy set theory and using the way of fuzzy gain ratio instead of the way of the number of sample participating in plus property computing,this paper presents one feasible method of uncertainty scale in gaining decision tree classification.

作者严志嘉金连甫

机构地区浙江大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2008年第25期146-148,154,共4页 Computer Engineering and Applications

关键词决策树模糊集模糊增益比例聚类 decision tree fuzzy set fuzzy gain ratio clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1Chmielew Ski M R,Crzymala-Busse J W.Global discretization of attributes as preprocessing for machine learning[C]//Soft Computing:Rough Sets,Fuzzy Logic Neural Networks,Uncertainty,Management, Knowledge Discovery, Simulation Councils, CA : San Diego, 1995.
2刘奕群,张敏,马少平.基于改进决策树算法的网络关键资源页面判定[J].软件学报,2005,16(11):1958-1966. 被引量：11
3Han Jiawei.Data mining:concepts and techniques[M].北京:机械工业出版社,2006.
4Quinlan J R.C4.5 Programs for Machine Leazning[M].CA,USA: Morgan Kaufmann, 1993.

二级参考文献16

1洪家荣,丁明峰,李星原,王丽薇.一种新的决策树归纳学习算法[J].计算机学报,1995,18(6):470-474. 被引量：92
2Amento B, Terveen L, Hill W. Does authority mean quality? Predicting expert quality ratings of Web documents. In: Belkin NJ,Ingwersen P, Leong MK, eds. SIGIR 2000: Proc. of the 23rd Annual Int'l ACM SIGIR Conf. on Research and Development in Information Retrieval 2000. New York: ACM Press, 2000. 296-303.
3Davison BD. Topical locality in the Web. In: Belkin NJ, Ingwersen P, Leong MK, eds. SIGIR 2000: Proc. of the 23rd Annual Int'l ACM SIGIR Conf. on Research and Development in Information Retrieval 2000. New York: ACM Press, 2000. 272-279.
4Bharat K, Henzinger M. Improved algorithms for topic distillation in a hyperlinked environment. In: Croft BW, Moffat A, van Rijsbergen CJ, Wilkinson R, Zobel J, eds. SIGIR'98: Proc. of the 21st Annual Int'l ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 1998. 104-111.
5Broder A. A taxonomy of Web search. SIGIR Forum, 2002,36(2):1-8.
6Henzinger MR, Motwani R, Silverstein C. Challenges in Web search engines. In: Gottlob G, Walsh T, eds. IJCAI 2003, Proc. of the 18th Int'l Joint Conf. on Artificial Intelligence. San Francisco: Morgan Kanfmann Publishers, 2003. 1573-1579.
7Kleinberg JM. Authoritative sources in a hyperlinked environment. Journal of the ACM, 1999,46(5):604-632.
8Chakrabarti S, Dom B, Kumar R, Raghavan P, Rajagopalan S, Tomkins A. Experiments in topic distillation. In: Brown E, Smeaton A, eds. Proc. of the ACM SIGIR Workshop on Hypertext Information Retrieval. New York: ACM Press, 1998. 13-21.
9Chakrabarti S, Joshi M, Tawde V, Bombay IIT. Enhanced topic distillation using text, markup, tags and hyperlinks. In: Croft BW,Harper D J, Kraft DH, Zobel J, eds. SIGIR 2001: Proc. of the 24th Annual Int'l ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 2001. 208-216.
10Mitchell TM. Machine Learning. New York: McGraw-Hill, 1997. 55-64.

共引文献10

1刘金红,陆余良.一种基于锚文本和改进C4.5决策树算法的主题爬行方法[J].计算机应用,2006,26(12):3012-3014. 被引量：1
2胡彩霞.利用决策树获取搜索结果页面中的匹配数[J].科技咨询导报,2007(6):171-172.
3叶明全,胡学钢.一种基于灰色关联度的决策树改进算法[J].计算机工程与应用,2007,43(32):171-173. 被引量：13
4孔英会,车辚辚,苑津莎,安静,刘云峰.基于小波分解和数据挖掘中决策树算法的电能质量扰动识别方法[J].电网技术,2007,31(23):78-82. 被引量：22
5傅明,张颖,陈曦,万力.决策树算法的程序演化方法优化[J].计算机工程与应用,2009,45(15):72-74.
6何萍,徐晓华,陈崚.潜在属性空间树分类器[J].软件学报,2009,20(7):1735-1745. 被引量：3
7黄天强,胡斌,李峰,卓月明,蔡国民,颜一鸣.增量式关键资源页面判定树[J].情报学报,2009,28(3):469-474.
8孔英会,蔡维,何伟.基于特征组合的SVM电能质量扰动信号分类[J].华北电力大学学报（自然科学版）,2010,37(4):72-77. 被引量：4
9刘浩力.多层次压缩决策树在计算机取证中的应用[J].中国信息界,2011(1):60-62.
10曹丽英,孙学生,赵月玲,陈桂芬.一种基于决策树算法的耕地地力等级评价[J].东北林业大学学报,2011,39(2):93-96. 被引量：6

同被引文献13

1陈国领,赵鹏祥,强建华.基于DEM的秦岭火地塘森林植被空间变异分析[J].西北林学院学报,2007,22(2):156-159. 被引量：4
2张茂省,孙传尧,校培喜,魏兴丽,黄玉华,李林,王佳运,武文英.延安市宝塔区地质灾害详细调查示范[J].西北地质,2007,40(2):29-55. 被引量：43
3王卫东,陈燕平,钟晟.应用CF和Logistic回归模型编制滑坡危险性区划图[J].中南大学学报（自然科学版）,2009,40(4):1127-1132. 被引量：53
4何原荣,傅文杰.模糊支持向量机在滑坡危险性评价中的应用[J].自然灾害学报,2009,18(5):107-112. 被引量：11
5陈冠,孟兴民,郭鹏,李亚军,曾润强,乔良.白龙江流域基于GIS与信息量模型的滑坡危险性等级区划[J].兰州大学学报（自然科学版）,2011,47(6):1-6. 被引量：34
6陈玉萍,袁志强,周博,汪华斌.遗传算法优化BP网络在滑坡灾害预测中的应用研究[J].水文地质工程地质,2012,39(1):114-119. 被引量：25
7段汝娇,赵伟,黄松岭,陈建业.基于模糊ID3决策树的快速角点检测算法[J].清华大学学报（自然科学版）,2011,51(12):1787-1791. 被引量：6
8辛鹏,吴树仁,石菊松,王涛,LIUZhen.基于降雨响应的黄土丘陵区滑坡危险性预测研究--以宝鸡市麟游县为例[J].地球学报,2012,33(3):349-359. 被引量：21
9许冲,徐锡伟.基于GIS与ANN模型的地震滑坡易发性区划[J].地质科技情报,2012,31(3):116-121. 被引量：33
10李明江,唐颖,周力军.数据挖掘技术及应用[J].中国新通信,2012,14(22):66-67. 被引量：39

引证文献1

1毛伊敏,陈华彬,李忠利,彭喆,毛丁慧.不确定模糊ID3算法及其在滑坡危险性评价中应用研究[J].江西理工大学学报,2017,38(5):92-98. 被引量：1

二级引证文献1

1谢华伟,陈建华,甘先霞,许开行,赵铮.因子组织方式对SVM滑坡危险性评价影响的研究[J].物探化探计算技术,2023,45(3):389-398.

1唐少先.数据挖掘中粗糙集边界的处理方法[J].计算机工程与应用,2010,46(7):131-133.
2荣晔,戴凌震,史有群.基于内积和边界差的骨架结构提取[J].东华大学学报（自然科学版）,2013,39(2):207-213. 被引量：2
3郝树勇,宣蕾,张卓.基于云的网络安全态势预测规则挖掘算法研究[J].计算机与数字工程,2010,38(8):141-144. 被引量：2
4胡博,胡敏,李渊珊.否定选择算法中一种改进的检测器集生成机制[J].计算机应用研究,2011,28(1):137-138. 被引量：3
5杨峰,廖文和,戴宁,张长东,郭保苏,孙玉春.基于向量角分线的离散刀轨环子域分割算法[J].计算机辅助设计与图形学学报,2013,25(1):120-125.
6于长华,熊敏,方维,郑澎,张先红.基于栅格法的多体六面体网格自动生成[J].计算机辅助设计与图形学学报,2016,28(6):943-949. 被引量：1
7CUIShu-biao ZHOUHua-min LIDe-qun.Numerical Simulation of Injection Molding Cooling Process Based on 3D Surface Model[J].Computer Aided Drafting,Design and Manufacturing,2004,14(2):64-70. 被引量：8
8胡俊,王宇晗,蔡建国.自由边界平面连通域的Voronoi图生成方法研究[J].工程设计学报,2004,11(1):6-10. 被引量：5
9Fahri Celik,Yasemin Arikan Ozden,Sakir Bal.Numerical Simulation of the Flow around Two-dimensional Partially Cavitating Hydrofoils[J].Journal of Marine Science and Application,2014,13(3):245-254. 被引量：2
10丁德云,刘维宁,GUPTA S,LOMBAERT G,DEGRANDE G.Prediction of vibrations from underground trains on Beijing metro line 15[J].Journal of Central South University,2010,17(5):1109-1118. 被引量：6

计算机工程与应用

2008年第25期

浏览历史

内容加载中请稍等...

一种基于模糊增益比例的决策树属性选择方法被引量：1

参考文献4

二级参考文献16

共引文献10

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于模糊增益比例的决策树属性选择方法 被引量：1

参考文献4

二级参考文献16

共引文献10

同被引文献13

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于模糊增益比例的决策树属性选择方法被引量：1