摘要
ID3决策树算法是重要的归纳学习方法,常用于基于大量实例的学习和预测。ID3算法以信息论中熵的概念为基站,通过选择信息含量高的属性构建决策树。但该算法有倾向于取值较多属性的问题。论文从设定属性选择要求的角度出发,对ID3决策算法进行改进,并通过实例说明了改进算法的可行性。
ID3 decision tree algorithm is an important inductive learning method,which is often used in case-based learning and prediction.ID3 algorithm takes the concept of entropy in information theory as base station,and constructs decision tree by selecting attributes with high information content.However,the algorithm tends to take more attributes.This paper improves ID3 decision-making algorithm from the point of setting attribute selection requirements,and illustrates the feasibility of the improved algorithm through an example.
作者
圣文顺
孙艳文
SHENG Wenshun;SUN Yanwen(Nanjing Technology University Pujiang Institute,Nanjing 211222)
出处
《计算机与数字工程》
2019年第12期2943-2945,3094,共4页
Computer & Digital Engineering
基金
国家重点研发计划重点专项“社会安全大数据共性基础服务技术研究”(编号:2017YFC0803700)
江苏省高校自然科学研究项目“基于自然语言理解的GIS语音查询研究”(编号:19KJD520005)
南京工业大学浦江学院2018年度科研立项课题“基于卷积神经网络的深度学习研究与应用”(编号:NJPJ2018-2-08)资助
关键词
ID3
决策树
信息论
ID3
decision tree
information theory