-
题名基于样本结构向量相似度的ID3算法改进
- 1
-
-
作者
陈全园
侯帅琳
李雅琪
-
机构
景德镇陶瓷大学信息工程学院
-
出处
《景德镇学院学报》
2023年第6期9-15,共7页
-
基金
江西省学位与研究生教育教学改革研究省级资助课题(JXYJG-2018-120)
景德镇陶瓷大学国家级大学生创新创业训练计划项目(202310408014)
景德镇陶瓷大学校级大学生创新创业训练计划项目(X202310408151)。
-
文摘
通过对ID3算法的深入研究,发现其存在多值偏向、计算复杂和效率不高等问题。为了解决这些问题,文章对ID3算法模型进行了优化,并提出了一种基于向量相似度的改进ID3算法。在计算信息增益时,首先使用二阶麦克劳林公式简化了原始公式,从而减少了ID3算法在log函数上的运算时间和复杂程度。然后通过构造样本结构相似矩阵,并引入向量相似度作为权重,极大程度上避免了多值偏向的问题。通过实例验证对比,文章证明了这种优化在不影响后续运算并保证结果可靠的前提下,能够简化计算过程,并使得生成的决策树的各个分支点更加合理。
-
关键词
ID3算法
样本结构相似矩阵
向量相似度
-
Keywords
ID3 algorithm
similarity matrix of sample structure
vector similarity
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-