期刊文献+
共找到312篇文章
< 1 2 16 >
每页显示 20 50 100
Generating Decision Trees Method Based on Improved ID3 Algorithm
1
作者 杨明 郭树旭 王隽 《China Communications》 SCIE CSCD 2011年第5期151-156,共6页
The ID3 algorithm is a classical learning algorithm of decision tree in data mining.The algorithm trends to choosing the attribute with more values,affect the efficiency of classification and prediction for building a... The ID3 algorithm is a classical learning algorithm of decision tree in data mining.The algorithm trends to choosing the attribute with more values,affect the efficiency of classification and prediction for building a decision tree.This article proposes a new approach based on an improved ID3 algorithm.The new algorithm introduces the importance factor λ when calculating the information entropy.It can strengthen the label of important attributes of a tree and reduce the label of non-important attributes.The algorithm overcomes the flaw of the traditional ID3 algorithm which tends to choose the attributes with more values,and also improves the efficiency and flexibility in the process of generating decision trees. 展开更多
关键词 decision tree id3 algorithm importance factor attribute value
下载PDF
基于改进ID3算法的非结构化大数据分类优化方法
2
作者 唐锴令 郑皓 《吉林大学学报(信息科学版)》 CAS 2024年第5期894-900,共7页
针对非结构化大数据在分类过程中,由于其数据中存在大量的冗余数据,若不能及时清洗大数据中的冗余数据,会降低数据分类精度的问题,提出一种基于改进ID3(Iterative Dichotomiser 3)算法的非结构化大数据分类优化方法。该方法针对非结构... 针对非结构化大数据在分类过程中,由于其数据中存在大量的冗余数据,若不能及时清洗大数据中的冗余数据,会降低数据分类精度的问题,提出一种基于改进ID3(Iterative Dichotomiser 3)算法的非结构化大数据分类优化方法。该方法针对非结构化大数据集合中冗余数据多以及维度繁杂的问题,对数据进行清洗处理,并结合有监督辨识矩阵完成数据降维;根据数据降维结果,采用改进ID3算法建立用于数据分类的决策树分类模型,通过该模型对非结构化大数据进行分类处理,从而实现数据的精准分类。实验结果表明,使用该方法对非结构化大数据分类时,分类效果好,精度高。 展开更多
关键词 改进id3算法 数据清洗 数据降维 非结构化大数据 数据分类方法
下载PDF
基于改进ID3算法的恶意软件检测策略 被引量:1
3
作者 谢维 《计算机时代》 2023年第9期32-36,共5页
当前机器学习算法应用于iOS平台恶意软件检测的研究较少、公开样本数据集获取难、静态检测误报率高。因此提出一种改进的ID3信息增益算法的动态恶意软件检测方法。首先创建数据集,使用改进的ID3信息增益算法选取前40个API调用序列组成... 当前机器学习算法应用于iOS平台恶意软件检测的研究较少、公开样本数据集获取难、静态检测误报率高。因此提出一种改进的ID3信息增益算法的动态恶意软件检测方法。首先创建数据集,使用改进的ID3信息增益算法选取前40个API调用序列组成特征向量并构建决策树,然后构建测评指标对实验进行分析和验证。实验结果表明,本文方法具有较好的检测率,与改进前的算法相比准确率提高了2.5%,可有效地对恶意软件进行动态识别。 展开更多
关键词 iOS平台 恶意软件检测 id3算法 动态检测 创建数据集
下载PDF
基于ID3算法对农民工城市融入影响因素分析 被引量:1
4
作者 陈韬宇 安海燕 陈杰 《软件工程》 2023年第10期45-48,共4页
在农民工逐步成为城市主体流动人口的过程中,其城市融入问题与社会的和谐发展息息相关。针对该问题,运用迭代二叉树3代(Iterative Dichotomiser 3,ID3)算法对影响农民工城市融入的影响因素进行探究,将影响因素分为经济、社交、社会福利... 在农民工逐步成为城市主体流动人口的过程中,其城市融入问题与社会的和谐发展息息相关。针对该问题,运用迭代二叉树3代(Iterative Dichotomiser 3,ID3)算法对影响农民工城市融入的影响因素进行探究,将影响因素分为经济、社交、社会福利和心理4个方面,采取与经典计量经济学不同的ID3算法对调研数据进行分析。结果显示,经济因素对农民工城市融入的影响最高,信息增益的结果达到0.192,社会福利因素的影响次之,心理和社交因素对于城市融入的影响程度比较低。在此研究结果的基础上对农民工城市融入问题提出些许建议。 展开更多
关键词 城市融入 id3算法 农民工
下载PDF
基于样本结构向量相似度的ID3算法改进
5
作者 陈全园 侯帅琳 李雅琪 《景德镇学院学报》 2023年第6期9-15,共7页
通过对ID3算法的深入研究,发现其存在多值偏向、计算复杂和效率不高等问题。为了解决这些问题,文章对ID3算法模型进行了优化,并提出了一种基于向量相似度的改进ID3算法。在计算信息增益时,首先使用二阶麦克劳林公式简化了原始公式,从而... 通过对ID3算法的深入研究,发现其存在多值偏向、计算复杂和效率不高等问题。为了解决这些问题,文章对ID3算法模型进行了优化,并提出了一种基于向量相似度的改进ID3算法。在计算信息增益时,首先使用二阶麦克劳林公式简化了原始公式,从而减少了ID3算法在log函数上的运算时间和复杂程度。然后通过构造样本结构相似矩阵,并引入向量相似度作为权重,极大程度上避免了多值偏向的问题。通过实例验证对比,文章证明了这种优化在不影响后续运算并保证结果可靠的前提下,能够简化计算过程,并使得生成的决策树的各个分支点更加合理。 展开更多
关键词 id3算法 样本结构相似矩阵 向量相似度
下载PDF
基于ID3决策树算法的体育训练体能数据异常识别方法
6
作者 王友高 《信息与电脑》 2023年第17期68-70,共3页
体育训练体能数据具有规模大、结构复杂等特点,导致传统数据异常识别方法的识别效率较低,为此提出基于ID3决策树算法的体育训练体能数据异常识别方法。基于ID3决策树算法挖掘体育训练体能数据,对挖掘数据进行清洗、重构等预处理,计算每... 体育训练体能数据具有规模大、结构复杂等特点,导致传统数据异常识别方法的识别效率较低,为此提出基于ID3决策树算法的体育训练体能数据异常识别方法。基于ID3决策树算法挖掘体育训练体能数据,对挖掘数据进行清洗、重构等预处理,计算每条数据的异常得分值,获取数据异常点,实现体育训练体能数据异常识别。实验结果表明,该方法的识别时间小于对照组,识别效率更高。 展开更多
关键词 id3决策树算法 体育训练 体能数据 异常识别
下载PDF
基于决策树ID3改进算法的煤与瓦斯突出预测 被引量:17
7
作者 李定启 程远平 +3 位作者 王海峰 王亮 周红星 孙建华 《煤炭学报》 EI CAS CSCD 北大核心 2011年第4期619-622,共4页
为提高工作面突出预测指标预测的准确率,根据灰色相关理论和决策树ID3算法,提出了基于决策树ID3改进算法的煤层工作面煤与瓦斯突出预测方法。该方法以工作面的钻屑解吸指标作为主要决策属性,以地质构造、瓦斯浓度变化等现场较为直观的... 为提高工作面突出预测指标预测的准确率,根据灰色相关理论和决策树ID3算法,提出了基于决策树ID3改进算法的煤层工作面煤与瓦斯突出预测方法。该方法以工作面的钻屑解吸指标作为主要决策属性,以地质构造、瓦斯浓度变化等现场较为直观的突出征兆作为辅助决策属性,同时根据矿井实际工作面煤与瓦斯突出数据建立预测样本数据集,把决策属性的相对灰色关联度作为决策树ID3改进算法的最大信息增益计算权重,建立了煤层工作面煤与瓦斯突出决策树预测模型,并采用该预测模型对10组煤与瓦斯突出数据进行了预测,结果表明,该模型预测的准确率显著高于采用单一钻屑指标预测的准确率。 展开更多
关键词 决策树 id3改进算法 煤与瓦斯突出 预测方法
下载PDF
基于属性值的ID3算法改进 被引量:26
8
作者 孙爱东 朱梅阶 涂淑琴 《计算机工程与设计》 CSCD 北大核心 2008年第12期3011-3012,3033,共3页
I:D3算法是数据挖掘中经典的决策树分类算法。针对ID3算法所存在的属性取值偏向问题及只对较小的数据集有效的缺点提出改进。当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3... I:D3算法是数据挖掘中经典的决策树分类算法。针对ID3算法所存在的属性取值偏向问题及只对较小的数据集有效的缺点提出改进。当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3算法易偏向于取值较多的属性这一缺陷,得到了结构更简洁的、较为理想的决策树。采用先剪枝的方法实现改进,设定一个阈值避免决策树的完全生长,在保持分类准确率的同时,大大地提高了算法的速度。实验结果表明,改进后的算法(AVID3)对许多数据集比传统ID3算法更有效。 展开更多
关键词 决策树 id3算法 剪枝 属性值
下载PDF
基于一种新的属性选择标准的ID3改进算法 被引量:11
9
作者 喻金平 黄细妹 李康顺 《计算机应用研究》 CSCD 北大核心 2012年第8期2895-2898,2908,共5页
结合ID3算法的不足,提出一种基于属性重要度简化标准的ID3改进算法:a)简化ID3算法的信息熵从而降低算法的计算时间;b)引入属性重要度概念来弥补ID3算法属性选择标准的不足;c)综合a)和b)来实现新的属性选择标准即属性重要度简化标准。在... 结合ID3算法的不足,提出一种基于属性重要度简化标准的ID3改进算法:a)简化ID3算法的信息熵从而降低算法的计算时间;b)引入属性重要度概念来弥补ID3算法属性选择标准的不足;c)综合a)和b)来实现新的属性选择标准即属性重要度简化标准。在开源的Weka数据挖掘软件环境下进行仿真实验,结果表明该改进算法是可行的,并且在算法的计算时间和准确度方面都优于ID3算法,尤其是在数据样本集规模达到一定数量时,效果更加明显。 展开更多
关键词 简化 id3算法 重要度 数据挖掘软件
下载PDF
决策树ID3算法的分析与改进 被引量:38
10
作者 王小巍 蒋玉明 《计算机工程与设计》 CSCD 北大核心 2011年第9期3069-3072,3076,共5页
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已... 为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本。描述了通过改进的ID3算法生成决策树[4]的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中。通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性。 展开更多
关键词 数据挖掘 决策树 id3算法 聚类 剪枝
下载PDF
决策树中ID3算法的研究 被引量:47
11
作者 王永梅 胡学钢 《安徽大学学报(自然科学版)》 CAS 北大核心 2011年第3期71-75,共5页
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结... ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的. 展开更多
关键词 数据挖掘 决策树 id3算法 权值
下载PDF
基于相关系数的ID3优化算法 被引量:15
12
作者 吴思博 陈志刚 黄瑞 《计算机工程与科学》 CSCD 北大核心 2016年第11期2342-2347,共6页
ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多... ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。 展开更多
关键词 决策树 id3算法 信息熵 斯皮尔曼等级 相关系数
下载PDF
ID3算法的理论基础 被引量:6
13
作者 翟俊海 张素芳 王熙照 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第6期66-69,共4页
基于属性值并的权熵思想,通过构建模型,给出了一个属性的某几个属性值并的权熵之和不小于该属性单个属性值的权熵之和的结论,从理论上证明了ID3算法的合理性,为ID3算法提供了理论基础.
关键词 决策树 id3算法 信息熵 划分
下载PDF
基于粗集论中属性依赖度的ID3改进算法 被引量:7
14
作者 陶荣 张永胜 杜宏保 《河南科技大学学报(自然科学版)》 CAS 北大核心 2010年第1期42-45,共4页
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通... 决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。 展开更多
关键词 粗集 id3算法 属性依赖度 数据挖掘
下载PDF
决策树ID3算法的分析与优化 被引量:16
15
作者 黄宇达 范太华 《计算机工程与设计》 CSCD 北大核心 2012年第8期3089-3093,共5页
对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定... 对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定程度上不仅较好地解决了ID3算法的多值偏向问题而且大大简化了算法的计算过程,明显提高了算法分类准确度和执行效率。 展开更多
关键词 决策树 id3算法 信息熵 粗糙集 客观属性重要度
下载PDF
决策树分类法中ID3算法在航空市场客户价值细分中的应用 被引量:7
16
作者 演克武 张磊 孙强 《商业研究》 CSSCI 北大核心 2008年第3期24-29,共6页
针对当前航空企业的实际需求,运用数据挖掘理论中的ID3分类算法,对在机场候机旅客调研数据进行分析,可以了解到在后期航空公司发展高端客户过程中,营销策略应该关注的重点客户群体,应该是本公司现有的和未来的常旅客这个客户群,而其中... 针对当前航空企业的实际需求,运用数据挖掘理论中的ID3分类算法,对在机场候机旅客调研数据进行分析,可以了解到在后期航空公司发展高端客户过程中,营销策略应该关注的重点客户群体,应该是本公司现有的和未来的常旅客这个客户群,而其中交通方式为小型轿车的常旅客又是营销策略的重中之重。 展开更多
关键词 数据挖掘 决策树 id3算法 市场细分
下载PDF
决策树ID3算法的改进 被引量:33
17
作者 黄爱辉 陈湘涛 《计算机工程与科学》 CSCD 北大核心 2009年第6期109-111,共3页
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更... 本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。 展开更多
关键词 决策树 id3算法 信息增益 等价无穷小
下载PDF
关于ID3算法的最优性证明 被引量:5
18
作者 翟俊海 张素芳 王熙照 《河北大学学报(自然科学版)》 CAS 北大核心 2006年第5期547-550,556,共5页
研究了一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系.通过构建模型,从理论上证明了以信息熵作为度量标准,ID3算法是最优的,生成的树是最小的,产生的规则数是最少的.
关键词 决策树 id3算法 信息熵 划分
下载PDF
一种改进的ID3算法 被引量:10
19
作者 段玉春 朱晓艳 孙玉强 《南阳师范学院学报》 CAS 2006年第9期63-65,共3页
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。
关键词 决策树 id3算法 属性优先值
下载PDF
基于朴素贝叶斯与ID3算法的决策树分类 被引量:19
20
作者 黄宇达 王迤冉 《计算机工程》 CAS CSCD 2012年第14期41-43,47,共4页
在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID... 在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。 展开更多
关键词 朴素贝叶斯算法 id3算法 信息增益 客观属性重要度 条件独立性假设 加权独立信息熵
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部