期刊文献+
共找到310篇文章
< 1 2 16 >
每页显示 20 50 100
Generating Decision Trees Method Based on Improved ID3 Algorithm
1
作者 杨明 郭树旭 王隽 《China Communications》 SCIE CSCD 2011年第5期151-156,共6页
The ID3 algorithm is a classical learning algorithm of decision tree in data mining.The algorithm trends to choosing the attribute with more values,affect the efficiency of classification and prediction for building a... The ID3 algorithm is a classical learning algorithm of decision tree in data mining.The algorithm trends to choosing the attribute with more values,affect the efficiency of classification and prediction for building a decision tree.This article proposes a new approach based on an improved ID3 algorithm.The new algorithm introduces the importance factor λ when calculating the information entropy.It can strengthen the label of important attributes of a tree and reduce the label of non-important attributes.The algorithm overcomes the flaw of the traditional ID3 algorithm which tends to choose the attributes with more values,and also improves the efficiency and flexibility in the process of generating decision trees. 展开更多
关键词 decision tree id3 algorithm importance factor attribute value
下载PDF
基于改进ID3算法的非结构化大数据分类优化方法
2
作者 唐锴令 郑皓 《吉林大学学报(信息科学版)》 CAS 2024年第5期894-900,共7页
针对非结构化大数据在分类过程中,由于其数据中存在大量的冗余数据,若不能及时清洗大数据中的冗余数据,会降低数据分类精度的问题,提出一种基于改进ID3(Iterative Dichotomiser 3)算法的非结构化大数据分类优化方法。该方法针对非结构... 针对非结构化大数据在分类过程中,由于其数据中存在大量的冗余数据,若不能及时清洗大数据中的冗余数据,会降低数据分类精度的问题,提出一种基于改进ID3(Iterative Dichotomiser 3)算法的非结构化大数据分类优化方法。该方法针对非结构化大数据集合中冗余数据多以及维度繁杂的问题,对数据进行清洗处理,并结合有监督辨识矩阵完成数据降维;根据数据降维结果,采用改进ID3算法建立用于数据分类的决策树分类模型,通过该模型对非结构化大数据进行分类处理,从而实现数据的精准分类。实验结果表明,使用该方法对非结构化大数据分类时,分类效果好,精度高。 展开更多
关键词 改进id3算法 数据清洗 数据降维 非结构化大数据 数据分类方法
下载PDF
基于朴素贝叶斯与ID3算法的决策树分类 被引量:19
3
作者 黄宇达 王迤冉 《计算机工程》 CAS CSCD 2012年第14期41-43,47,共4页
在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID... 在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。 展开更多
关键词 朴素贝叶斯算法 id3算法 信息增益 客观属性重要度 条件独立性假设 加权独立信息熵
下载PDF
基于属性值的ID3算法改进 被引量:26
4
作者 孙爱东 朱梅阶 涂淑琴 《计算机工程与设计》 CSCD 北大核心 2008年第12期3011-3012,3033,共3页
I:D3算法是数据挖掘中经典的决策树分类算法。针对ID3算法所存在的属性取值偏向问题及只对较小的数据集有效的缺点提出改进。当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3... I:D3算法是数据挖掘中经典的决策树分类算法。针对ID3算法所存在的属性取值偏向问题及只对较小的数据集有效的缺点提出改进。当训练样本各属性的取值个数相差较大的情况下,在计算划分标准时引入了属性取值个数N,在一定程度上克服了ID3算法易偏向于取值较多的属性这一缺陷,得到了结构更简洁的、较为理想的决策树。采用先剪枝的方法实现改进,设定一个阈值避免决策树的完全生长,在保持分类准确率的同时,大大地提高了算法的速度。实验结果表明,改进后的算法(AVID3)对许多数据集比传统ID3算法更有效。 展开更多
关键词 决策树 id3算法 剪枝 属性值
下载PDF
基于决策树ID3改进算法的煤与瓦斯突出预测 被引量:17
5
作者 李定启 程远平 +3 位作者 王海峰 王亮 周红星 孙建华 《煤炭学报》 EI CAS CSCD 北大核心 2011年第4期619-622,共4页
为提高工作面突出预测指标预测的准确率,根据灰色相关理论和决策树ID3算法,提出了基于决策树ID3改进算法的煤层工作面煤与瓦斯突出预测方法。该方法以工作面的钻屑解吸指标作为主要决策属性,以地质构造、瓦斯浓度变化等现场较为直观的... 为提高工作面突出预测指标预测的准确率,根据灰色相关理论和决策树ID3算法,提出了基于决策树ID3改进算法的煤层工作面煤与瓦斯突出预测方法。该方法以工作面的钻屑解吸指标作为主要决策属性,以地质构造、瓦斯浓度变化等现场较为直观的突出征兆作为辅助决策属性,同时根据矿井实际工作面煤与瓦斯突出数据建立预测样本数据集,把决策属性的相对灰色关联度作为决策树ID3改进算法的最大信息增益计算权重,建立了煤层工作面煤与瓦斯突出决策树预测模型,并采用该预测模型对10组煤与瓦斯突出数据进行了预测,结果表明,该模型预测的准确率显著高于采用单一钻屑指标预测的准确率。 展开更多
关键词 决策树 id3改进算法 煤与瓦斯突出 预测方法
下载PDF
基于一种新的属性选择标准的ID3改进算法 被引量:11
6
作者 喻金平 黄细妹 李康顺 《计算机应用研究》 CSCD 北大核心 2012年第8期2895-2898,2908,共5页
结合ID3算法的不足,提出一种基于属性重要度简化标准的ID3改进算法:a)简化ID3算法的信息熵从而降低算法的计算时间;b)引入属性重要度概念来弥补ID3算法属性选择标准的不足;c)综合a)和b)来实现新的属性选择标准即属性重要度简化标准。在... 结合ID3算法的不足,提出一种基于属性重要度简化标准的ID3改进算法:a)简化ID3算法的信息熵从而降低算法的计算时间;b)引入属性重要度概念来弥补ID3算法属性选择标准的不足;c)综合a)和b)来实现新的属性选择标准即属性重要度简化标准。在开源的Weka数据挖掘软件环境下进行仿真实验,结果表明该改进算法是可行的,并且在算法的计算时间和准确度方面都优于ID3算法,尤其是在数据样本集规模达到一定数量时,效果更加明显。 展开更多
关键词 简化 id3算法 重要度 数据挖掘软件
下载PDF
决策树ID3算法的分析与改进 被引量:38
7
作者 王小巍 蒋玉明 《计算机工程与设计》 CSCD 北大核心 2011年第9期3069-3072,3076,共5页
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已... 为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法。它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本。描述了通过改进的ID3算法生成决策树[4]的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中。通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性。 展开更多
关键词 数据挖掘 决策树 id3算法 聚类 剪枝
下载PDF
决策树中ID3算法的研究 被引量:47
8
作者 王永梅 胡学钢 《安徽大学学报(自然科学版)》 CAS 北大核心 2011年第3期71-75,共5页
ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结... ID3算法是决策树分类方法的核心算法,文章论述了ID3算法的基本思想和实现方法,并对ID3算法的性能进行分析,发现该算法存在不足之处.针对ID3算法倾向于多属性值的缺点,引入了权值对算法进行改进,并通过试验对改进前后的算法进行比较,结果表明改进后的算法是有效的. 展开更多
关键词 数据挖掘 决策树 id3算法 权值
下载PDF
ID3算法的理论基础 被引量:6
9
作者 翟俊海 张素芳 王熙照 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第6期66-69,共4页
基于属性值并的权熵思想,通过构建模型,给出了一个属性的某几个属性值并的权熵之和不小于该属性单个属性值的权熵之和的结论,从理论上证明了ID3算法的合理性,为ID3算法提供了理论基础.
关键词 决策树 id3算法 信息熵 划分
下载PDF
基于粗集论中属性依赖度的ID3改进算法 被引量:7
10
作者 陶荣 张永胜 杜宏保 《河南科技大学学报(自然科学版)》 CAS 北大核心 2010年第1期42-45,共4页
决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通... 决策树算法是一种重要的数据挖掘方法,ID3算法是最具影响的一种决策树生成算法。介绍了粗集理论的相关概念和传统的ID3算法基本原理,提出了一种以粗集论中的属性依赖度为基础的ID3改进算法,克服了传统ID3算法对取值较多属性的依赖,并通过实例验证该算法的高效性和精确性。改进算法对不同领域中分类预测方向上的数据挖掘均具有一定的参考价值。 展开更多
关键词 粗集 id3算法 属性依赖度 数据挖掘
下载PDF
一种改进的ID3算法 被引量:10
11
作者 段玉春 朱晓艳 孙玉强 《南阳师范学院学报》 CAS 2006年第9期63-65,共3页
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。
关键词 决策树 id3算法 属性优先值
下载PDF
决策树ID3算法的改进 被引量:33
12
作者 黄爱辉 陈湘涛 《计算机工程与科学》 CSCD 北大核心 2009年第6期109-111,共3页
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更... 本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。 展开更多
关键词 决策树 id3算法 信息增益 等价无穷小
下载PDF
基于相关系数的ID3优化算法 被引量:15
13
作者 吴思博 陈志刚 黄瑞 《计算机工程与科学》 CSCD 北大核心 2016年第11期2342-2347,共6页
ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多... ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。 展开更多
关键词 决策树 id3算法 信息熵 斯皮尔曼等级 相关系数
下载PDF
关于ID3算法的最优性证明 被引量:5
14
作者 翟俊海 张素芳 王熙照 《河北大学学报(自然科学版)》 CAS 北大核心 2006年第5期547-550,556,共5页
研究了一个属性的某几个属性值并的权熵之和与该属性单个属性值的权熵之和的关系.通过构建模型,从理论上证明了以信息熵作为度量标准,ID3算法是最优的,生成的树是最小的,产生的规则数是最少的.
关键词 决策树 id3算法 信息熵 划分
下载PDF
决策树分类法中ID3算法在航空市场客户价值细分中的应用 被引量:7
15
作者 演克武 张磊 孙强 《商业研究》 CSSCI 北大核心 2008年第3期24-29,共6页
针对当前航空企业的实际需求,运用数据挖掘理论中的ID3分类算法,对在机场候机旅客调研数据进行分析,可以了解到在后期航空公司发展高端客户过程中,营销策略应该关注的重点客户群体,应该是本公司现有的和未来的常旅客这个客户群,而其中... 针对当前航空企业的实际需求,运用数据挖掘理论中的ID3分类算法,对在机场候机旅客调研数据进行分析,可以了解到在后期航空公司发展高端客户过程中,营销策略应该关注的重点客户群体,应该是本公司现有的和未来的常旅客这个客户群,而其中交通方式为小型轿车的常旅客又是营销策略的重中之重。 展开更多
关键词 数据挖掘 决策树 id3算法 市场细分
下载PDF
决策树ID3算法的分析与优化 被引量:16
16
作者 黄宇达 范太华 《计算机工程与设计》 CSCD 北大核心 2012年第8期3089-3093,共5页
对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定... 对ID3算法的基本原理及其主要不足以及现有几种改进算法的优缺点进行了简要分析,针对ID3算法的主要不足即倾向于多值属性的选取,利用粗糙集理论和数学相关知识点对其进行了一定程度的改进。理论分析和实验结果表明,改进后的算法在一定程度上不仅较好地解决了ID3算法的多值偏向问题而且大大简化了算法的计算过程,明显提高了算法分类准确度和执行效率。 展开更多
关键词 决策树 id3算法 信息熵 粗糙集 客观属性重要度
下载PDF
决策树中ID3算法与C4.5算法分析与比较 被引量:20
17
作者 李会 胡笑梅 《水电能源科学》 2008年第2期129-132,163,共5页
论述了决策树表示方法及ID3、C4.5决策树学习算法,特别对决策属性的选取法则进行了说明。通过实例解析ID3、C4.5算法实现,结果表明C4.5算法在决策树分类效率和直观性都得到了提高。
关键词 数据挖掘 决策树 id3算法 C4.5算法
下载PDF
基于决策树ID3算法的人才留汉吸引政策研究 被引量:7
18
作者 陈茜 马向平 +1 位作者 贾承丰 张节 《武汉理工大学学报(信息与管理工程版)》 CAS 2019年第2期148-153,共6页
近年来人才已经成为各地竞争的资源,各地政府关于吸引人才的政策层出不穷,涵盖社会的方方面面。由于主客观因素对人才吸引的影响力度不同,导致这些因素相互之间对人才能否留下的决策有着错综复杂的关系。为了揭示这种非线性关系,预测人... 近年来人才已经成为各地竞争的资源,各地政府关于吸引人才的政策层出不穷,涵盖社会的方方面面。由于主客观因素对人才吸引的影响力度不同,导致这些因素相互之间对人才能否留下的决策有着错综复杂的关系。为了揭示这种非线性关系,预测人才留下与否的决策关键,在调查分析人才留在某二线城市和留在武汉主客观因素的吸引力数据基础上,使用Python编程语言,运用机器学习中的ID3算法,对样本进行了分析,构造出决策树模型。进而从宏观、微观角度对不同因素吸引力的强弱进行分析,得出了影响人才留汉发展的各种政策变量的重要性程度的分析结果。对比武汉市现有人才留汉政策,分析了现有人才留汉的政策存在的不足,并提出了相应的对策建议。 展开更多
关键词 人才引进 政策研究 决策树 id3算法 影响因素
下载PDF
基于ID3算法的快速分类方法研究 被引量:8
19
作者 包晓安 钟乐海 《现代电子技术》 2004年第7期84-85,共2页
ID3是决策树学习的核心算法 ,本文提出了基于 ID3算法对多类样本分类的一种快速分类的算法 ,提高了计算机的分类速度。
关键词 决策树 归纳学习 id3算法 机器学习
下载PDF
基于ID3算法的天气评定 被引量:3
20
作者 耿蓉 赖晓风 贺春林 《重庆文理学院学报(自然科学版)》 2008年第6期20-22,共3页
阐述决策树算法中的ID3算法,采用自顶向下递归的分治方法构造对天气进行评定的决策树模型,并得到了一定的使用价值.
关键词 决策树 id3算法 信息增益 天气
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部