期刊文献+
共找到157篇文章
< 1 2 8 >
每页显示 20 50 100
Research on the Intelligent Distribution System of College Dormitory Based on the Decision Tree Classification Algorithm 被引量:1
1
作者 Huiping Han Beida Wang 《Journal of Contemporary Educational Research》 2023年第2期7-14,共8页
The trend toward designing an intelligent distribution system based on students’individual differences and individual needs has taken precedence in view of the traditional dormitory distribution system,which neglects... The trend toward designing an intelligent distribution system based on students’individual differences and individual needs has taken precedence in view of the traditional dormitory distribution system,which neglects the students’personality traits,causes dormitory disputes,and affects the students’quality of life and academic quality.This paper collects freshmen's data according to college students’personal preferences,conducts a classification comparison,uses the decision tree classification algorithm based on the information gain principle as the core algorithm of dormitory allocation,determines the description rules of students’personal preferences and decision tree classification preferences,completes the conceptual design of the database of entity relations and data dictionaries,meets students’personality classification requirements for the dormitory,and lays the foundation for the intelligent dormitory allocation system. 展开更多
关键词 Intelligent allocation Personal preference information gain decision tree classification INDIVIDUALIZATION
下载PDF
基于决策树的就业创业资源信息分类系统设计
2
作者 封彦 《信息技术》 2024年第5期114-119,共6页
针对就业创业资源信息分类数据收敛性差、分类准确率低的问题,设计了一种新的就业创业资源信息分类系统。系统硬件利用CAN总线控制器控制接口管理逻辑、时序逻辑和错误管理逻辑等同时工作。整合网络组织模式和P2P网络模式,与客户端建立... 针对就业创业资源信息分类数据收敛性差、分类准确率低的问题,设计了一种新的就业创业资源信息分类系统。系统硬件利用CAN总线控制器控制接口管理逻辑、时序逻辑和错误管理逻辑等同时工作。整合网络组织模式和P2P网络模式,与客户端建立连接,选用ADuC832混合信号单片微控制器采集就业创业资源信息,实现深入挖掘。确定信息节点增益,建立就业创业资源信息分类决策树,实现信息分类。实验结果表明,系统收敛性最终可达到99%以上,且就业创业资源信息分类准确率更高,具有较强的实际应用效果。 展开更多
关键词 决策树 就业创业资源 信息分类 深入挖掘 信息增益
下载PDF
大数据混合结构的电炉企业公共突发事件危机预警系统
3
作者 吴思瑾 《工业加热》 CAS 2024年第1期66-70,共5页
为解决电炉企业公共突发事件危机预警系统的分类能力差、预警误报累积分布比例高的问题,研究大数据混合结构的电炉企业公共突发事件危机预警系统。采用C/S结构、B/S结构和大数据数据库相结合的大数据混合结构,构建新的系统结构,从而设... 为解决电炉企业公共突发事件危机预警系统的分类能力差、预警误报累积分布比例高的问题,研究大数据混合结构的电炉企业公共突发事件危机预警系统。采用C/S结构、B/S结构和大数据数据库相结合的大数据混合结构,构建新的系统结构,从而设计系统功能模块,通过决策树算法分类事件,实现电炉企业公共突发事件危机预警。结果表明,该方法准确分类了事件样本,并且预警误报累积分布比例数值在2.0%以下,数值未发生较大波动,证实了其提高了事件分类能力和降低了预警误报累积分布比例,从而提高了危机预警性能,具备更高的应用价值。 展开更多
关键词 大数据混合结构 电炉企业公共突发事件 危机预警系统 决策树 信息增益
下载PDF
决策树的优化算法 被引量:130
4
作者 刘小虎 李生 《软件学报》 EI CSCD 北大核心 1998年第10期797-800,共4页
决策树的优化是决策树学习算法中十分重要的分支.以ID3为基础,提出了改进的优化算法.每当选择一个新的属性时,算法不是仅仅考虑该属性带来的信息增益,而是考虑到选择该属性后继续选择的属性带来的信息增益,即同时考虑树的两层... 决策树的优化是决策树学习算法中十分重要的分支.以ID3为基础,提出了改进的优化算法.每当选择一个新的属性时,算法不是仅仅考虑该属性带来的信息增益,而是考虑到选择该属性后继续选择的属性带来的信息增益,即同时考虑树的两层结点.提出的改进算法的时间复杂性与ID3相同,对于逻辑表达式的归纳,改进算法明显优于ID3. 展开更多
关键词 机器学习 决策树 分类 信息增益
下载PDF
降雨型滑坡灾害的特征聚合决策树预测模型 被引量:13
5
作者 赵晓萌 卫星君 +1 位作者 王娜 雷向杰 《灾害学》 CSCD 北大核心 2020年第1期27-31,共5页
为了有效预警降雨型滑坡灾害,以秦巴山区为研究区域,采集并处理大量不同时段降雨数据,构成降雨特征属性。利用Fisher最优分割,对降雨特征属性值进行分段统计,提出特征聚合转换表。使用信息增益和预测反馈筛选影响滑坡灾害的有效降雨特征... 为了有效预警降雨型滑坡灾害,以秦巴山区为研究区域,采集并处理大量不同时段降雨数据,构成降雨特征属性。利用Fisher最优分割,对降雨特征属性值进行分段统计,提出特征聚合转换表。使用信息增益和预测反馈筛选影响滑坡灾害的有效降雨特征,为预测模型提供有效数据集。利用特征聚合转换表和有效降雨特征,改进决策树,构建特征聚合决策树预测模型,进而提高预测效率和预测准确率。分析决策树的深度和叶子节点个数,给出决策树的反馈执行度,表明使用特征聚合转换表的决策树更优。比较特征聚合决策树、决策树、朴素贝叶斯和逻辑回归预测模型,结果表明,特征聚合决策树预测模型对降雨型滑坡灾害有更高的预测准确率,且平均预测准确率较高。 展开更多
关键词 降雨 滑坡灾害 信息增益 最优分割 决策树
下载PDF
基于改进的C4.5算法的网络流量分类方法 被引量:18
6
作者 周剑峰 阳爱民 刘吉财 《计算机工程与应用》 CSCD 2012年第5期71-74,共4页
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提... 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。 展开更多
关键词 网络流量分类 C4.5算法 信息熵 信息增益率 决策树
下载PDF
基于决策树的医疗数据分析 被引量:23
7
作者 刘昆 刘业政 《计算机工程》 CAS CSCD 北大核心 2002年第2期41-43,78,共4页
介绍了决策树的概念和生成过程,仔细研究了决策树的几种技术,并将它们集成到作者的决策树分析系统中。在分析了医疗数据之后,提出了今后决策树研究的一个重要方向。
关键词 决策树 信息增益 医疗数据分析 知识发现 医院 计算机
下载PDF
针对不平衡数据的决策树改进方法 被引量:12
8
作者 王伟 谢耀滨 尹青 《计算机应用》 CSCD 北大核心 2019年第3期623-628,共6页
针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题,提出了C4.5决策树的三种改进方法——C4.5+δ、均匀分布熵(UDE)和改进分布熵函数(IDEF)。首先,推导了C4.5算法中属性选择准则会倾向于选择偏斜划分的属性;然... 针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题,提出了C4.5决策树的三种改进方法——C4.5+δ、均匀分布熵(UDE)和改进分布熵函数(IDEF)。首先,推导了C4.5算法中属性选择准则会倾向于选择偏斜划分的属性;然后,分析了偏斜划分使得异常(少数类)检测精度下降的原因;其次,分别通过引入缓和因子、均匀分布熵或替换分布熵函数改进了C4.5算法的属性选择准则——信息增益率;最后,利用WEKA平台和NSL-KDD数据集对改进的决策树进行验证。实验结果表明,三种改进方法均能提高异常检测精度。其中,相比于C4.5,C4.5+7、UDE和IDEF算法在KDDTest-21数据集上的少数类检测精度(灵敏度)分别提高了3.16、3.02和3.12个百分点,均优于采用Rényi熵和Tsallis熵作为分裂准则的方法。此外,利用三种改进的决策树检测工业控制系统中的异常,不仅可以提高异常的查全率还能减小误报率。 展开更多
关键词 不平衡数据 异常检测 决策树 C4.5 信息增益率
下载PDF
基于信息增益率的决策树对入侵检测的改进 被引量:8
9
作者 唐谦 张大方 黄昆 《计算机工程》 EI CAS CSCD 北大核心 2006年第7期146-148,共3页
用构造决策树的方法来对入侵规则进行分类组织,将并行处理的机制引入到数据包与入侵规则集的匹配检测过程中。该文对于构造入侵规则决策树的过程,采用信息增益率为新的分类属性选择标准,并用它替代了原有的信息增益标准。实验证明,对于... 用构造决策树的方法来对入侵规则进行分类组织,将并行处理的机制引入到数据包与入侵规则集的匹配检测过程中。该文对于构造入侵规则决策树的过程,采用信息增益率为新的分类属性选择标准,并用它替代了原有的信息增益标准。实验证明,对于某些特定的攻击类型,在产生相同告警数量的前提下,采用信息增益率的检测引擎比采用信息增益的检测引擎,在检测速度上有明显的提高,有力地提高了基于特征的入侵检测性能,可及时地发现入侵行为。 展开更多
关键词 入侵检测 规则 决策树 信息增益
下载PDF
一种基于决策树算法的耕地地力等级评价 被引量:6
10
作者 曹丽英 孙学生 +1 位作者 赵月玲 陈桂芬 《东北林业大学学报》 CAS CSCD 北大核心 2011年第2期93-96,共4页
以吉林省德惠市的图斑数据作为实验数据,选择有机质、全氮、速效磷、速效钾4个方面作为耕地地力等级的评价指标,利用数据挖掘中的决策树分类技术建立耕地地力等级评价模型。通过实验分析,得到的分级结果与实际情况基本一致,表明该方法... 以吉林省德惠市的图斑数据作为实验数据,选择有机质、全氮、速效磷、速效钾4个方面作为耕地地力等级的评价指标,利用数据挖掘中的决策树分类技术建立耕地地力等级评价模型。通过实验分析,得到的分级结果与实际情况基本一致,表明该方法对耕地地力等级评价具有有效性和可行性。 展开更多
关键词 决策树 耕地 地力 等级评价 信息增益
下载PDF
一种基于信息增益与费用评价函数的特征选择准则 被引量:6
11
作者 王亚东 郭茂祖 钱国良 《计算机研究与发展》 EI CSCD 北大核心 1999年第7期788-793,共6页
特征选择问题是机器学习和模式识别中的一个重要问题.然而,在实际应用中,由于没有将特征选择与特征提取过程统一考虑,只注重特征本身的分类性能,没有考虑特征提取的费用问题,导致识别系统的效率较低.文中从实际应用角度,提出一... 特征选择问题是机器学习和模式识别中的一个重要问题.然而,在实际应用中,由于没有将特征选择与特征提取过程统一考虑,只注重特征本身的分类性能,没有考虑特征提取的费用问题,导致识别系统的效率较低.文中从实际应用角度,提出一种新的特征选择准则,将特征的分类性能与特征的提取费用统一考虑,利用信息增益与特征提取费用综合评价函数作为特征选择准则,并给出了启发式算法ECFS.将该算法应用于实际领域的学习问题并与决策树算法ID3和BP神经网络进行了比较.实验结果表明,ECFS在保证识别精度的同时,大大减少了特征提取的时间消耗,提高了识别速度. 展开更多
关键词 信息增益 费用 特征选择 机器学习 模式识别
下载PDF
分支合并对决策树归纳学习的影响 被引量:17
12
作者 王熙照 杨晨晓 《计算机学报》 EI CSCD 北大核心 2007年第8期1251-1258,共8页
传统的决策树构建方法,由于其选择扩展属性时的归纳偏置,导致属性值较多的属性总会被优先选择,从而导致树的规模过大,并且泛化能力下降,因此需对其进行简化.剪枝是简化的一种,分为预剪枝和后剪枝.该文主要针对预剪枝中的分支合并进行研... 传统的决策树构建方法,由于其选择扩展属性时的归纳偏置,导致属性值较多的属性总会被优先选择,从而导致树的规模过大,并且泛化能力下降,因此需对其进行简化.剪枝是简化的一种,分为预剪枝和后剪枝.该文主要针对预剪枝中的分支合并进行研究.文中研究了分支合并对决策树归纳学习的影响;具体讨论了在决策树的产生过程中,选择适当的分支合并策略对决策树进行分钟合并处理后,能否增强树的可理解性,减少树的复杂程度以及提高树的泛化精度;基于信息增益,分析了分支合并后决策树的复杂程度,设计实现了一种基于正例比的分支合并算法SSID和一种基于最大增益补偿的分支合并算法MCID.实验结果显示:SSID和MCID所得到的决策树在可理解性和泛化精度方面均明显优于See5. 展开更多
关键词 决策树归纳 归纳偏置 剪枝 分支合并 信息增益 增益补偿
下载PDF
基于C4.5决策树算法的中医胃炎实验数据分类挖掘研究 被引量:10
13
作者 刘广 孙艳秋 裴媛 《中华中医药学刊》 CAS 北大核心 2016年第12期2958-2961,共4页
C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨... C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨证规律以及名老中医诊治胃炎的诊疗经验。 展开更多
关键词 中医胃炎 决策树 C4.5算法 信息增益 分类规则
下载PDF
基于赤池信息准则的分类回归决策树剪枝算法 被引量:10
14
作者 杨贵军 孟杰 王双喜 《计算机应用》 CSCD 北大核心 2014年第A02期147-150,共4页
决策树剪枝可以提高决策树的分类准确度。代价复杂度剪枝(CCP)等常用的剪枝算法,都以降低决策树的误判率作为剪枝依据。引入赤池信息准则(AIC)评价决策树的优良性,并提出了基于AIC的决策树剪枝算法,将分类正确概率和复杂度的综合评价作... 决策树剪枝可以提高决策树的分类准确度。代价复杂度剪枝(CCP)等常用的剪枝算法,都以降低决策树的误判率作为剪枝依据。引入赤池信息准则(AIC)评价决策树的优良性,并提出了基于AIC的决策树剪枝算法,将分类正确概率和复杂度的综合评价作为剪枝依据。通过实例分析,基于AIC的剪枝算法能够得到高分类准确度的决策树,并没有出现过拟合或剪枝不充足等问题。 展开更多
关键词 赤池信息准则 代价复杂度剪枝 LOGISTIC回归 决策树剪枝
下载PDF
决策树C4.5连续属性分割阈值算法改进及其应用 被引量:41
15
作者 姚亚夫 邢留涛 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第12期3772-3776,共5页
结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序... 结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序列中的人车目标识别。实验结果表明:改进C4.5算法的计算量减少近20%,大大提高了决策树的生成效率,分类准确率也略有提高。 展开更多
关键词 决策树C4.5算法 连续属性 分割阈值 信息增益率
下载PDF
决策树ID3算法的改进 被引量:33
16
作者 黄爱辉 陈湘涛 《计算机工程与科学》 CSCD 北大核心 2009年第6期109-111,共3页
本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更... 本文根据ID3算法中信息增益计算原理的特点,利用数学上等价无穷小的性质提出一种新的改进的ID3算法,减少了信息增益的计算量,进而提高ID3算法中信息增益的计算效率。与原ID3算法相比,改进的ID3算法在构造决策树时具有相同的准确率和更高的计算速度。 展开更多
关键词 决策树 ID3算法 信息增益 等价无穷小
下载PDF
基于信息增益和最小距离分类的决策树改进算法 被引量:11
17
作者 段薇 马丽 路向阳 《科学技术与工程》 北大核心 2013年第6期1643-1646,1652,共5页
决策树是分类中的常用方法,以ID3决策树算法为基础,提出一种改进型决策树算法。改进后的ID3算法针对决策树在分类过程中遇到的训练集中存在相同属性集,但属于不同类别的实例的情况,不再采用多数表决法判断叶结点的类别,而是采用基于信... 决策树是分类中的常用方法,以ID3决策树算法为基础,提出一种改进型决策树算法。改进后的ID3算法针对决策树在分类过程中遇到的训练集中存在相同属性集,但属于不同类别的实例的情况,不再采用多数表决法判断叶结点的类别,而是采用基于信息增益的属性约简和最小距离分类的新方法进行类别的判断。实验表明改进后的算法对于优化决策树的结构,提高分类准确率具有良好效果。 展开更多
关键词 信息增益 最小距离 决策树 分类
下载PDF
一种基于属性相关的C4.5决策树改进算法 被引量:13
18
作者 魏浩 丁要军 《中北大学学报(自然科学版)》 CAS 北大核心 2014年第4期402-406,共5页
针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的... 针对在C4.5决策树构造过程中,测试属性选择未考虑属性之间影响的缺点,提出了一种改进的C4.5决策算法.该算法使用一个属性与其他属性的平均信息熵表示这个属性与其他属性的冗余度,然后在选择测试属性的过程中,加入测试属性与其他属性的冗余度,通过信息增益、分裂熵和冗余度三个因素的评价,选择信息增益率高而与其他属性冗余度低的测试属性.实验结果表明,在选定的实验数据集上,改进后的C4.5决策树算法平均分类正确率提高. 展开更多
关键词 C4 5决策树 属性相关 信息熵 信息增益率 冗余度
下载PDF
应用决策树方法构建评价指标体系 被引量:8
19
作者 陈翔 刘军丽 《计算机应用》 CSCD 北大核心 2006年第2期368-370,共3页
在根据不同应用改进信息熵计算方法的基础上,提出了利用信息增益选择属性作为评价指标并得到其权重的方法。使用信息增益生成决策树,给出利用决策树计算指标评分细则的方法。最后,通过个人住房贷款信用风险评估体系的建立验证了这些方... 在根据不同应用改进信息熵计算方法的基础上,提出了利用信息增益选择属性作为评价指标并得到其权重的方法。使用信息增益生成决策树,给出利用决策树计算指标评分细则的方法。最后,通过个人住房贷款信用风险评估体系的建立验证了这些方法的实用性。 展开更多
关键词 信息熵 信息增益 决策树 评价指标体系
下载PDF
基于相关系数的决策树优化算法 被引量:19
20
作者 董跃华 刘力 《计算机工程与科学》 CSCD 北大核心 2015年第9期1783-1793,共11页
通过分析ID3算法的基本原理及其多值偏向问题,提出了一种基于相关系数的决策树优化算法。首先通过引进相关系数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。通... 通过分析ID3算法的基本原理及其多值偏向问题,提出了一种基于相关系数的决策树优化算法。首先通过引进相关系数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。通过具体数据的实例验证,说明优化后的ID3算法能够解决多值偏向问题。标准数据集UCI上的实验结果表明,在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,从而还缩短了决策树的生成时间,当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高。 展开更多
关键词 ID3算法 相关系数 决策树 泰勒公式 信息增益
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部