期刊文献+
共找到619篇文章
< 1 2 31 >
每页显示 20 50 100
基于C4.5决策树的电网故障设备状态评估 被引量:1
1
作者 刘正超 邹文仲 杜蕊妍 《工业控制计算机》 2024年第3期147-148,151,共3页
对电网故障设备进行准确的状态评估可有效提高产品质量,减少资源浪费。提出了一种基于C4.5决策树的电网故障设备状态评估方法。首先,通过对电网设备故障因素进行分析,构建了包含13个状态量的设备故障状态体系。其次,基于C4.5决策树算法... 对电网故障设备进行准确的状态评估可有效提高产品质量,减少资源浪费。提出了一种基于C4.5决策树的电网故障设备状态评估方法。首先,通过对电网设备故障因素进行分析,构建了包含13个状态量的设备故障状态体系。其次,基于C4.5决策树算法构建了电网设备状态评估模型。最后,通过后剪枝算法对模型进行剪枝降低模型复杂度,并定义多项指标对算法模型进行评价。实际数据分析结果表明,构建的算法模型预测准确率、精确率均能够达到91%以上,有效支撑设备厂商储备备品备件方面工作,提升企业效益。 展开更多
关键词 c4.5决策树 故障设备 状态评估 剪枝 评价指标
下载PDF
基于C4.5决策树算法构建学生画像模型的研究与实现
2
作者 代洪伟 梁文栊 +1 位作者 苏森 陈剑炜 《长江信息通信》 2024年第9期68-70,98,共4页
近年来,随着大数据分析技术的发展,用户画像技术日趋成熟,挖掘数据中的隐藏信息已经成了研究热门。文章参考用户画像技术,提出了一种基于C4.5决策树算法的学生画像建模方法。文章以广西大学计算机与电子信息学院的本科生为研究样本,搜... 近年来,随着大数据分析技术的发展,用户画像技术日趋成熟,挖掘数据中的隐藏信息已经成了研究热门。文章参考用户画像技术,提出了一种基于C4.5决策树算法的学生画像建模方法。文章以广西大学计算机与电子信息学院的本科生为研究样本,搜集学生们的行为数据制作数据集。该模型采用平均值填充法进行数据预处理,并将清洗完毕的数据投入训练模型进行调参,从而获得最后的测试模型。该模型能够按照三级标签体系将学生分类,准确率达到62.3%。最后该文对研究结果进行了分析总结,确定了未来的发展方向。 展开更多
关键词 大数据分析 用户画像 学生画像 c4.5决策树算法 标签体系 学生分类
下载PDF
C4.5算法的优化 被引量:15
3
作者 黄秀霞 孙力 《计算机工程与设计》 北大核心 2016年第5期1265-1270,1361,共7页
对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非... 对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为G_C4.5。对G_C4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,G_C4.5算法在分类效率和准确性上都有一定提高。 展开更多
关键词 c4.5算法 泰勒级数 等价无穷小 GINI指数的均值 非类属性间关联性 G_c4.5算法
下载PDF
一种改进的C4.5算法 被引量:7
4
作者 李瑞 程亚楠 《科学技术与工程》 2010年第27期6670-6674,共5页
为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定... 为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定。MB—C4.5算法在提高重要属性的选择、减少无意义分枝、过度拟合等方面有一定提高。用该算法构造出的决策树进行分类更为准确、合理。对改进前后的算法用实例进行分析,说明MB—C4.5算法的有效性。 展开更多
关键词 c4.5算法 MB—c4.5算法 合并分枝 平衡度系数
下载PDF
决策树C4.5算法改进与应用 被引量:10
5
作者 陈杰 邬春学 《软件导刊》 2018年第10期88-92,共5页
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息... 针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。 展开更多
关键词 c4.5 TM -c4.5算法 CCP 贝叶斯分类器 剪枝策略 评价标准
下载PDF
C4.5算法在2型糖尿病分类规则建立中的应用 被引量:15
6
作者 罗森林 成华 +3 位作者 顾毓清 张铁梅 曾平 陈峰 《计算机应用研究》 CSCD 北大核心 2004年第7期174-176,179,共4页
基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因... 基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因素之间的相互关系以及影响程度提供了一种新的方法 ,为建立 展开更多
关键词 2型糖尿病 c4.5算法 数据挖掘
下载PDF
基于C4.5算法的道路网网格模式识别 被引量:19
7
作者 田晶 艾廷华 丁绍军 《测绘学报》 EI CSCD 北大核心 2012年第1期121-126,共6页
提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述... 提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述数据构造分类器,运用10折交叉验证获得具有说服力的结果,其Kappa值分别为0.63和0.66,正确率分别为81.7%和82.9%,置信度90%的置信区间分别为[0.785,0.846]和[0.797,0.857]。在新数据上进行了识别效果的验证,结果表明该分类器可用于网格模式的识别。 展开更多
关键词 道路网 网格模式 模式识别 c4.5算法
下载PDF
基于改进的C4.5算法的网络流量分类方法 被引量:18
8
作者 周剑峰 阳爱民 刘吉财 《计算机工程与应用》 CSCD 2012年第5期71-74,共4页
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提... 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。 展开更多
关键词 网络流量分类 c4.5算法 信息熵 信息增益率 决策树
下载PDF
C4.5算法在在线学习行为评估系统中的应用 被引量:15
9
作者 范洁 杨岳湘 温璞 《计算机工程与设计》 CSCD 北大核心 2006年第6期946-948,共3页
基于数据挖掘技术构建了在线学习行为评估系统。利用C4.5算法挖掘学生在线学习行为与学习效果的历史数据,建立“学习行为—效果”模型。用此模型评估未来学生的在线学习状况,给出形成性评估的成绩。通过测试,评估结果较准确,教师和学生... 基于数据挖掘技术构建了在线学习行为评估系统。利用C4.5算法挖掘学生在线学习行为与学习效果的历史数据,建立“学习行为—效果”模型。用此模型评估未来学生的在线学习状况,给出形成性评估的成绩。通过测试,评估结果较准确,教师和学生的认可度达90%以上。系统的应用为在远程教学环境下客观、公正、合理的评估学生在线学习提供了有效方法和手段。 展开更多
关键词 决策树 c4.5 在线学习 评估
下载PDF
C4.5算法在保险客户流失分析中的应用 被引量:33
10
作者 桂现才 彭宏 王小华 《计算机工程与应用》 CSCD 北大核心 2005年第17期197-199,214,共4页
保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。论文利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客户流失的特征,帮助保险公司有针对性地改善客户关系。
关键词 客户流失分析 保险 c4.5算法 决策树 面向属性归纳
下载PDF
一种基于变精度粗糙集的C4.5决策树改进算法 被引量:12
11
作者 刘兴文 王典洪 陈分雄 《计算机应用研究》 CSCD 北大核心 2011年第10期3649-3651,共3页
针对C4.5决策树构造复杂、分类精度不高等问题,提出了一种基于变精度粗糙集的决策树构造改进算法。该算法采用近似分类质量作为节点选择属性的启发函数,与信息增益率相比,该标准更能准确地刻画属性分类的综合贡献能力,同时对噪声有一定... 针对C4.5决策树构造复杂、分类精度不高等问题,提出了一种基于变精度粗糙集的决策树构造改进算法。该算法采用近似分类质量作为节点选择属性的启发函数,与信息增益率相比,该标准更能准确地刻画属性分类的综合贡献能力,同时对噪声有一定的抑制能力。此外还针对两个或两个以上属性的近似分类质量相等的特殊情形,给出了如何选择最优的分类属性作为节点的方法。实验结果证明,该算法构造的决策树在分类精度和规模上均优于C4.5算法。 展开更多
关键词 数据挖掘 决策树 信息增益率 c4.5算法 粗糙集 变精度粗糙集 近似分类质量
下载PDF
决策树C4.5连续属性分割阈值算法改进及其应用 被引量:41
12
作者 姚亚夫 邢留涛 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第12期3772-3776,共5页
结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序... 结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序列中的人车目标识别。实验结果表明:改进C4.5算法的计算量减少近20%,大大提高了决策树的生成效率,分类准确率也略有提高。 展开更多
关键词 决策树c4.5算法 连续属性 分割阈值 信息增益率
下载PDF
基于C4.5决策树算法的中医胃炎实验数据分类挖掘研究 被引量:10
13
作者 刘广 孙艳秋 裴媛 《中华中医药学刊》 CAS 北大核心 2016年第12期2958-2961,共4页
C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨... C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨证规律以及名老中医诊治胃炎的诊疗经验。 展开更多
关键词 中医胃炎 决策树 c4.5算法 信息增益 分类规则
下载PDF
C4.5决策树展示算法的设计 被引量:20
14
作者 姜欣 徐六通 张雷 《计算机工程与应用》 CSCD 北大核心 2003年第4期93-94,97,共3页
分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和... 分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和展示的直观性。 展开更多
关键词 机器学习 c4.5算法 决策树展示算法 设计 多叉树结构
下载PDF
决策树C4.5算法在天然气输差分析中的应用 被引量:8
15
作者 张德政 李天驰 阿孜古丽 《计算机工程与应用》 CSCD 北大核心 2006年第23期208-210,共3页
分类器是数据挖掘的一种基本方法。文章首先介绍了分类器的基本概念和决策树构建思路,然后讲述了在天然气信息数据库的基础上如何建立决策树分类器(用Java语言)和寻找影响输差较大的因素,从而得出一些实用的预测输差的规则。
关键词 天然气数据 输差分析 数据挖掘 分类器 决策树c4.5
下载PDF
基于C4.5决策树的嵌入型恶意代码检测方法 被引量:8
16
作者 张福勇 齐德昱 胡镜林 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期68-72,共5页
嵌入型恶意代码以其高隐蔽性和难检测性,成为计算机安全的新威胁.文中针对以往的统计分析法没有充分考虑嵌入型恶意代码所占字节数小、信息增益大的特点提出一种采用C4.5决策树的嵌入型恶意代码检测方法,即通过提取训练样本中信息增益... 嵌入型恶意代码以其高隐蔽性和难检测性,成为计算机安全的新威胁.文中针对以往的统计分析法没有充分考虑嵌入型恶意代码所占字节数小、信息增益大的特点提出一种采用C4.5决策树的嵌入型恶意代码检测方法,即通过提取训练样本中信息增益最大的500个3-gram作为属性特征,建立决策树,实现对未知嵌入型恶意代码的检测.实验结果表明,文中方法在检测率和分类准确率上均具有明显优势,对感染了嵌入型恶意代码的Word文档的检测率达99.80%. 展开更多
关键词 嵌入型恶意代码 恶意代码检测 c4.5决策树 BOOSTING算法
下载PDF
基于C4.5决策树算法的道路结冰预报模型构建与应用 被引量:12
17
作者 陈凯 徐国庆 +4 位作者 熊焘 侯纪勇 王曦晨 戚国辉 刘青 《交通运输研究》 2018年第1期57-62,共6页
为准确预报冬季道路结冰情况,保障交通运输安全,需要构建精度高、实用性强的道路结冰预报模型。将道路是否结冰抽象为二元分类问题,采用C4.5决策树算法,以通辽地区历史日最低气温、日降水量、日积雪深度和道路结冰数据为训练数据,构建... 为准确预报冬季道路结冰情况,保障交通运输安全,需要构建精度高、实用性强的道路结冰预报模型。将道路是否结冰抽象为二元分类问题,采用C4.5决策树算法,以通辽地区历史日最低气温、日降水量、日积雪深度和道路结冰数据为训练数据,构建了道路结冰预报模型,并以赤峰地区和沈阳到锡林浩特特高压设备运输期间道路结冰预报为例对模型的准确率加以验证。计算结果表明,赤峰地区道路结冰模型准确率为93.3%,沈阳到锡林浩特特高压交流输变电主设备运输期间道路结冰预测结果与实际情况符合度高达86.4%。这表明基于C4.5决策树算法的道路积冰预警模型准确度较高且实用性强,可作为我国东北部地区冬季道路结冰预报方法加以推广,也可为其他地区道路结冰预报提供参考。 展开更多
关键词 道路结冰 c4.5决策树 模型训练 预报模型 特高压主设备运输
下载PDF
融合GINI指数的C4.5算法的分类研究 被引量:5
18
作者 聂斌 李欢 +3 位作者 罗计根 杜建强 周丽 黄强 《江西师范大学学报(自然科学版)》 CAS 北大核心 2019年第5期469-472,共4页
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值... 信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效. 展开更多
关键词 c4.5算法 GINI指数 决策树 中医药信息
下载PDF
决策树C4.5算法在森林资源二类调查中的应用 被引量:13
19
作者 王阗 佘光辉 《南京林业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第3期115-118,共4页
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法。它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖... C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法。它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景。 展开更多
关键词 数据挖掘 决策树 森林资源 c4.5算法
下载PDF
基于C4.5算法的敏感图像检测方法 被引量:4
20
作者 罗森林 辛子英 冯磊 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第5期451-453,共3页
提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量... 提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量融合进行基于C4.5算法和2次训练和分类.基于2次训练生成的规则进行敏感图片的检测.实验结果表明,该方法对于敏感图片分类正确率达93.3%以上,与基于颜色和纹理特征的直接检测方法相比,进一步提高了正确识别率. 展开更多
关键词 敏感图像 皮肤检测 颜色空间 c4.5算法
下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部