期刊文献+
共找到337篇文章
< 1 2 17 >
每页显示 20 50 100
C4.5算法的优化 被引量:15
1
作者 黄秀霞 孙力 《计算机工程与设计》 北大核心 2016年第5期1265-1270,1361,共7页
对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非... 对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为G_C4.5。对G_C4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,G_C4.5算法在分类效率和准确性上都有一定提高。 展开更多
关键词 c4.5算法 泰勒级数 等价无穷小 GINI指数的均值 非类属性间关联性 G_c4.5算法
下载PDF
一种改进的C4.5算法 被引量:7
2
作者 李瑞 程亚楠 《科学技术与工程》 2010年第27期6670-6674,共5页
为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定... 为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定。MB—C4.5算法在提高重要属性的选择、减少无意义分枝、过度拟合等方面有一定提高。用该算法构造出的决策树进行分类更为准确、合理。对改进前后的算法用实例进行分析,说明MB—C4.5算法的有效性。 展开更多
关键词 c4.5算法 MB—c4.5算法 合并分枝 平衡度系数
下载PDF
C4.5算法在2型糖尿病分类规则建立中的应用 被引量:15
3
作者 罗森林 成华 +3 位作者 顾毓清 张铁梅 曾平 陈峰 《计算机应用研究》 CSCD 北大核心 2004年第7期174-176,179,共4页
基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因... 基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因素之间的相互关系以及影响程度提供了一种新的方法 ,为建立 展开更多
关键词 2型糖尿病 c4.5算法 数据挖掘
下载PDF
基于C4.5算法的道路网网格模式识别 被引量:19
4
作者 田晶 艾廷华 丁绍军 《测绘学报》 EI CSCD 北大核心 2012年第1期121-126,共6页
提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述... 提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述数据构造分类器,运用10折交叉验证获得具有说服力的结果,其Kappa值分别为0.63和0.66,正确率分别为81.7%和82.9%,置信度90%的置信区间分别为[0.785,0.846]和[0.797,0.857]。在新数据上进行了识别效果的验证,结果表明该分类器可用于网格模式的识别。 展开更多
关键词 道路网 网格模式 模式识别 c4.5算法
下载PDF
基于改进的C4.5算法的网络流量分类方法 被引量:19
5
作者 周剑峰 阳爱民 刘吉财 《计算机工程与应用》 CSCD 2012年第5期71-74,共4页
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提... 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。 展开更多
关键词 网络流量分类 c4.5算法 信息熵 信息增益率 决策树
下载PDF
C4.5算法在保险客户流失分析中的应用 被引量:33
6
作者 桂现才 彭宏 王小华 《计算机工程与应用》 CSCD 北大核心 2005年第17期197-199,214,共4页
保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。论文利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客户流失的特征,帮助保险公司有针对性地改善客户关系。
关键词 客户流失分析 保险 c4.5算法 决策树 面向属性归纳
下载PDF
具有容噪特性的C4.5算法改进 被引量:10
7
作者 王伟 李磊 张志鸿 《计算机科学》 CSCD 北大核心 2015年第12期268-271,287,共5页
针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与... 针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与控制平滑度相结合的最优化问题,从而获得主成分空间;另一方面在决策树自顶向下构建新节点的过程中,再将主成分空间恢复到原始数据空间来避免降维过程中属性特征信息永久消失。实验结果表明NFPCA-in-C4.5算法兼具降维和容噪功能,避免了降维中由特征信息损失和噪声残留造成的预测模型准确率大幅降低的问题。 展开更多
关键词 高维数据噪声 容噪 主成分分析 c4.5算法
下载PDF
决策树C4.5算法在数据挖掘中的分析及其应用 被引量:43
8
作者 李楠 段隆振 陈萌 《计算机与现代化》 2008年第12期160-163,共4页
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这... 决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。分类器是数据挖掘的一种基本方法。本文对分类器的基本概念、C4.5算法、决策树的构建和剪枝进行了介绍,然后将C4.5算法应用于篮球比赛的技术统计分析中,通过对这些数据分析从而得到一些较实用的预测胜负规则。 展开更多
关键词 数据挖掘 决策树 篮球比赛 c4.5算法
下载PDF
融合GINI指数的C4.5算法的分类研究 被引量:5
9
作者 聂斌 李欢 +3 位作者 罗计根 杜建强 周丽 黄强 《江西师范大学学报(自然科学版)》 CAS 北大核心 2019年第5期469-472,共4页
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值... 信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效. 展开更多
关键词 c4.5算法 GINI指数 决策树 中医药信息
下载PDF
决策树C4.5算法在森林资源二类调查中的应用 被引量:13
10
作者 王阗 佘光辉 《南京林业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第3期115-118,共4页
C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法。它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖... C4.5算法是基于信息熵理论进行数据分类分析的经典决策树数据挖掘算法。它主要包括数据预处理、决策树生成、决策树修剪、决策树规则提取等步骤。笔者将C4.5算法应用于森林资源二类调查的数据分析中,通过对调查数据挖掘分析表明,数据挖掘在森林资源调查数据分析中具有广泛的应用前景。 展开更多
关键词 数据挖掘 决策树 森林资源 c4.5算法
下载PDF
基于C4.5算法的敏感图像检测方法 被引量:4
11
作者 罗森林 辛子英 冯磊 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第5期451-453,共3页
提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量... 提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量融合进行基于C4.5算法和2次训练和分类.基于2次训练生成的规则进行敏感图片的检测.实验结果表明,该方法对于敏感图片分类正确率达93.3%以上,与基于颜色和纹理特征的直接检测方法相比,进一步提高了正确识别率. 展开更多
关键词 敏感图像 皮肤检测 颜色空间 c4.5算法
下载PDF
决策树中ID3算法与C4.5算法分析与比较 被引量:20
12
作者 李会 胡笑梅 《水电能源科学》 2008年第2期129-132,163,共5页
论述了决策树表示方法及ID3、C4.5决策树学习算法,特别对决策属性的选取法则进行了说明。通过实例解析ID3、C4.5算法实现,结果表明C4.5算法在决策树分类效率和直观性都得到了提高。
关键词 数据挖掘 决策树 ID3算法 c4.5算法
下载PDF
基于C4.5算法的长江中下游地区夏季降水预测模型研究及应用 被引量:10
13
作者 苗春生 何东坡 +1 位作者 王坚红 史达伟 《气象科学》 北大核心 2017年第2期256-264,共9页
为了对长江中下游夏季降水进行短期气候预测,利用国家气候中心提供的74项环流指数和NOAA整编的西太平洋型WP指数、MEI指数、ENSO指数等多种全球环流指数资料,归纳整理了影响长江中下游夏季降水的34个前期春季因子,讨论了前期春季因子与... 为了对长江中下游夏季降水进行短期气候预测,利用国家气候中心提供的74项环流指数和NOAA整编的西太平洋型WP指数、MEI指数、ENSO指数等多种全球环流指数资料,归纳整理了影响长江中下游夏季降水的34个前期春季因子,讨论了前期春季因子与夏季降水的关系,并利用这34个前期春季因子通过数据挖掘中的C4.5算法对1951—2013年(63 a)长江中下游夏季降水,建立判别降水偏多以及偏少的两类决策树预测模型,并分别得到5条和7条综合判别规则。随机选取80%左右历史年份数据作为模型的训练集,两模型的训练集准确率分别为94.12%和93.88%,剩余20%年份数据作为模型测试集,模型的测试预测准确率分别达91.67%和85.71%。模型预测应用也显示结果正确。模型研究和应用显示,基于C4.5算法的长江中下游夏季降水预测模型具有较高的预测准确率,模型构建合理有效,判别规则依据大数据理论,广泛考虑相关因子以及因子的排列组合,智能化选择关键因子,易于客观化、自动化实施,为长江流域汛期降水的短期气候预测提供了新的思路与方法。 展开更多
关键词 长江中下游 夏季降水 c4.5算法 预测模型
下载PDF
一种基于C4.5算法的车位识别方法 被引量:6
14
作者 丁兵 吴允平 李彬雅 《电子测量技术》 2015年第8期64-68,共5页
提出了一种基于C4.5算法的车位识别方法。首先通过手机的传感器系统,对车辆行驶轨迹的GPS等数据进行采集,然后利用去除飞点、定位补偿、卡尔曼滤波等方法对采集的数据进行一系列的处理,并进一步采用C4.5算法识别车辆行驶状态信息,最终... 提出了一种基于C4.5算法的车位识别方法。首先通过手机的传感器系统,对车辆行驶轨迹的GPS等数据进行采集,然后利用去除飞点、定位补偿、卡尔曼滤波等方法对采集的数据进行一系列的处理,并进一步采用C4.5算法识别车辆行驶状态信息,最终通过车位识别算法实现对停车位的自动识别。数据处理结果表明,通过上述数据处理过程和方法能够很好的识别潜在的路边车位信息。 展开更多
关键词 c4.5算法 卡尔曼滤波 车位识别 GPS
下载PDF
改进的C4.5算法的研究与应用 被引量:16
15
作者 赵建民 黄珊 +1 位作者 王梅 刘澎 《计算机与数字工程》 2019年第2期261-265,共5页
针对C4.5算法构建特征决策树方法的研究,发现目前方法时常出现准确率低的情况,导致模型使用过程缺乏准确性。为此,在数据挖掘的过程中深入研究C4.5算法,提出一种改进的算法,即C4.5-W算法,该算法的主要思想是通过在C4.5算法中引入参数W,... 针对C4.5算法构建特征决策树方法的研究,发现目前方法时常出现准确率低的情况,导致模型使用过程缺乏准确性。为此,在数据挖掘的过程中深入研究C4.5算法,提出一种改进的算法,即C4.5-W算法,该算法的主要思想是通过在C4.5算法中引入参数W,调整属性度量标准信息增益率的取值范围,进而构建决策树模型找出涉案人特征规律进行预测。通过实验表明,该算法在使用过程中能够有效提高预测涉案人的精准率。因此,C4.5-W算法可提高决策树模型的准确率。 展开更多
关键词 c4.5算法 决策树 涉案人特征 数据挖掘
下载PDF
基于属性依赖度计算和PCA的C4.5算法 被引量:5
16
作者 黄秀霞 孙力 《传感器与微系统》 CSCD 2017年第1期131-134,共4页
针对C4.5算法繁多的对数运算、无关属性地干扰和属性相关性的影响等问题,提出了基于属性依赖度计算和主成分分析(PCA)的C4.5算法。根据等价无穷小的原理简化运算公式;用属性依赖度的计算并借鉴PCA算法的压缩原理来处理属性相关性问题;... 针对C4.5算法繁多的对数运算、无关属性地干扰和属性相关性的影响等问题,提出了基于属性依赖度计算和主成分分析(PCA)的C4.5算法。根据等价无穷小的原理简化运算公式;用属性依赖度的计算并借鉴PCA算法的压缩原理来处理属性相关性问题;引入了"平均波动率"和"应用权重"两个新概念,得到一个新的属性选择度量。用学生综合成绩的评定工作进行应用分析,并用UCI数据集进行性能比较,实验表明:改进后算法的评定结果更科学,并且分类更准确,运算效率更高。 展开更多
关键词 c4.5算法 属性依赖度计算 主成分分析 平均波动率 应用权重
下载PDF
基于决策树的ID3算法与C4.5算法 被引量:19
17
作者 高阳 廖家平 吴伟 《湖北工业大学学报》 2011年第2期54-56,共3页
论述了在数据挖掘中基于决策树的ID3算法以及C4.5算法,说明了两种算法的优缺点.通过实例解析了ID3算法和C4.5算法的实现过程,能够直观看出C4.5算法相比较与ID3算法的优越性.
关键词 数据挖掘 ID3算法 c4.5算法
下载PDF
决策树C4.5算法的改进与分析 被引量:24
18
作者 安葳鹏 尚家泽 《计算机工程与应用》 CSCD 北大核心 2019年第12期169-173,共5页
C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选... C4.5算法在选择分裂属性时只考虑了每个条件属性和决策属性之间的关系,而没有考虑到条件属性间的相关性,直接影响构建树的准确率。提出一种基于Kendall和谐系数的C4.5决策树优化算法,用于解决条件属性之间相关性的问题,提高算法属性选择的准确性。在引入系数的基础上运用等价无穷小原理对计算公式进行简化,提高了算法的效率。对改进后的C4.5算法和传统的算法进行仿真实验,结果表明,改进的C4.5算法在准确度和效率上都有较大提高。 展开更多
关键词 c4.5算法 Kendall和谐系数 决策树
下载PDF
C4.5算法在城建档案催交管理中的应用 被引量:1
19
作者 董永峰 孙石磊 +1 位作者 宋洁 顾军华 《河北工业大学学报》 CAS 2008年第2期18-22,共5页
决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用C4.5算法针对催交信息构造决策树,并利用生成的... 决策树作为一种数据挖掘分类算法,不仅可以根据现存的数据库信息得出分类规则,而且可以通过友好的图形界面进行结果展示.城建档案馆在档案催交管理工作中,收集了大量的数字化信息,文中运用C4.5算法针对催交信息构造决策树,并利用生成的决策树辅助城建档案馆进行档案的催交管理. 展开更多
关键词 数据挖掘 c4.5算法 决策树 分类规则 城建档案
下载PDF
基于C4.5算法的无线传感器网络农业环境部署节点故障诊断方法 被引量:1
20
作者 许崇霞 宋婷婷 +2 位作者 冯德军 卢启福 杨敬锋 《安徽农业科学》 CAS 北大核心 2011年第15期9405-9406,共2页
通过采集农业环境下无线传感器网络节点所采集的数据,基于C4.5算法挖掘故障诊断关联规则,建立了农业环境部署节点故障诊断模型。结果表明,该模型能够比较好地对故障无线传感器网络节点进行识别。
关键词 c4.5算法 无线传感器网络 故障诊断 农业环境
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部