期刊文献+
共找到2,159篇文章
< 1 2 108 >
每页显示 20 50 100
基于EM-FR-C5.0DT耦合模型的输气管道地质灾害风险预测模型
1
作者 艾昕宇 何鹏 +6 位作者 孟祥振 王新刚 李玉星 刘鹏 韩建红 梁裕如 由洋 《油气与新能源》 2024年第4期84-96,107,共14页
延安气田地处陕北山区,输气管道沿线发生地质灾害的风险较高,管道生产运行存在一定安全隐患,通过加强风险预测研究,可快速准确甄别沿线高后果区,对管道防灾减灾具有重要意义。为此,选取延安气田内部临镇-子长输气干线作为研究对象。首先... 延安气田地处陕北山区,输气管道沿线发生地质灾害的风险较高,管道生产运行存在一定安全隐患,通过加强风险预测研究,可快速准确甄别沿线高后果区,对管道防灾减灾具有重要意义。为此,选取延安气田内部临镇-子长输气干线作为研究对象。首先,通过相关性分析筛选出高程等11个影响因子,依次开展灾点空间分布规律研究;其次,采用加权频率比法将灾点属性值转换为可体现灾害风险贡献率的EM-FR(加权频率值),划分出低、极低风险区,在此范围内选取非灾点,以此构建EM-FR-C5.0DT(加权频率比-C5.0决策树)、EM-FR-BP(加权频率比-BP神经网络)等2种耦合模型,并预测研究区域的风险性;最后,在研究区域内随机选取非灾点,构建单一C5.0DT、BP模型,并与上述2种耦合模型开展精度对比分析。结果显示:耦合模型预测性能优于单一模型,其中EM-FR-C5.0DT模型效果最优。研究成果表明,在低、极低风险区内,选取非灾点构建数据集得到的耦合模型,可明显提升模型预测精度,更适合小样本地质灾害风险性建模,可为延安气田输气管道风险性研究提供一定借鉴。 展开更多
关键词 输气管道 熵值法 c5.0决策树 BP神经网络 风险性预测
下载PDF
基于改进C5.0决策树算法的电力营销异常数据挖掘研究
2
作者 肖杰 《消费电子》 2024年第8期63-65,共3页
由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法... 由于电力营销数据规模较大且数据组成复杂,传统挖掘方法容易出现异常数据识别不准确的问题,本文研究基于改进C5.0决策树算法的电力营销异常数据挖掘。通过收集与预处理等步骤做好电力营销数据的准备工作,引入信息熵改进C5.0决策树算法的属性选择方式,并利用改进后算法挖掘电力营销异常数据。实验结果表明,设计方法下电力营销异常数据挖掘结果的正确率高达97.5%,挖掘性能较强。 展开更多
关键词 改进c5.0决策树算法 电力营销 营销数据 异常数据 数据挖掘
下载PDF
基于Boosting算法的C5.0决策树不平衡数据分类算法 被引量:2
3
作者 王植 张珏 《河南科学》 2023年第1期7-12,共6页
为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验... 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. 展开更多
关键词 类不平衡问题 集成算法 c5.0决策树算法 网格搜索算法
下载PDF
决策树C5.0与Logistic回归模型对产后腹直肌分离预测性能的比较研究 被引量:3
4
作者 陈小慧 焦子珊 +1 位作者 王娜娜 沙凯辉 《实用临床医药杂志》 2023年第16期115-120,126,共7页
目的比较决策树C5.0与Logistic回归模型对产后腹直肌分离的预测效果。方法选取产后复查的产妇476例作为研究对象。采用问卷调查法获取产妇的一般资料;采用电刺激治疗仪评估盆底肌电值;采用腹部触诊法判断腹直肌分离程度。将所有数据按照... 目的比较决策树C5.0与Logistic回归模型对产后腹直肌分离的预测效果。方法选取产后复查的产妇476例作为研究对象。采用问卷调查法获取产妇的一般资料;采用电刺激治疗仪评估盆底肌电值;采用腹部触诊法判断腹直肌分离程度。将所有数据按照3∶2的比例建立训练集与测试集,运用决策树C5.0及Logistic回归建立产后腹直肌分离的风险预测模型;采用准确度、灵敏度、特异度、约登指数、阴性预测值、阳性预测值和受试者工作特征(ROC)曲线的曲线下面积(AUC)对模型的预测性能进行比较。结果在训练集中,决策树C5.0和Logistic回归模型的准确度分别为96.94%、72.45%,灵敏度分别为98.92%、86.02%,特异度分别为93.52%、49.07%,阳性预测值分别为96.34%、74.42%,阴性预测值分别为98.06%、67.09%,约登指数分别为92.44%、35.10%,AUC分别为0.962、0.675;训练集中,决策树C5.0和Logistic回归模型的AUC比较,差异有统计学意义(P<0.05)。在测试集中,决策树C5.0与Logistic回归模型的准确率分别为81.50%、62.43%,灵敏度分别为88.35%、82.52%,特异度分别为71.43%、32.86%,阳性预测值分别为81.98%、64.39%,阴性预测值分别为80.65%、56.10%,约登指数分别为59.78%、15.38%,AUC分别为0.799、0.577;测试集中,决策树C5.0和Logistic回归模型的AUC比较,差异有统计学意义(P<0.05)。结论决策树C5.0对产后腹直肌分离的预测效能优于Logistic回归模型。 展开更多
关键词 决策树c5.0 LOGISTIC回归模型 产后腹直肌分离 预测模型 曲线下面积
下载PDF
基于C5.0算法对以太坊中非法账户的分析与预测
5
作者 周健 闫石 张杰 《沈阳大学学报(自然科学版)》 CAS 2023年第1期42-49,F0003,共9页
针对加密货币的匿名性使得非法交易行为难于跟踪分析的问题,以以太坊交易数据为数据源,以被标记的非法账户和未标记的正常账户数据集作为训练集,基于C5.0算法,对其中包含多种类型的非法账户进行预测。实验过程采用多倍交叉验证,预测准... 针对加密货币的匿名性使得非法交易行为难于跟踪分析的问题,以以太坊交易数据为数据源,以被标记的非法账户和未标记的正常账户数据集作为训练集,基于C5.0算法,对其中包含多种类型的非法账户进行预测。实验过程采用多倍交叉验证,预测准确率达到了90.06%,感受者曲线下面积数值的评估度量达到了0.945。所提方案能够较为准确地预测以太坊交易平台上存在的非法行为,有效改善了基于区块链的交易环境。 展开更多
关键词 区块链 以太坊 非法账户 机器学习 c5.0
下载PDF
Landslide susceptibility zonation method based on C5.0 decision tree and K-means cluster algorithms to improve the efficiency of risk management 被引量:17
6
作者 Zizheng Guo Yu Shi +2 位作者 Faming Huang Xuanmei Fan Jinsong Huang 《Geoscience Frontiers》 SCIE CAS CSCD 2021年第6期243-261,共19页
Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study pres... Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study presents a machine learning approach based on the C5.0 decision tree(DT) model and the K-means cluster algorithm to produce a regional landslide susceptibility map. Yanchang County, a typical landslide-prone area located in northwestern China, was taken as the area of interest to introduce the proposed application procedure. A landslide inventory containing 82 landslides was prepared and subsequently randomly partitioned into two subsets: training data(70% landslide pixels) and validation data(30% landslide pixels). Fourteen landslide influencing factors were considered in the input dataset and were used to calculate the landslide occurrence probability based on the C5.0 decision tree model.Susceptibility zonation was implemented according to the cut-off values calculated by the K-means cluster algorithm. The validation results of the model performance analysis showed that the AUC(area under the receiver operating characteristic(ROC) curve) of the proposed model was the highest, reaching 0.88,compared with traditional models(support vector machine(SVM) = 0.85, Bayesian network(BN) = 0.81,frequency ratio(FR) = 0.75, weight of evidence(WOE) = 0.76). The landslide frequency ratio and frequency density of the high susceptibility zones were 6.76/km^(2) and 0.88/km^(2), respectively, which were much higher than those of the low susceptibility zones. The top 20% interval of landslide occurrence probability contained 89% of the historical landslides but only accounted for 10.3% of the total area.Our results indicate that the distribution of high susceptibility zones was more focused without containing more " stable" pixels. Therefore, the obtained susceptibility map is suitable for application to landslide risk management practices. 展开更多
关键词 Landslide susceptibility Frequency ratio c5.0 decision tree K-means cluster Classification Risk management
下载PDF
Study on Prediction Model of Number of Rainstorm Days in Summer Based on C5.0 Decision Tree Algorithm
7
作者 Shi Yimin Chen Weiwei Zhu Yunfeng 《Meteorological and Environmental Research》 CAS 2019年第2期56-60,共5页
Based on the data of daily precipitation in Lianyungang area from 1951 to 2012 and various climate signal data from the National Climate Center website and the NOAA website,a model for predicting whether the number of... Based on the data of daily precipitation in Lianyungang area from 1951 to 2012 and various climate signal data from the National Climate Center website and the NOAA website,a model for predicting whether the number of rainstorm days in summer in Lianyungang area is large was established by the classical C5. 0 decision tree algorithm. The data samples in 48 years( accounting for about 80% of total number of samples)was as the training set of a model,and the training accuracy rate of the model was 95. 83%. The data samples in the remaining 14 years( accounting for about 20% of total number of samples) were used as the test set of the model to test the model,and the test accuracy of the model was 85. 71%. The results showed that the prediction model of number of rainstorm days in summer constructed by C5. 0 algorithm had high accuracy and was easy to explain. Moreover,it is convenient for meteorological staff to use directly. At the same time,this study provides a new idea for short-term climate prediction of number of rainstorm days in summer. 展开更多
关键词 C5. 0 algorithm NUMBER of RAINSTORM DAYS PREDICTION model
下载PDF
采用混合策略联合优化的模糊C-均值聚类信息熵点云简化算法 被引量:1
8
作者 黄鹤 黄佳慧 +2 位作者 刘国权 王会峰 高涛 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期214-226,共13页
针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时... 针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时融合了精英反向化思路,显著提升了鹈鹕优化算法(POA)的收敛趋势和全局寻优能力,提高了寻找FCM最优聚类中心的成功率;利用DEAMPOA结合加权熵法对FCM进行优化,提高鲁棒性的同时增强了搜索精度,得到较好的聚类结果;在8种UCI标准数据集上与4种算法对比进行聚类性能评估实验,验证了所提方法综合性能优越;将所提方法与信息熵融合,并应用在三维点云KITTI数据集简化中。实验结果表明:与包围框简化法、随机采样简化法和特征选择简化法对比,所提方法全局误差简化前后点集之间平均欧式距离(MED)指标分别降低了2.25%、6.93%、5.74%,点云简化效果最优且运行速度满足要求。 展开更多
关键词 C-均值聚类 鹈鹕优化算法 点云简化 信息熵
下载PDF
面向卫星常规测控任务的地面站资源调度 被引量:1
9
作者 李婷 贾鹏德 +2 位作者 杨宇 廖川 张逢贵 《系统仿真技术》 2024年第1期65-72,共8页
卫星测控任务的地面站资源调度问题是在特定的时间和约束条件下,根据卫星的常规任务要求,为卫星分配相应的地面站资源,从而得到能够满足卫星任务要求的资源分配和调度方案。基于实际应用,分析卫星测控任务的调度问题,考虑资源调度过程... 卫星测控任务的地面站资源调度问题是在特定的时间和约束条件下,根据卫星的常规任务要求,为卫星分配相应的地面站资源,从而得到能够满足卫星任务要求的资源分配和调度方案。基于实际应用,分析卫星测控任务的调度问题,考虑资源调度过程中涉及的卫星时间约束和资源约束,建立卫星测控任务中地面站资源调度的数学模型。设计2个阶段遗传算法,第一阶段选择卫星执行任务的圈数,第二阶段选择任务弧段,逐步减小搜索的解空间。仿真研究结果表明,2个阶段遗传算法能够较好地解决多卫星多约束的测控资源调度问题。 展开更多
关键词 卫星测控 资源调度 遗传算法
下载PDF
优化聚类分簇结合自适应中继策略的双簇首WSNs路由算法
10
作者 张晶 高翔 张宏 《小型微型计算机系统》 CSCD 北大核心 2024年第4期1007-1017,共11页
针对无线传感器网络中分簇路由算法节点能量利用率低、能量消耗不均匀等问题,提出了一种优化聚类分簇结合自适应中继策略的双簇首无线传感器网络路由算法.该算法对分簇路由协议中的三个阶段分别进行优化设计.成簇阶段,首先对双簇首模型... 针对无线传感器网络中分簇路由算法节点能量利用率低、能量消耗不均匀等问题,提出了一种优化聚类分簇结合自适应中继策略的双簇首无线传感器网络路由算法.该算法对分簇路由协议中的三个阶段分别进行优化设计.成簇阶段,首先对双簇首模型下最优成簇规模与网络能耗的关系进行理论分析,然后使用改进的算术优化算法计算模糊C均值算法的初始聚类中心,提高了模糊C均值算法聚类成簇的准确率和鲁棒性.簇首选举阶段,引入双簇首策略,以节点的位置、能量和中心度为影响因子,根据承担任务的不同分别为内外簇首设计独立的簇首评价函数,以评价值为依据由节点分布式动态选举簇首减少了广播数量,同时可以将整个簇的能量负载平均分配到每个簇成员节点中.数据传输阶段,设置了多跳中继策略的距离适用条件,并以能量消耗速率为依据选择中继节点,避免了节点提前过载.仿真结果表明:在多种规模的网络中,该算法相较于对比算法在均衡网络负载、提高能量利用效率方面效果更好,从而延长了网络的有效感测时间. 展开更多
关键词 无线传感器网络 分簇路由算法 模糊C均值 算术优化算法 能耗优化
下载PDF
不确定条件下大型铁路建设工程的物资储备基地选址优化
11
作者 张锦 杨文广 +3 位作者 孙文杰 申皓 洪治潮 李国旗 《中国安全科学学报》 CAS CSCD 北大核心 2024年第6期197-206,共10页
为提升复杂环境下铁路建设工程物流设施网络的可靠性,首先,使用情景削减技术生成最小中断情景子集及其中断概率,以描述运输通道的中断情景;然后,采用多面体不确定集刻画物流需求的不确定性,以运输成本、建设成本、运营成本以及惩罚成本... 为提升复杂环境下铁路建设工程物流设施网络的可靠性,首先,使用情景削减技术生成最小中断情景子集及其中断概率,以描述运输通道的中断情景;然后,采用多面体不确定集刻画物流需求的不确定性,以运输成本、建设成本、运营成本以及惩罚成本等综合成本最低为目标,应用两阶段的随机优化技术与鲁棒优化技术,构建物资储备基地选址不确定优化模型,并基于一种列与约束生成(C&CG)算法求解模型;最后,以复杂环境下的C铁路建设工程为例,验证模型和算法的有效性。结果表明:在随机中断情景中,模型获取方案的成本变异系数是传统模型的4.3%,在极端需求波动情况下,模型获取方案的成本波动幅度可达传统模型的38%,两阶段不确定优化模型能有效减少物流设施网络因运输通道中断及需求波动导致的成本变动。 展开更多
关键词 铁路建设工程 物资储备基地 选址优化 工程物流 情景削减 鲁棒优化 列与约束生成(C&CG)算法
下载PDF
基于UWB的室内物料搬运机器人设计
12
作者 李延平 刘杰 +3 位作者 苏焱鸿 张优优 谢斌 肖宇 《机电技术》 2024年第4期73-78,84,共7页
文章针对目前室内物料搬运机器人的定位精度低、在获取机器人的姿态信息时对IMU或其他导航器件的依赖性很大等问题,基于UWB设计了一种室内物料搬运机器人。文章从硬件与软件两个方面对机器人进行设计,该机器人导航不需要用到IMU等相关器... 文章针对目前室内物料搬运机器人的定位精度低、在获取机器人的姿态信息时对IMU或其他导航器件的依赖性很大等问题,基于UWB设计了一种室内物料搬运机器人。文章从硬件与软件两个方面对机器人进行设计,该机器人导航不需要用到IMU等相关器件,即可获取机器人的实时姿态信息,并且能够使机器人完成物料运送等工作。设计采用TDOA定位算法实现机器人的定位,通过改进的K-C算法提升定位精度,基于UWB的机器人姿态解算算法获取得到机器人的机体姿态数据,经试验验证了该算法的有效性和机器人的可靠性。 展开更多
关键词 UWB 搬运机器人 定位导航 K-C算法
下载PDF
基于GWO-VMD的涡轮叶片特征提取
13
作者 冯驰 唐林伊 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第4期387-396,共10页
燃气轮机涡轮叶片是燃气轮机的重要组成部分,长期工作在高温、高压、高速的恶劣环境下,健康的涡轮叶片能够保证燃气轮机高效率地工作.温度是反映燃气轮机涡轮叶片状态的关键参数,在涡轮叶片发生涂层脱落、断裂等故障时,叶片表面温度会... 燃气轮机涡轮叶片是燃气轮机的重要组成部分,长期工作在高温、高压、高速的恶劣环境下,健康的涡轮叶片能够保证燃气轮机高效率地工作.温度是反映燃气轮机涡轮叶片状态的关键参数,在涡轮叶片发生涂层脱落、断裂等故障时,叶片表面温度会发生变化,为了衡量涡轮叶片的健康状态,采用了温度这一叶片质量的重要指标,对数据预处理并进行特征提取,将涡轮叶片特征聚类.基于GWO-VMD提取叶片温度信号经分解后各IMF分量的4种熵特征,使用PCA对提取到的叶片特征进行降维,将降维后的特征送入FCM聚类算法,通过SSE和轮廓系数得到最佳聚类个数,实现对叶片特征的聚类.聚类效果表明,该特征提取方法能够较好地区分不同涡轮叶片的健康状态,为涡轮叶片健康监测的研究提供了一定思路. 展开更多
关键词 涡轮叶片 特征提取 灰狼优化算法 变分模态分解 模糊C均值聚类
下载PDF
基于FCM及快速迭代收缩阈值算法的平面ECT图像重建
14
作者 张立峰 唐志浩 《计量学报》 CSCD 北大核心 2024年第6期899-906,共8页
为提高平面阵列电容成像系统的成像精度,提出一种基于模糊C均值聚类(FCM)进行数据优化的快速迭代收缩阈值算法(FISTA)。根据平面阵列电容数据的特点,首先利用FCM算法对测量电容值进行分类,保留有效电容值,实现电容向量降维;然后利用离... 为提高平面阵列电容成像系统的成像精度,提出一种基于模糊C均值聚类(FCM)进行数据优化的快速迭代收缩阈值算法(FISTA)。根据平面阵列电容数据的特点,首先利用FCM算法对测量电容值进行分类,保留有效电容值,实现电容向量降维;然后利用离散小波基(DWT)对灰度值进行稀疏表示,并建立L1正则化模型,采用FISTA进行求解,以实现图像重建;最后将FCM处理后的电容值分别用于Landweber算法、Tikhonov算法进行重建对比。仿真与实验结果表明,该算法重建图像的平均相对误差约为0.0527,平均相关系数约为0.9422,均优于其它算法,且重建图像伪影较少,更接近真实情况;因此,所提算法具有更好的重建效果。。 展开更多
关键词 电容层析成像 平面阵列电容 图像重建 模糊C均值聚类 快速迭代收缩阈值算法 缺陷检测
下载PDF
基于改进FCM的冲压件缺陷图像分割算法
15
作者 张玉杰 高晗 《计算机工程》 CAS CSCD 北大核心 2024年第10期342-351,共10页
在工业质检过程中,冲压件缺陷图像分割作为缺陷检测的重要环节,直接影响缺陷检测效果。而传统的模糊C均值(FCM)聚类算法未考虑到空间邻域信息,对于噪声干扰较为敏感,导致分割精度较差,且其整体易受初始值的影响,造成收敛速度变慢。针对... 在工业质检过程中,冲压件缺陷图像分割作为缺陷检测的重要环节,直接影响缺陷检测效果。而传统的模糊C均值(FCM)聚类算法未考虑到空间邻域信息,对于噪声干扰较为敏感,导致分割精度较差,且其整体易受初始值的影响,造成收敛速度变慢。针对上述问题,提出一种改进的FCM算法。采用内核诱导距离中的简单两项代替传统的欧氏距离,将原有的空间像素映射到高维特征空间,提高线性可分概率和计算速度;利用图像像素之间的空间相关性,通过引入改进的马尔可夫随机场对FCM目标函数进行修正,提高算法的抗噪能力以及分割精度;采用秃鹰搜索(BES)算法确定FCM的初始聚类中心,提高算法的收敛速度,同时避免算法陷入局部极值的情况。为验证改进FCM算法的性能,选取划分熵、划分系数、Xie_Beni系数以及迭代次数作为评价指标,并与近年来先进的图像分割算法进行对比。实验结果表明,改进FCM算法具有更好的抗噪能力,能得到更好的缺陷分割效果,对工业生产中的冲压件缺陷检测有一定的应用价值。 展开更多
关键词 模糊C均值聚类 工业应用 冲压件缺陷 内核诱导距离 马尔可夫随机场 秃鹰搜索算法
下载PDF
C5.0算法的改进及应用 被引量:11
16
作者 罗丽娟 段隆振 +1 位作者 段文影 刘萍 《南昌大学学报(工科版)》 CAS 2017年第1期92-97,共6页
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建... C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。 展开更多
关键词 c5.0算法 信息增益率 置信区间 权重调整 信贷逾期
下载PDF
基于C5.0算法的胃癌生存预测模型研究 被引量:6
17
作者 黄志刚 刘虹 +1 位作者 刘娟 张岐山 《南京信息工程大学学报(自然科学版)》 CAS 2017年第4期406-410,共5页
我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库... 我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库进行预测实验.实验结果表明:C5.0预测的精确度、特异性均高于BP-神经网络算法;胃癌患者的出生地点与最终的存活状态之间存在较强的相关性.该研究是数据挖掘技术在医学领域的一个实际应用,对胃癌的临床诊断具有一定的参考价值,可为医生制定合理的治疗和预防方案提供一定参考. 展开更多
关键词 数据挖掘 c5.0分类算法 胃癌 生存预测 SEER数据库
下载PDF
改进Relief-C5.0的恶意域名检测算法 被引量:5
18
作者 马栋林 张澍寰 赵宏 《计算机工程与应用》 CSCD 北大核心 2022年第11期100-106,共7页
针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行... 针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行优先级排序;选取权重值排名前20的关键特征作为C5.0分类器的输入端,进行合法域名与恶意域名的分类。实验结果表明,在大样本数据集下,Rf-C5模型与当前主流恶意域名检测算法相比,在提高平均检测速率的基础上,检测准确率提高了1.58~4.91个百分点。 展开更多
关键词 恶意域名 URL特征 改进的Relief算法 c5.0分类器
下载PDF
基于C5.0与Apriori算法的森林生物量等级评价与因子关联分析 被引量:2
19
作者 王霓虹 高萌 +1 位作者 李丹 刘立臣 《中南林业科技大学学报》 CAS CSCD 北大核心 2015年第3期1-6,共6页
针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进... 针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进一步利用Apriror算法进行生物量强影响因子的关联规则挖掘。结果表明:生物量决策树模型的分类预测精度为88.78%,生物量影响因子的量化结果分别为树高(0.348)、胸径(0.225)、林分类型(0.196)、龄级(0.162)、郁闭度(0.134)、坡度(0.096)、海拔(0.074)、坡向(0.065)、立地类型(0.052)和坡位(0.037);得到707条置信度在80%以上、支持度在10%以上的因子关联规则,揭示了生物量影响因子间的隐含关联关系。建立的生物量决策树模型能为快速的区域生物量预测和评价提供模型参考,建立的关联规则评估模型能够为以碳汇为目标的森林生产与经营提供客观评价指标。 展开更多
关键词 森林生物量评价 生物量影响因子 c5.0算法 APRIORI算法 关联分析
下载PDF
基于C5.0决策树分类算法的ETM+影像信息提取 被引量:32
20
作者 温兴平 胡光道 杨晓峰 《地理与地理信息科学》 CSCD 北大核心 2007年第6期26-29,共4页
利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高... 利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高分类精度。研究发现,C5.0决策树算法用未处理的资料生成决策树的效果较差,而经大气校正和数据融合后计算出NDVI、NDBI及缨帽变换的前3个分量的组合数据生成的决策树深度最小,并且分类精度最高。 展开更多
关键词 c5.0决策树算法 ETM+遥感影像 信息提取
下载PDF
上一页 1 2 108 下一页 到第
使用帮助 返回顶部