期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
Landslide susceptibility zonation method based on C5.0 decision tree and K-means cluster algorithms to improve the efficiency of risk management 被引量:17
1
作者 Zizheng Guo Yu Shi +2 位作者 Faming Huang Xuanmei Fan Jinsong Huang 《Geoscience Frontiers》 SCIE CAS CSCD 2021年第6期243-261,共19页
Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study pres... Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study presents a machine learning approach based on the C5.0 decision tree(DT) model and the K-means cluster algorithm to produce a regional landslide susceptibility map. Yanchang County, a typical landslide-prone area located in northwestern China, was taken as the area of interest to introduce the proposed application procedure. A landslide inventory containing 82 landslides was prepared and subsequently randomly partitioned into two subsets: training data(70% landslide pixels) and validation data(30% landslide pixels). Fourteen landslide influencing factors were considered in the input dataset and were used to calculate the landslide occurrence probability based on the C5.0 decision tree model.Susceptibility zonation was implemented according to the cut-off values calculated by the K-means cluster algorithm. The validation results of the model performance analysis showed that the AUC(area under the receiver operating characteristic(ROC) curve) of the proposed model was the highest, reaching 0.88,compared with traditional models(support vector machine(SVM) = 0.85, Bayesian network(BN) = 0.81,frequency ratio(FR) = 0.75, weight of evidence(WOE) = 0.76). The landslide frequency ratio and frequency density of the high susceptibility zones were 6.76/km^(2) and 0.88/km^(2), respectively, which were much higher than those of the low susceptibility zones. The top 20% interval of landslide occurrence probability contained 89% of the historical landslides but only accounted for 10.3% of the total area.Our results indicate that the distribution of high susceptibility zones was more focused without containing more " stable" pixels. Therefore, the obtained susceptibility map is suitable for application to landslide risk management practices. 展开更多
关键词 Landslide susceptibility Frequency ratio c5.0 decision tree K-means cluster classification Risk management
下载PDF
A NOVEL CLASSIFICATION METHOD FOR TROPICAL CYCLONE INTENSITY CHANGE ANALYSIS BASED ON HIERARCHICAL PARTICLE SWARM OPTIMIZATION ALGORITHM
2
作者 耿焕同 孙家清 +1 位作者 张伟 吴正雪 《Journal of Tropical Meteorology》 SCIE 2017年第1期113-120,共8页
Based on the tropical cyclone(TC) observations in the western North Pacific from 2000 to 2008, this paper adopts the particle swarm optimization(PSO) algorithm of evolutionary computation to optimize one comprehensive... Based on the tropical cyclone(TC) observations in the western North Pacific from 2000 to 2008, this paper adopts the particle swarm optimization(PSO) algorithm of evolutionary computation to optimize one comprehensive classification rule, and apply the optimized classification rule to the forecasting of TC intensity change. In the process of the optimization, the strategy of hierarchical pruning has been adopted in the PSO algorithm to narrow the search area,and thus to enhance the local search ability, i.e. hierarchical PSO algorithm. The TC intensity classification rule involves core attributes including 12-HMWS, MPI, and Rainrate which play vital roles in TC intensity change. The testing accuracy using the new mined rule by hierarchical PSO algorithm reaches 89.6%. The current study shows that the novel classification method for TC intensity change analysis based on hierarchic PSO algorithm is not only easy to explain the source of rule core attributes, but also has great potential to improve the forecasting of TC intensity change. 展开更多
关键词 tropical cyclone intensity hierarchical PSO algorithm classification and forecasting C4 5 algorithm
下载PDF
考虑数据分类的建筑电能耗集成预测方法
3
作者 唐倩倩 李康吉 +1 位作者 魏伯睿 王莹 《电力需求侧管理》 2024年第2期77-81,共5页
建筑侧各类可再生能源的应用日益普及,建筑电能耗预测在用能供需平衡、电网稳定运行、尖峰需求响应等方面发挥越来越重要作用。尽管诸多数据驱动模型在能耗预测方面获得广泛应用,当前仍缺乏预测精度高、泛化能力强的短期预测模型。针对... 建筑侧各类可再生能源的应用日益普及,建筑电能耗预测在用能供需平衡、电网稳定运行、尖峰需求响应等方面发挥越来越重要作用。尽管诸多数据驱动模型在能耗预测方面获得广泛应用,当前仍缺乏预测精度高、泛化能力强的短期预测模型。针对该问题,提出一种基于建筑物能耗特点并结合数据挖掘技术的分类集成式能耗预测方法。首先,采用递归特征消除法对数据进行特征筛选,并用模糊C均值聚类算法对训练集数据进行聚类,使用K最邻近法对验证集和测试集数据进行归类;选择5种结合智能优化算法的混合数据驱动模型作为子学习器,分别对每类数据做预测,最后使用多元线性回归法进行结果集成。经3个建筑电力用能案例验证,此集成预测模型精度均优于单个子模型,具有适用不同建筑类型和用能尺度的预测潜力。 展开更多
关键词 建筑 电能耗预测 数据分类 递归特征消除法 模糊C均值聚类算法
下载PDF
A Hybrid Multifarious Clustering Algorithm for the Analysis of Memmogram Images
4
作者 T. Velmurugan E. Venkatesan 《Journal of Computer and Communications》 2019年第12期136-151,共16页
A number of clustering algorithms were used to analyze many databases in the field of image clustering. The main objective of this research work was to perform a comparative analysis of the two of the existing partiti... A number of clustering algorithms were used to analyze many databases in the field of image clustering. The main objective of this research work was to perform a comparative analysis of the two of the existing partitions based clustering algorithms and a hybrid clustering algorithm. The results verification done by using classification algorithms via its accuracy. The perfor-mance of clustering and classification algorithms were carried out in this work based on the tumor identification, cluster quality and other parameters like run time and volume complexity. Some of the well known classification algorithms were used to find the accuracy of produced results of the clustering algorithms. The performance of the clustering algorithms proved mean-ingful in many domains, particularly k-Means, FCM. In addition, the proposed multifarious clustering technique has revealed their efficiency in terms of performance in predicting tumor affected regions in mammogram images. The color images are converted in to gray scale images and then it is processed. Finally, it is identified the best method for the analysis of finding tumor in breast images. This research would be immensely useful to physicians and radiologist to identify cancer affected area in the breast. 展开更多
关键词 MEDICAL IMAGES HYBRID Clusteing algorithm K-MEANS algorithm Fuzzy C Means algorithm classification algorithms
下载PDF
Data mining and well logging interpretation: application to a conglomerate reservoir 被引量:8
5
作者 石宁 李洪奇 罗伟平 《Applied Geophysics》 SCIE CSCD 2015年第2期263-272,276,共11页
Data mining is the process of extracting implicit but potentially useful information from incomplete, noisy, and fuzzy data. Data mining offers excellent nonlinear modeling and self-organized learning, and it can play... Data mining is the process of extracting implicit but potentially useful information from incomplete, noisy, and fuzzy data. Data mining offers excellent nonlinear modeling and self-organized learning, and it can play a vital role in the interpretation of well logging data of complex reservoirs. We used data mining to identify the lithologies in a complex reservoir. The reservoir lithologies served as the classification task target and were identified using feature extraction, feature selection, and modeling of data streams. We used independent component analysis to extract information from well curves. We then used the branch-and- bound algorithm to look for the optimal feature subsets and eliminate redundant information. Finally, we used the C5.0 decision-tree algorithm to set up disaggregated models of the well logging curves. The modeling and actual logging data were in good agreement, showing the usefulness of data mining methods in complex reservoirs. 展开更多
关键词 Data mining well logging interpretation independent component analysis branch-and-bound algorithm c5.0 decision tree
下载PDF
基于主成分分析的FCM法在泥石流分类中的应用 被引量:20
6
作者 张文 陈剑平 +3 位作者 秦胜伍 张晨 李明 马建全 《吉林大学学报(地球科学版)》 EI CAS CSCD 北大核心 2010年第2期368-372,共5页
选取流域面积、最大高差等12个传统泥石流沟评价因素和圆度、平均长度等4个沟谷形态统计要素对泥石流性质进行评价;利用主成分分析法对分析因素进行降维,将16个分析因素降维形成线性无关的6个主成分,大大减小了分析的复杂性,并且证明了... 选取流域面积、最大高差等12个传统泥石流沟评价因素和圆度、平均长度等4个沟谷形态统计要素对泥石流性质进行评价;利用主成分分析法对分析因素进行降维,将16个分析因素降维形成线性无关的6个主成分,大大减小了分析的复杂性,并且证明了考虑沟谷形态统计要素的必要性;并利用FCM法(模糊C-均值聚类法)对研究区域27条泥石流沟进行分类,把泥石流沟分为3类。结合分类结果及现场调查,证明分类结果与现场的实际情况吻合较好,并针对不同的分类提出泥石流防护措施的建议。 展开更多
关键词 主成分分析 FCM 泥石流 分类
下载PDF
基于人工鱼群算法和模糊C-均值聚类的洪水分类方法 被引量:30
7
作者 汪丽娜 陈晓宏 +1 位作者 李粤安 林凯荣 《水利学报》 EI CSCD 北大核心 2009年第6期743-748,755,共7页
为了克服模糊C-均值聚类(FCM)算法依赖初值的缺点,引入人工鱼群算法(AFS)建立一种新的聚类算法,应用于洪水分类研究。该算法将聚类中心看作食物源,通过样本抽样产生初始鱼群,利用人工鱼群算法能全局寻优和快速收敛的特点,得到一个较优... 为了克服模糊C-均值聚类(FCM)算法依赖初值的缺点,引入人工鱼群算法(AFS)建立一种新的聚类算法,应用于洪水分类研究。该算法将聚类中心看作食物源,通过样本抽样产生初始鱼群,利用人工鱼群算法能全局寻优和快速收敛的特点,得到一个较优的初始聚类结果,再使用FCM算法进行局部搜索,以避免因初值选取不当,而有可能陷入局部最小的缺陷。该方法应用于对西江流域洪水资料的分析结果表明,新算法具有比FCM算法更好的性能表现,使得到的分类结果更加准确合理。 展开更多
关键词 人工鱼群算法 模糊C-均值聚类算法 洪水分类
下载PDF
基于改进模糊C均值算法的电力负荷特性分类 被引量:35
8
作者 周开乐 杨善林 《电力系统保护与控制》 EI CSCD 北大核心 2012年第22期58-63,共6页
为了提高负荷分类的精确性和有效性,提出了将基于模拟退火遗传算法的模糊C均值(Simulated Annealing Genetic Algorithm Based Fuzzy C-Means,SAGA-FCM)算法用于电力系统负荷特性分类。SAGA-FCM算法以模糊C均值(Fuzzy C-Means,FCM)算法... 为了提高负荷分类的精确性和有效性,提出了将基于模拟退火遗传算法的模糊C均值(Simulated Annealing Genetic Algorithm Based Fuzzy C-Means,SAGA-FCM)算法用于电力系统负荷特性分类。SAGA-FCM算法以模糊C均值(Fuzzy C-Means,FCM)算法为基础,融合了模拟退火算法较强的局部搜索能力和遗传算法较强的全局搜索能力,克服了传统FCM算法对初始聚类中心敏感和容易陷入局部最优的问题。将其与系统聚类法、K均值(K-Means)算法和传统FCM算法分别用于电力系统负荷特性分类实验,对比分析表明了SAGA-FCM算法用于负荷特性分类的有效性和优越性。 展开更多
关键词 负荷分类 SAGA-FCM算法 模糊C均值算法 聚类
下载PDF
基于模糊C均值聚类算法和贝叶斯判别函数研究深水油藏分类评价 被引量:14
9
作者 丁帅伟 姜汉桥 +2 位作者 陈民锋 罗银富 汤国平 《西安石油大学学报(自然科学版)》 CAS 北大核心 2014年第2期43-49,8-9,共7页
针对目前深水油藏分类评价研究现状的不足,基于模糊C均值聚类算法和贝叶斯判别函数,建立了深水油藏指标选择标准和分类评价体系。优选世界三大深水油气区19例油田的特征属性参数作为典型样品集,采用模糊聚类分析对深水油藏进行了分类,... 针对目前深水油藏分类评价研究现状的不足,基于模糊C均值聚类算法和贝叶斯判别函数,建立了深水油藏指标选择标准和分类评价体系。优选世界三大深水油气区19例油田的特征属性参数作为典型样品集,采用模糊聚类分析对深水油藏进行了分类,在此基础上,应用贝叶斯判别决策理论,建立了深水油藏分类评价的定量判别关系,对未知类型的深水油藏进行了定量分类评价。实例结果表明,应用模糊C均值聚类算法和贝叶斯判别函数相结合进行深水油藏分类评价是有效的,该分类评价体系考虑的油藏参数更为全面,分类结果更为明显,对于深水油田的开发具有一定的指导意义。 展开更多
关键词 深水油藏 油藏分类评价 模糊C均值聚类算法 贝叶斯判别函数
下载PDF
近邻样本密度和隶属度加权FCM算法的遥感图像分类方法 被引量:12
10
作者 刘小芳 何彬彬 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第10期2242-2247,共6页
针对FCM算法具有对数据集进行等划分趋势的缺陷,利用样本本身的近邻分布特性,提出近邻样本密度加权FCM(NSD-WFCM)、近邻样本隶属度加权FCM(NSM-WFCM)以及近邻样本密度和隶属度加权FCM(NSDM-WFCM)算法,并应用于遥感图像分类。对比FCM算法... 针对FCM算法具有对数据集进行等划分趋势的缺陷,利用样本本身的近邻分布特性,提出近邻样本密度加权FCM(NSD-WFCM)、近邻样本隶属度加权FCM(NSM-WFCM)以及近邻样本密度和隶属度加权FCM(NSDM-WFCM)算法,并应用于遥感图像分类。对比FCM算法,NSD-WFCM、NSM-WFCM和NSDM-WFCM算法的总体分类精度和Kappa系数分别提高了5.67%、7.50%和11.17%;8.50%、11.25%和16.75%。实验结果表明:这些加权方法都在一定程度上克服了FCM算法的缺陷,提高了遥感图像的无监督分类能力,其中,NSM-WFCM算法的分类性能优于NSD-WFCM算法的分类性能,NSDM-WFCM算法分类性能最好。 展开更多
关键词 遥感图像分类 FCM算法 加权FCM算法 近邻样本密度 近邻样本隶属度
下载PDF
基于PSO的模糊聚类算法 被引量:17
11
作者 许磊 张凤鸣 《计算机工程与设计》 CSCD 北大核心 2006年第21期4128-4129,共2页
提出了一种基于模糊C-均值算法和粒子群算法的混合聚类算法。该算法结合PSO的全局搜索和FCM局部搜索的特点,将PSO优化聚类结果作为后续FCM算法的初始值,有效地克服了FCM对初始值敏感、易陷入局部最优和PSO算法局部搜索较弱的问题,同时... 提出了一种基于模糊C-均值算法和粒子群算法的混合聚类算法。该算法结合PSO的全局搜索和FCM局部搜索的特点,将PSO优化聚类结果作为后续FCM算法的初始值,有效地克服了FCM对初始值敏感、易陷入局部最优和PSO算法局部搜索较弱的问题,同时增强了跳出局部最优的能力。实验表明,新算法得到的目标函数值更小,并能减小分类错误率,聚类效果优于单一使用FCM或PSO。 展开更多
关键词 混合聚类 粒子群优化算法 模糊C-均值算法 全局优化 分类错误率
下载PDF
基于半监督核模糊c-均值算法的北京一号小卫星多光谱图像分类 被引量:9
12
作者 刘小芳 何彬彬 李小文 《测绘学报》 EI CSCD 北大核心 2011年第3期301-306,325,共7页
针对遥感图像数据大多不服从高斯分布以及遥感图像分类存在非线性、模糊性和标记数据少等问题,提出基于半监督核模糊c-均值算法的多光谱遥感图像分类方法。首先,把半监督学习理论和核理论同时引入模糊c-均值算法,形成半监督核模糊c-均... 针对遥感图像数据大多不服从高斯分布以及遥感图像分类存在非线性、模糊性和标记数据少等问题,提出基于半监督核模糊c-均值算法的多光谱遥感图像分类方法。首先,把半监督学习理论和核理论同时引入模糊c-均值算法,形成半监督核模糊c-均值算法。然后,用该算法与k-均值算法、最大似然算法、多类支持向量、半监督核支持向量、模糊c-均值算法、核模糊c-均值算法和半监督模糊c-均值算法对IRIS数据和北京一号小卫星多光谱图像进行分类试验。最后,对其分类结果进行评价。结果表明,对比其他分类算法,半监督核模糊c-均值算法能显著提高分类精度。 展开更多
关键词 遥感图像分类 半监督核模糊c-均值算法 北京一号小卫星 核理论 半监督学习
下载PDF
基于不平衡数据的公司破产预测研究 被引量:3
13
作者 周文泳 冯丽霞 段春艳 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第2期283-290,共8页
整合创新数据预处理技术与集成算法利用不平衡数据探讨了公司破产预测问题。首先,运用冗余信息处理方法、不同抽样方法等对不平衡数据进行预处理。其次,以5.0分类器(Classifier 5.0,C5.0)决策树和单隐层前馈神经网络作为基分类器,分别... 整合创新数据预处理技术与集成算法利用不平衡数据探讨了公司破产预测问题。首先,运用冗余信息处理方法、不同抽样方法等对不平衡数据进行预处理。其次,以5.0分类器(Classifier 5.0,C5.0)决策树和单隐层前馈神经网络作为基分类器,分别与三类重抽样数据预处理技术结合,择出最优抽样法。再次,结合自助汇聚法提升分类效果,并运用十折交叉验证的受试者操作特征曲线的下方面积进行评价,对比了两基分类器的集成模型。最后,运用加利福尼亚大学尔湾分校数据库中一万多家波兰制造业公司的实际数据进行实验验证。实验结果表明:欠抽样或人工少数类过采样法与神经网络结合的集成模型分类效果最优,为企业实施破产预测提供积极支撑。 展开更多
关键词 二元分类 不平衡数据 神经网络 c5.0决策树 集成方法
下载PDF
Forecasting Model of Agro-meteorological Disaster Grade Based on Decision Tree 被引量:2
14
作者 司巧梅 《Meteorological and Environmental Research》 CAS 2010年第2期85-87,90,共4页
Based on the discuss of the basic concept of data mining technology and the decision tree method,combining with the data samples of wind and hailstorm disasters in some counties of Mudanjiang region,the forecasting mo... Based on the discuss of the basic concept of data mining technology and the decision tree method,combining with the data samples of wind and hailstorm disasters in some counties of Mudanjiang region,the forecasting model of agro-meteorological disaster grade was established by adopting the C4.5 classification algorithm of decision tree,which can forecast the direct economic loss degree to provide rational data mining model and obtain effective analysis results. 展开更多
关键词 Data mining Agro-meteorology Decision tree C4.5 algorithm classification mining China
下载PDF
改进的最大熵权值算法在文本分类中的应用 被引量:8
15
作者 李学相 《计算机科学》 CSCD 北大核心 2012年第6期210-212,共3页
由于传统算法存在着特征词不明确、分类结果有重叠、工作效率低的缺陷,为了解决上述问题,提出了一种改进的最大熵文本分类方法。最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果。提出的... 由于传统算法存在着特征词不明确、分类结果有重叠、工作效率低的缺陷,为了解决上述问题,提出了一种改进的最大熵文本分类方法。最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果。提出的方法充分结合了均值聚类和最大熵值算法的优点,算法首先以香农熵作为最大熵模型中的目标函数,简化分类器的表达形式,然后采用均值聚类算法对最优特征进行分类。经过实验论证,所提出的新算法能够在较短的时间内获得分类后得到的特征集,大大缩短了工作的时间,同时提高了工作的效率。 展开更多
关键词 文本分类 最大熵算法 均值聚类 特征选择
下载PDF
SAR图像的检测和分类方法 被引量:3
16
作者 龚婕 杨士元 《北京邮电大学学报》 EI CAS CSCD 北大核心 2005年第4期99-102,共4页
从理论上分析了图像灰度共生矩阵和灰度共生矩阵的多个统计量.提出了一种基于灰度共生矩阵的C-均值聚类算法,用于对合成孔径雷达(SAR)图像的分类.通过真实的SAR图像,在实验中分析了各统计量的性能.分析表明,熵、方差、对比度、差平均的... 从理论上分析了图像灰度共生矩阵和灰度共生矩阵的多个统计量.提出了一种基于灰度共生矩阵的C-均值聚类算法,用于对合成孔径雷达(SAR)图像的分类.通过真实的SAR图像,在实验中分析了各统计量的性能.分析表明,熵、方差、对比度、差平均的性能较好.采用这几个统计量作为特征量进行分类,得到了较好的分类结果,很好地保持了类间距,同时使类内方差较小. 展开更多
关键词 灰度共生矩阵 合成孔径雷达 分类 G均值聚类
下载PDF
基于独立分量分析的极化SAR图像非监督分类方法 被引量:3
17
作者 付毓生 谢艳 +1 位作者 皮亦鸣 侯印鸣 《电波科学学报》 EI CSCD 北大核心 2007年第2期255-260,共6页
提出了一种针对极化合成孔径雷达(SAR)图像的新的分类方法——基于独立分量分析(ICA)的非监督分类方法。该方法将ICA和基于模糊集理论的非监督分类方法结合起来。用ICA方法对原始极化SAR图像进行特征提取,并用模糊C均值(FCM)算法对提取... 提出了一种针对极化合成孔径雷达(SAR)图像的新的分类方法——基于独立分量分析(ICA)的非监督分类方法。该方法将ICA和基于模糊集理论的非监督分类方法结合起来。用ICA方法对原始极化SAR图像进行特征提取,并用模糊C均值(FCM)算法对提取出的独立分量图像进行分类。该算法可对极化SAR图像进行自动分类,并减少由相干斑噪声所引起的分类错误,且其收敛速度快、稳定性高。采用SIR-C/X-SAR数据的试验证明了该算法的有效性。 展开更多
关键词 雷达极化 合成孔径雷达 独立分量分析 主分量分析 峰起度 非监督分类 模糊C均值算法
下载PDF
基于改进的模糊c-均值聚类算法的负荷特性指标分析与分类 被引量:3
18
作者 李文华 贾玉雯 范新涛 《燕山大学学报》 CAS 北大核心 2016年第3期230-235,共6页
负荷侧管理是利用不同特性负荷作为需求响应资源,对具有多样性和复杂性的负荷种类进行较高精度的分类,提高负荷曲线的相似度,便于组合优化。为了对实际负荷更加精确地分类,提出一种基于改进的模糊c-均值聚类算法的负荷特性指标分类方法... 负荷侧管理是利用不同特性负荷作为需求响应资源,对具有多样性和复杂性的负荷种类进行较高精度的分类,提高负荷曲线的相似度,便于组合优化。为了对实际负荷更加精确地分类,提出一种基于改进的模糊c-均值聚类算法的负荷特性指标分类方法。该算法在聚类分割迭代中采用加权欧氏距离,对每种聚类中心进行负荷特性指标分析,并对各类别中的负荷采用不同控制方法。最后分类结果表明,所提方法使各分类中负荷具有较高相似性,为后续负荷的预测和控制奠定了基础。 展开更多
关键词 负荷分类 模糊C-均值聚类算法 加权欧氏距离 负荷特性指标
下载PDF
面向不平衡数据集融合Canopy和K-means的SMOTE改进算法 被引量:8
19
作者 郭朝有 许喆 +1 位作者 马砚堃 曹蒙蒙 《科学技术与工程》 北大核心 2020年第22期9069-9074,共6页
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,... 针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。 展开更多
关键词 Canopy算法 K-MEANS算法 SMOTE算法 C-K-SMOTE算法 随机森林 不平衡数据集 分类问题
下载PDF
一种高精度高光谱图像分类方案设计 被引量:1
20
作者 魏利峰 纪建伟 《计算机工程与科学》 CSCD 北大核心 2016年第7期1462-1470,共9页
为了有效改善高光谱图像数据分类的精确度,减少对大数目数据集的依赖,在原型空间特征提取方法的基础上,提出一种基于加权模糊C均值算法改进型原型空间特征提取方案。该方案通过加权模糊C均值算法对每个特征施加不同的权重,从而保证提取... 为了有效改善高光谱图像数据分类的精确度,减少对大数目数据集的依赖,在原型空间特征提取方法的基础上,提出一种基于加权模糊C均值算法改进型原型空间特征提取方案。该方案通过加权模糊C均值算法对每个特征施加不同的权重,从而保证提取后的特征含有较高的有效信息量,从而达到减少训练数据集而不降低分类所需信息量的效果。实验结果表明,与业内公认的原型空间提取算法相比,该方案在相对较小的数据集下,其性能仍具有较为理想的稳定性,且具有相对较高的分类精度。 展开更多
关键词 高光谱图像 数据分类 特征提取 加权模糊C均值算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部