期刊文献+
共找到266,752篇文章
< 1 2 250 >
每页显示 20 50 100
Research on Parallel K-Medoids algorithm based on MapReduce
1
作者 Xianli QIN 《International Journal of Technology Management》 2015年第1期26-28,共3页
In order to solve the bottleneck problem of the traditional K-Medoids clustering algorithm facing to deal with massive data information at the time of memory capacity and processing speed of CPU, the paper proposed a ... In order to solve the bottleneck problem of the traditional K-Medoids clustering algorithm facing to deal with massive data information at the time of memory capacity and processing speed of CPU, the paper proposed a parallel algorithm MapReduce programming model based on the research of K-Medoids algorithm. This algorithm increase the computation granularity and reduces the communication cost ratio based on the MapReduce model. The experimental results show that the improved parallel algorithm compared with other algorithms, speedup and operation efficiency is greatly enhanced. 展开更多
关键词 k-medoids MAPREDUCE Parallel computing HADOOP
下载PDF
K-Medoids聚类算法的计算机信息处理技术研究
2
作者 余洋 《信息与电脑》 2024年第11期23-25,共3页
当前计算机信息处理技术在大规模数据集上存在计算效率低下、对噪声和异常值敏感等问题。为了解决这些问题,本文提出了一种改进的K-medoids聚类算法。该方法通过优化初始中心点的选择和更新策略,提高了算法的收敛速度和稳定性,并引入基... 当前计算机信息处理技术在大规模数据集上存在计算效率低下、对噪声和异常值敏感等问题。为了解决这些问题,本文提出了一种改进的K-medoids聚类算法。该方法通过优化初始中心点的选择和更新策略,提高了算法的收敛速度和稳定性,并引入基于密度的聚类评价指标,提高了对噪声数据的鲁棒性。通过在真实和人工数据集上的实验验证,证明了本方法在提高聚类效果和处理大规模数据方面的有效性。 展开更多
关键词 k-medoids 信息处理 聚类分析 技术优化
下载PDF
基于DTW K-medoids与VMD-多分支神经网络的多用户短期负荷预测 被引量:2
3
作者 王宇飞 杜桐 +3 位作者 边伟国 张钊 刘慧婷 杨丽君 《中国电力》 CSCD 北大核心 2024年第6期121-130,共10页
多用户电力负荷预测是指根据历史负荷数据对多个用户或区域的电力负荷进行预测,可使电网企业掌握不同用户或区域的电力需求,以便更好地开展规划和实施调度优化等。然而由于各用户呈现出复杂多样的用电行为,采用传统方法难以进行统一建... 多用户电力负荷预测是指根据历史负荷数据对多个用户或区域的电力负荷进行预测,可使电网企业掌握不同用户或区域的电力需求,以便更好地开展规划和实施调度优化等。然而由于各用户呈现出复杂多样的用电行为,采用传统方法难以进行统一建模并实现快速准确预测。为此,构建了一种基于DTW Kmedoids与VMD-多分支神经网络的多用户短期负荷预测模型。首先,采用DTW K-medoids法进行用户负荷数据聚类,利用动态时间弯曲(dynamic time warping,DTW)计算数据间的距离,取代K-medoids算法中传统的欧氏距离度量方式,以改善多用户负荷聚类的效果;在此基础上,为充分表征负荷历史数据的长短期时序依赖特征,建立了一种基于变分模态分解(variational mode decomposition,VMD)-多分支神经网络模型的并行预测方法,用于多用户短期负荷预测;最后,使用某地区20个用户365天的负荷数据进行聚类、训练和测试实验,结果显示该模型结果的平均绝对误差和均方根误差等指标均较对比模型有较大幅度降低,表明该方法可有效表征多类用户的用电行为,提升多用户负荷预测效率和精度。 展开更多
关键词 多用户 负荷预测 DTW k-medoids聚类 变分模态分解(VMD) 多分支神经网络
下载PDF
基于K-medoids聚类的异构环境多源烟草物流数据集成方法研究
4
作者 郭光根 何蕊 张玉军 《科技创新与应用》 2024年第35期39-43,共5页
由于烟草物流行业在运营过程中涉及的数据来源极其广泛且多样,数据不仅格式各异、结构复杂,而且往往分散存储在不同的信息系统中,导致物流数据在集成的过程中,出现数据吞吐量较低的现象。针对上述现象,提出基于K-medoids聚类的异构环境... 由于烟草物流行业在运营过程中涉及的数据来源极其广泛且多样,数据不仅格式各异、结构复杂,而且往往分散存储在不同的信息系统中,导致物流数据在集成的过程中,出现数据吞吐量较低的现象。针对上述现象,提出基于K-medoids聚类的异构环境多源烟草物流数据集成方法。通过欠采样平衡类别分布,利用数据相关性和阈值清洗剔除冗余信息,提高异构环境多源烟草物流数据质量,设计基于K-medoids聚类的烟草物流数据集成框架,使用迁移学习动态调整源域权重以优化目标域聚类性能,引入带有相似性约束的新数据点作为初始聚类中心,实现异构环境多源烟草物流数据的有效集成。实验结果表明,设计方法通过聚类算法能够将来自不同数据源的数据进行有效分组和整合,降低数据处理的复杂性,提高数据集成的吞吐量。 展开更多
关键词 k-medoids聚类 异构环境 多源数据 烟草物流数据 数据集成方法
下载PDF
油气工程多源信息数据K-medoids聚类集成研究
5
作者 高丽娟 王志伟 +1 位作者 李明江 曲晓慧 《计算机仿真》 2024年第11期127-131,共5页
油气工程领域的信息数据量庞大且源自多元渠道,数据分布广泛且质量参差不齐,直接整合所有数据点进行集成往往会导致信息矩阵质量退化,难以满足实际应用需求,提出基于K-medoids聚类的油气工程多源信息数据集成算法。首先,构建多源数据集... 油气工程领域的信息数据量庞大且源自多元渠道,数据分布广泛且质量参差不齐,直接整合所有数据点进行集成往往会导致信息矩阵质量退化,难以满足实际应用需求,提出基于K-medoids聚类的油气工程多源信息数据集成算法。首先,构建多源数据集,基于决策图选择多源数据代表点;然后基于最近邻近似原则混合代表策略,构建稀疏亲和子矩阵并进行稀疏化处理,结合最近代表快速近似方法获取油气工程多源信息数据的基聚类结果;最后,利用拉格朗日函数对基聚类后的结果赋权,计算聚类成本,完成油气工程多源信息数据的集成。通过实验证明:所提方法对数据集的平均迭代次数较低,CA始终保持在96%以上,NMI值保持在0.94以上,曲线平稳波动幅度较小,说明聚类集成准确性较高,效果较好。 展开更多
关键词 k-medoids聚类 多源信息数据 决策图 稀疏亲和子矩阵 基聚类
下载PDF
基于K-medoids聚类算法的梯级水利枢纽信息资源整合方法
6
作者 刘浩杰 冯庆 +2 位作者 梁建波 何成威 吴鼎 《水利技术监督》 2024年第7期16-19,共4页
在梯级水利枢纽信息资源整合时,传统的算法只能对单源信息进行聚类分析,资源整合效率低。针对上述问题,文章提出基于K-medoids聚类算法的梯级水利枢纽信息资源整合方法。建立一个完善的整合机制,设计水利枢纽信息资源整合模型,该模型能... 在梯级水利枢纽信息资源整合时,传统的算法只能对单源信息进行聚类分析,资源整合效率低。针对上述问题,文章提出基于K-medoids聚类算法的梯级水利枢纽信息资源整合方法。建立一个完善的整合机制,设计水利枢纽信息资源整合模型,该模型能全面有效地整合各种信息资源,确定水利枢纽信息资源的利用系数,通过评估和调整该系数可以优化信息资源的配置和使用。实验证明,该方法可以提高资源整合效率,应用效果良好,具有实际应用价值。 展开更多
关键词 k-medoid聚类算法 水利枢纽信息 资源整合 利用系数
下载PDF
基于k-Medoids聚类和深度学习的分布式短期负荷预测
7
作者 杨玺 陈爽 +2 位作者 彭子睿 高镇 王安龙 《微型电脑应用》 2024年第1期80-83,共4页
为了获得较高的预测精度,提出一种基于k-Medoids聚类和深度学习的分布式短期负荷预测。基于配电变压器的能耗分布,采用k-Medoids聚类将电力负荷数据集中的数据进行聚类,并构建基于深度神经网络(DNN)和长短期记忆网络(LSTM)的短期负荷预... 为了获得较高的预测精度,提出一种基于k-Medoids聚类和深度学习的分布式短期负荷预测。基于配电变压器的能耗分布,采用k-Medoids聚类将电力负荷数据集中的数据进行聚类,并构建基于深度神经网络(DNN)和长短期记忆网络(LSTM)的短期负荷预测模型。在拥有1000个变电站数据子集的武汉配电网络系统中进行验证,验证结果表明,所提的kMedoids聚类可以在减少44%训练时间的基础上拟合出单个变压器预测模型的平均参数,且DNN和LSTM预测模型分别以7.32%和11.15%的平均绝对百分比误差(MAPE)跟踪实际负荷。 展开更多
关键词 短期负荷预测 k-medoids聚类 深度学习 深度神经网络 长短期记忆网络
下载PDF
A State of Art Analysis of Telecommunication Data by k-Means and k-Medoids Clustering Algorithms
8
作者 T. Velmurugan 《Journal of Computer and Communications》 2018年第1期190-202,共13页
Cluster analysis is one of the major data analysis methods widely used for many practical applications in emerging areas of data mining. A good clustering method will produce high quality clusters with high intra-clus... Cluster analysis is one of the major data analysis methods widely used for many practical applications in emerging areas of data mining. A good clustering method will produce high quality clusters with high intra-cluster similarity and low inter-cluster similarity. Clustering techniques are applied in different domains to predict future trends of available data and its uses for the real world. This research work is carried out to find the performance of two of the most delegated, partition based clustering algorithms namely k-Means and k-Medoids. A state of art analysis of these two algorithms is implemented and performance is analyzed based on their clustering result quality by means of its execution time and other components. Telecommunication data is the source data for this analysis. The connection oriented broadband data is given as input to find the clustering quality of the algorithms. Distance between the server locations and their connection is considered for clustering. Execution time for each algorithm is analyzed and the results are compared with one another. Results found in comparison study are satisfactory for the chosen application. 展开更多
关键词 K-MEANS algorithm k-medoids algorithm DATA CLUSTERING Time COMPLEXITY TELECOMMUNICATION DATA
下载PDF
一种高效的K-medoids聚类算法 被引量:47
9
作者 夏宁霞 苏一丹 覃希 《计算机应用研究》 CSCD 北大核心 2010年第12期4517-4519,共3页
针对K-medoids算法初始中心点选择敏感、大数据集聚类应用中性能低下等缺点,提出一个基于初始中心微调与增量中心候选集的改进K-medoids算法。新算法以微调方式优化初始中心,以中心候选集逐步扩展的方式来降低中心轮换的计算复杂性。实... 针对K-medoids算法初始中心点选择敏感、大数据集聚类应用中性能低下等缺点,提出一个基于初始中心微调与增量中心候选集的改进K-medoids算法。新算法以微调方式优化初始中心,以中心候选集逐步扩展的方式来降低中心轮换的计算复杂性。实验结果表明,相对于传统的K-medoids算法,新算法可以提高聚类质量,有效缩短计算时间。 展开更多
关键词 聚类 k-medoids算法 中心微调 增量候选
下载PDF
基于距离不等式的K-medoids聚类算法 被引量:15
10
作者 余冬华 郭茂祖 +3 位作者 刘扬 任世军 刘晓燕 刘国军 《软件学报》 EI CSCD 北大核心 2017年第12期3115-3128,共14页
研究加速K-medoids聚类算法,首先以PAM(partitioning around medoids)、TPAM(triangular inequality elimination criteria PAM)算法为基础给出两个加速引理,并基于中心点之间距离不等式提出两个新加速定理.同时,以O(n+K^2)额外内存空... 研究加速K-medoids聚类算法,首先以PAM(partitioning around medoids)、TPAM(triangular inequality elimination criteria PAM)算法为基础给出两个加速引理,并基于中心点之间距离不等式提出两个新加速定理.同时,以O(n+K^2)额外内存空间开销辅助引理、定理的结合而提出加速SPAM(speed up PAM)聚类算法,使得K-medoids聚类算法复杂度由O(K(n-K)~2)降低至O((n-K)~2).在实际及人工模拟数据集上的实验结果表明:相对于PAM,TPAM,FKMEDOIDS(fast K-medoids)等参考算法均有改进,运行时间比PAM至少提升0.828倍. 展开更多
关键词 数据挖掘 聚类算法 k-medoids 距离不等式
下载PDF
基于粒计算的K-medoids聚类算法 被引量:39
11
作者 马箐 谢娟英 《计算机应用》 CSCD 北大核心 2012年第7期1973-1977,共5页
传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位... 传统K-medoids聚类算法的聚类结果随初始中心点不同而波动,且计算复杂度较高不适于处理大规模数据集;快速K-medoids聚类算法通过选择合适的初始聚类中心改进了传统K-medoids聚类算法,但是快速K-medoids聚类算法的初始聚类中心有可能位于同一类簇。为克服传统K-medoids聚类算法和快速K-medoids聚类算法的缺陷,提出一种基于粒计算的K-medoids聚类算法。算法引入粒度概念,定义新的样本相似度函数,基于等价关系产生粒子,根据粒子包含样本多少定义粒子密度,选择密度较大的前K个粒子的中心样本点作为K-medoids聚类算法的初始聚类中心,实现K-medoids聚类。UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明了基于粒计算的K-medoids聚类算法能得到更好的初始聚类中心,聚类准确率和聚类误差平方和优于传统K-medoids和快速K-medoids聚类算法,具有更稳定的聚类结果,且适用于大规模数据集。 展开更多
关键词 传统k-medoids聚类算法 快速k-medoids聚类算法 粒计算 等价关系 聚类
下载PDF
基于多核平台并行K-Medoids算法研究 被引量:9
12
作者 李静滨 杨柳 华蓓 《计算机应用研究》 CSCD 北大核心 2011年第2期498-500,共3页
分析K-Medoids算法的内在并行性,设计一个适合多核平台的并行算法,并利用OpenMP进行实验。实验结果表明,并行算法对多核环境有很好的适应性,在双核及四核计算机上均获得了较好的加速比与运行效率。
关键词 多核 k-medoids算法 并行算法 OPENMP
下载PDF
一种新的k-medoids聚类算法 被引量:18
13
作者 姚丽娟 罗可 孟颖 《计算机工程与应用》 CSCD 2013年第19期153-157,共5页
针对k-medoids算法对初始聚类中心敏感,聚类精度较低及收敛速度缓慢的缺点,提出一种基于密度初始化、密度迭代的搜索策略和准则函数优化的方法。该算法初始化是在高密度区域内选择k个相对距离较远的样本作为聚类初始中心,有效定位聚类... 针对k-medoids算法对初始聚类中心敏感,聚类精度较低及收敛速度缓慢的缺点,提出一种基于密度初始化、密度迭代的搜索策略和准则函数优化的方法。该算法初始化是在高密度区域内选择k个相对距离较远的样本作为聚类初始中心,有效定位聚类的最终中心点;在k个与初始中心点密度相近的区域内进行中心点替换,以减少候选点的搜索范围;采用类间距和类内距加权的均衡化准则函数,提高聚类精度。实验结果表明,相对于传统的k-mediods算法及某些改进算法,该算法可以提高聚类质量,有效缩短聚类时间。 展开更多
关键词 聚类 k-medoids算法 密度初始化 目标函数
下载PDF
一种基于ACO的K-medoids聚类算法 被引量:9
14
作者 孟颖 罗可 +1 位作者 姚丽娟 王琳 《计算机工程与应用》 CSCD 2012年第16期136-139,152,共5页
K-medoids算法作为聚类算法的一种,不易受极端数据的影响,适应性广泛,但是K-medoids聚类算法的精确度不稳定,平均准确率较低,用于实际的聚类分析时效果较差。ACO是一种仿生优化算法,其具有很强的健壮性,容易与其他方法相结合,求解效率... K-medoids算法作为聚类算法的一种,不易受极端数据的影响,适应性广泛,但是K-medoids聚类算法的精确度不稳定,平均准确率较低,用于实际的聚类分析时效果较差。ACO是一种仿生优化算法,其具有很强的健壮性,容易与其他方法相结合,求解效率高等特点。在K-medoids聚类算法的基础上,借鉴ACO算法的优点,提出了一种新的聚类算法,它提高了聚类的准确率,算法的稳定性也比较高。通过仿真实验,验证了算法的可行性和先进性。 展开更多
关键词 蚁群优化算法(ACO) 聚类分析 k-medoids算法
下载PDF
基于MapReduce的K-Medoids并行算法 被引量:33
15
作者 张雪萍 龚康莉 赵广才 《计算机应用》 CSCD 北大核心 2013年第4期1023-1025,1035,共4页
为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想。Map函数部分的主要任务是计算每个数据对象... 为了解决传统K-Medoids聚类算法在处理海量数据信息时所面临的内存容量和CPU处理速度的瓶颈问题,在深入研究K-Medoids算法的基础之上,提出了基于MapReduce编程模型的K-Medoids并行化算法思想。Map函数部分的主要任务是计算每个数据对象到簇类中心点的距离并(重新)分配其所属的聚类簇;Reduce函数部分的主要任务是根据Map部分得到的中间结果,计算出新簇类的中心点,然后作为中心点集给下一次MapReduce过程使用。实验结果表明:运行在Hadoop集群上的基于MapReduce的K-Medoids并行化算法具有较好的聚类结果和可扩展性,对于较大的数据集,该算法得到的加速比更接近于线性。 展开更多
关键词 k-medoids 云计算 MAPREDUCE 并行计算 HADOOP
下载PDF
基于遗传模拟退火算法的改进K-medoids算法 被引量:9
16
作者 韩啸 刘淑芬 徐天琦 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第2期619-623,共5页
针对标准K-medoids算法在大数据聚类应用中易陷入局部最优解以及聚类效果受初始中心限制的缺点,提出了基于遗传模拟退火算法的K-medoids改进算法。该算法结合遗传算法和模拟退火算法,可以增强标准K-medoids算法在聚类时的全局搜索能力,... 针对标准K-medoids算法在大数据聚类应用中易陷入局部最优解以及聚类效果受初始中心限制的缺点,提出了基于遗传模拟退火算法的K-medoids改进算法。该算法结合遗传算法和模拟退火算法,可以增强标准K-medoids算法在聚类时的全局搜索能力,并加快其收敛速度。对比实验证明:这一改进有效地弥补了标准K-medoids算法的上述缺陷,达到了提高聚类效率、加快收敛速度、改善聚类质量的目的。 展开更多
关键词 计算机应用 聚类 k-medoids算法 遗传模拟退火算法
下载PDF
基于K-Medoids聚类的改进KNN文本分类算法 被引量:25
17
作者 罗贤锋 祝胜林 +1 位作者 陈泽健 袁玉强 《计算机工程与设计》 CSCD 北大核心 2014年第11期3864-3867,3937,共5页
为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,... 为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。 展开更多
关键词 文本分类 隶属度 K最近邻 样本裁剪 k-medoids聚类
下载PDF
粒子群K-Medoids带障碍约束空间聚类分析研究 被引量:6
18
作者 张雪萍 王家耀 +1 位作者 范中山 邓高峰 《小型微型计算机系统》 CSCD 北大核心 2009年第10期2025-2029,共5页
空间聚类分析是空间数据挖掘研究领域中的一个重要研究课题.传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性.本文在分析粒子群优化算法和划分算法的基础上,研究一种基于粒子群和划分相结合的... 空间聚类分析是空间数据挖掘研究领域中的一个重要研究课题.传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性.本文在分析粒子群优化算法和划分算法的基础上,研究一种基于粒子群和划分相结合的带障碍约束空间聚类分析方法,设计了一个粒子群K-Medoids带障碍约束空间聚类分析算法.对比实验表明,该方法不仅兼顾了局部收敛和全局收敛性能,又充分考虑到了现实障碍物对聚类结果的影响,使得聚类结果更具实际意义.与遗传K-Medoids带障碍约束空间聚类分析相比,该方法具有更好的可伸缩性,且所需输入的参数相对较少,更适合于对聚类速度要求较高的动态约束条件场合. 展开更多
关键词 空间聚类 k-medoids算法 粒子群优化算法 障碍约束
下载PDF
密度峰值优化初始中心的K-medoids聚类算法 被引量:27
19
作者 谢娟英 屈亚楠 《计算机科学与探索》 CSCD 北大核心 2016年第2期230-247,共18页
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算... 针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。 展开更多
关键词 聚类 k-medoids算法 初始聚类中心 密度峰值 准则函数
下载PDF
一种MapReduce架构下基于遗传算法的K-Medoids聚类 被引量:18
20
作者 赖向阳 宫秀军 韩来明 《计算机科学》 CSCD 北大核心 2017年第3期23-26,58,共5页
由互联网时代快速发展而产生的海量数据给传统聚类方法带来了巨大挑战,如何改进聚类算法从而获取有效信息成为当前的研究热点。K-Medoids是一种常见的基于划分的聚类算法,其优点是可以有效处理孤立、噪声点,但面临着初始中心敏感、容易... 由互联网时代快速发展而产生的海量数据给传统聚类方法带来了巨大挑战,如何改进聚类算法从而获取有效信息成为当前的研究热点。K-Medoids是一种常见的基于划分的聚类算法,其优点是可以有效处理孤立、噪声点,但面临着初始中心敏感、容易陷入局部最优值、处理大数据时的CPU和内存瓶颈等问题。为解决上述问题,提出了一种MapReduce架构下基于遗传算法的K-Medoids聚类。利用遗传算法的种群进化特点改进K-Medoids算法的初始中心敏感的问题,在此基础上,利用MapReduce并行遗传K-Medoids算法提高算法效率。通过带标签的数据集进行实验的结果表明,运行在Hadoop集群上的基于MapReduce和遗传算法的K-Medoids算法能有效提高聚类的质量和效率。 展开更多
关键词 海量数据 k-medoids MAPREDUCE 遗传算法 聚类效率
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部