聚类分析是常见的数据分析技术。基于KHM的聚类分析是当前研究的热点。提出了基于候选聚类的KHM算法(KHM-CC),详细阐述了算法的设计过程。采用UCI的小样本(iris)数据集和大样本(Bag of Words)数据集对比了KHM-CC算法和禁忌搜索KHM算法(K...聚类分析是常见的数据分析技术。基于KHM的聚类分析是当前研究的热点。提出了基于候选聚类的KHM算法(KHM-CC),详细阐述了算法的设计过程。采用UCI的小样本(iris)数据集和大样本(Bag of Words)数据集对比了KHM-CC算法和禁忌搜索KHM算法(KHM-TS)和变邻域搜索KHM算法(KHM-VNS)的性能。实验结果表明,KHM-CC算法在处理iris数据集小样本数据集时,其性能和KHM-VNS算法基本接近,而优于KHM-TS算法。但是在处理Bag of Words大样本数据集时,性能优于KHM-VNS和KHM-TS算法,其聚类计算耗时明显缩短,证实KHM-CC算法在高维度数据集的处理上更具优势。展开更多
文摘聚类分析是常见的数据分析技术。基于KHM的聚类分析是当前研究的热点。提出了基于候选聚类的KHM算法(KHM-CC),详细阐述了算法的设计过程。采用UCI的小样本(iris)数据集和大样本(Bag of Words)数据集对比了KHM-CC算法和禁忌搜索KHM算法(KHM-TS)和变邻域搜索KHM算法(KHM-VNS)的性能。实验结果表明,KHM-CC算法在处理iris数据集小样本数据集时,其性能和KHM-VNS算法基本接近,而优于KHM-TS算法。但是在处理Bag of Words大样本数据集时,性能优于KHM-VNS和KHM-TS算法,其聚类计算耗时明显缩短,证实KHM-CC算法在高维度数据集的处理上更具优势。