摘要
在实际问题中,进行聚类分析的数据点常常受到很多因素的影响。本文针对多因素影响下的聚类问题,提出了K-Hybrids聚类算法,该算法考虑了聚类过程中点的权重差异,以及数据点所属标签相似度的问题。用加权K-means算法对聚类过程进行调整,同时用基于独热编码的Jaccard相似度计算数据点之间的逻辑距离,最后引入权重因子对这两个影响因素进行整合。实验结果显示,该算法的聚类效果很好,更具有实际意义。大数据时代下,数据的产生、采集方式日新月异,对数据的处理技术也在飞速发展,如何提高对数据的处理速度、优化处理流程一直是人们研究的主要内容。
出处
《数字技术与应用》
2024年第5期223-225,共3页
Digital Technology & Application