摘要
通过围绕云计算环境下的Hadoop架构,以Hadoop分布式系统、MapReduce模型、HBase数据库作为基础,建构起Hadoop框架的改进K-means聚类挖掘算法,对原有的聚类分析构造函数作出改进,并针对网络热点话题进行数据要素提取、分析模型建立,完成不同数据项集的仿真实验,得出在改进K-means聚类算法下的系统采样范围、准确率等的数据挖掘结果,得出该算法更适合于云计算下数据挖掘分析的结论,具有一定的优越性。
作者
谢帆
彭玉涛
XIE Fan;PENG Yutao
出处
《信息技术与信息化》
2022年第11期63-66,共4页
Information Technology and Informatization