-
题名分布式大数据的群体行为模式挖掘算法
- 1
-
-
作者
洪月华
-
机构
广西职业师范学院计算机系
-
出处
《玉林师范学院学报》
2019年第2期145-151,共7页
-
文摘
针对广域网分布式存储环境里大数据的群体行为模式分析与挖掘问题,提出基于MapReduce和ABC蜂群算法能在广域网分布式并行执行的k-means聚类方法。该聚类方法通过MapReduce的Map、Combine和Reduce三个运算,实现了用ABC改进优化k-means聚类计算在广域网内分布式并行执行,聚类计算复杂度高的操作在各个数据源节点并行执行,同时把获得的局部聚类结果合并成数据量较小的中间结果后才传送给中心节点,避免移动集中大数据,极大地缩减了聚类计算总时间;聚类计算的对象是全量大数据,防止了因数据降维或抽样而降低数据规模的方法对聚类结果产生影响,聚类的准确率得到了保障。通过某省道路交通监控系统采集的行人过马路闯红灯轨迹数据将两种聚类方法进行比较,得到广域网分布式并行聚类方法的聚类特性更好的结论。
-
关键词
大数据
群体行为模式
并行聚类
MAPREDUCE
-
Keywords
big data
group behavior patterns
parallel clustering
MapReduce
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-