-
题名基于时态密度特征的改进数据流聚类算法
被引量:14
- 1
-
-
作者
陈羽中
郭松荣
郭昆
李国辉
林魏超
-
机构
福州大学数学与计算机科学学院
福建省网络计算与智能信息处理重点实验室
海西政务大数据应用协同创新中心
空间数据挖掘与信息共享教育部重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第1期64-68,共5页
-
基金
国家自然科学基金项目(61300104
61300103
+10 种基金
61300102)资助
福建省科技创新平台建设项目(2009J1007
2014H200)资助
福建省自然科学基金项目(2013J01230
2013J01232)资助
福建省杰出青年科学基金项目(2014J06017
2015J06014)资助
福建省高校杰出青年科学基金项目(JA12016)资助
福建省高等学校新世纪优秀人才支持计划项目(JA13021)资助
福建省教育厅科技重点项目(JK2012003)资助
福建省科技厅产学重大项目(2014H6014)资助
-
文摘
针对经典Clu Stream聚类算法的在线微簇聚类过程中限制微簇数量的增长,对微簇进行强制合并,使其在线聚类结果受到影响,导致数据流聚类质量不高,且难以适应海量大数据等问题,提出一种基于时态密度特征的改进Clu Stream聚类算法.首先,提出微簇时态密度的概念,并用其对微簇进行描述;其次,提出新的微簇删除、合并的机制,能够根据在线微簇的情况动态地添加微簇的数量;最后,应用并行化的框架将算法并行化,以适应海量实时大数据的需求.通过在人工数据集和真实数据集上的对比实验表明,改进后的数据流聚类算法相较于Clu Stream算法能够得到更高质量的聚类结果.
-
关键词
数据流
时态密度
聚类
并行计算
-
Keywords
data stream: temooral density: clusterinz, parallel comutation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-