-
题名邻域平衡密度聚类算法
被引量:22
- 1
-
-
作者
武佳薇
李雄飞
孙涛
李巍
-
机构
符号计算与知识工程教育部重点实验室(吉林大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第6期1044-1052,共9页
-
基金
国家科技支撑计划基金项目(2006BAK01A33)
吉林省科技发展计划基金项目(20070321
20090704)
-
文摘
聚类是数据挖掘领域的一项重要分析手段.在分析核心对象与其邻域对象的分布特征后,引入对象的投影点,对象的邻域平衡、平衡核心对象、边界稀疏对象等概念.提出一种新的基于密度的聚类算法bDBSCAN(balance-DBSCAN).算法将核心对象邻域中的对象投影,进行向量单位化,考察核心对象的邻域平衡性,将与平衡核心对象平衡密度可达的对象聚成一个簇.理论分析和实验结果表明,算法可以处理任意形状的簇,有效地排除边界稀疏对象这类噪声,并且可以解决高维数据聚类边界区分不明显、噪声对象多等问题,提高了聚类精度.算法的时间复杂度与DBSCAN近似.
-
关键词
投影点
邻域平衡
平衡核心对象
边界稀疏对象
基于密度的聚类算法
-
Keywords
projection point
neighborhood balance
balanceable core point
boundary sparse point
density-based clustering algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-