期刊文献+

基于核密度估计的层次聚类算法 被引量:30

Hierarchical Clustering based on Kernel Density Estimation
下载PDF
导出
摘要 聚类分析是统计、模式识别和数据挖掘等领域中一个非常基础且非常重要的研究课题,具有广泛的应用前景。在众多的聚类方法中,基于密度的方法是一种相当有效的聚类方法,能够发现任意形状的聚类,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。以DENCLUE算法为基础,一种基于核密度估计的层次聚类算法被提出,该算法首先优选窗宽s产生较好的核密度估计结果,然后以密度函数的局部极大值点为聚类中心形成数据的初始划分,最后根据密度函数的鞍点递归合并初始聚类产生不同层次的划分模式。理论分析和仿真实验结果显示,该算法能够发现任意形状、大小和密度的聚类,能够有效处理噪声数据,而且聚类结果不依赖于用户参数的仔细选择。 Clustering is a promising application area for many fields including statistics, pattern recognition, data mining, etc. Among many clustering techniques, density-based method is one of the effective and efficient clustering methods that can discover clusters with arbitrary shape and is insensitive to noise data. According to the DENCLUE algorithm, we present a new hierarchical clustering approach based on kernel density estimation. In our approach, the window-width s is optimized to obtain good density estimation, then the density attractors are chosen to generate the center-defined data partition, and finally the center-defined clusters are iteratively merged into a hierarchy of clusters according to the saddles of density function. Theory analysis and experimental results show that this approach not only keeps the good features of DENCLUE, but also requires no input parameters and can discover clusters with arbitrary shapes and densities at different levels.
出处 《系统仿真学报》 CAS CSCD 2004年第2期302-305,309,共5页 Journal of System Simulation
基金 国家"九七三"重点基础研究发展规划资助项目(G19980305084) 国家自然科学基金资助项目(69975024)。
关键词 基于密度的聚类分析 核密度估计 密度吸引子 鞍点 density-based clustering kernel density estimation density-attractors saddle-points
  • 相关文献

同被引文献231

引证文献30

二级引证文献300

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部