-
题名识别聚类间远近关系的双几何体模型
被引量:2
- 1
-
-
作者
王开军
严宣辉
陈黎飞
-
机构
福建师范大学数学与计算机科学学院
-
出处
《中国科学:信息科学》
CSCD
2012年第1期99-110,共12页
-
基金
福建省教育厅A类资助项目(批准号:JA09043)
福建省省属高校科研专项(批准号:JK2009006)资助项目
-
文摘
许多实际问题的解决不仅需要聚类算法给出类标,更依赖于类间远近关系的辨别.对于类数较多且高维数据的困难情况,基于降维的聚类结果可视化方法通常会出现聚类的重叠、交织或强行拉远现象,使得一些类间的远近关系无法分辨或被错误显示;而现有的类间距离方法则不能揭示两个聚类是远离还是靠近.本文提出了双几何体模型方法来描述两个聚类的类间关系,并设计了相对边界距离、绝对边界距离和区域疏密程度等测量类间远近程度的方法.本文方法既考虑了两个聚类的最近样本集之间的绝对距离,也考虑了聚类边界区域的疏密程度,其优点是在上述困难情况下也能准确揭示高维空间中的类间关系.对真实数据集的实验结果表明,双几何体模型方法能有效地识别现有聚类可视化方法无法辨别的类间远近关系.
-
关键词
双几何体模型
聚类间远近关系
大类数
高维数据
划分聚类算法
-
Keywords
geometric double-entity model, far-near relations of clusters, many clusters, high-dimensional dataset, partitional clustering algorithms
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-