-
题名识别聚类间远近关系的双几何体模型
被引量:2
- 1
-
-
作者
王开军
严宣辉
陈黎飞
-
机构
福建师范大学数学与计算机科学学院
-
出处
《中国科学:信息科学》
CSCD
2012年第1期99-110,共12页
-
基金
福建省教育厅A类资助项目(批准号:JA09043)
福建省省属高校科研专项(批准号:JK2009006)资助项目
-
文摘
许多实际问题的解决不仅需要聚类算法给出类标,更依赖于类间远近关系的辨别.对于类数较多且高维数据的困难情况,基于降维的聚类结果可视化方法通常会出现聚类的重叠、交织或强行拉远现象,使得一些类间的远近关系无法分辨或被错误显示;而现有的类间距离方法则不能揭示两个聚类是远离还是靠近.本文提出了双几何体模型方法来描述两个聚类的类间关系,并设计了相对边界距离、绝对边界距离和区域疏密程度等测量类间远近程度的方法.本文方法既考虑了两个聚类的最近样本集之间的绝对距离,也考虑了聚类边界区域的疏密程度,其优点是在上述困难情况下也能准确揭示高维空间中的类间关系.对真实数据集的实验结果表明,双几何体模型方法能有效地识别现有聚类可视化方法无法辨别的类间远近关系.
-
关键词
双几何体模型
聚类间远近关系
大类数
高维数据
划分聚类算法
-
Keywords
geometric double-entity model, far-near relations of clusters, many clusters, high-dimensional dataset, partitional clustering algorithms
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名聚类结果可视化的线珠模式
被引量:1
- 2
-
-
作者
王开军
李健
-
机构
福建师范大学数学与计算机学院
西北政法大学网络信息中心
-
出处
《计算机系统应用》
2010年第5期167-170,182,共5页
-
基金
福建省教育厅项目(JA09043)
-
文摘
对于揭示困难情况(高维且大类数)下的类间远近关系,现有的聚类结果可视化方法的效果均不理想。提出了以线珠模式和(非)线性坐标表示类间远近关系的可视化方法,其优点是在上述困难情况下也能准确地显示各个聚类之间的远近关系或距离。对模拟和真实数据集的实验结果表明,线珠模式方法十分有效,能准确地显示基于降维可视化方法无法正确显示的类间远近关系。
-
关键词
聚类结果可视化
类间远近关系
线珠模式
AFFINITY
PROPAGATION
CLUSTERING
-
Keywords
visualization of clustering results
relations between clusters
line-pearl pattern
affinity propagation clustering
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-