-
题名自适应仿射传播聚类
被引量:144
- 1
-
-
作者
王开军
张军英
李丹
张新娜
郭涛
-
机构
西安电子科技大学计算机学院
中国计量学院
-
出处
《自动化学报》
EI
CSCD
北大核心
2007年第12期1242-1246,共5页
-
基金
国家自然科学基金(60574039
60371044)资助~~
-
文摘
适合处理大类数的仿射传播聚类有两个尚未解决的问题:一是很难确定偏向参数取何值能够使算法产生最优的聚类结果;另一个是当震荡发生后算法不能自动消除震荡并收敛.为了解决这两个问题,提出了自适应仿射传播聚类方法,具体技术包括:自适应扫描偏向参数空间来搜索聚类个数空间以寻找最优聚类结果、自适应调整阻尼因子来消除震荡以及当调整阻尼因子方法失效时的自适虑逃离震荡技术.与原算法相比,自适应仿射传播聚类方法性能更优,能够自动消除震荡和寻找最优聚类结果.对模拟和真实数据集的实验结果表明,自适应仿射传播聚类方法十分有效,其聚类质量优于或不低于原算法.
-
关键词
仿射传播聚类
自适虑聚类
大类数的聚类算法
-
Keywords
Affinity propagation (AP) clustering, adaptive clustering, large number of clusters
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名识别聚类间远近关系的双几何体模型
被引量:2
- 2
-
-
作者
王开军
严宣辉
陈黎飞
-
机构
福建师范大学数学与计算机科学学院
-
出处
《中国科学:信息科学》
CSCD
2012年第1期99-110,共12页
-
基金
福建省教育厅A类资助项目(批准号:JA09043)
福建省省属高校科研专项(批准号:JK2009006)资助项目
-
文摘
许多实际问题的解决不仅需要聚类算法给出类标,更依赖于类间远近关系的辨别.对于类数较多且高维数据的困难情况,基于降维的聚类结果可视化方法通常会出现聚类的重叠、交织或强行拉远现象,使得一些类间的远近关系无法分辨或被错误显示;而现有的类间距离方法则不能揭示两个聚类是远离还是靠近.本文提出了双几何体模型方法来描述两个聚类的类间关系,并设计了相对边界距离、绝对边界距离和区域疏密程度等测量类间远近程度的方法.本文方法既考虑了两个聚类的最近样本集之间的绝对距离,也考虑了聚类边界区域的疏密程度,其优点是在上述困难情况下也能准确揭示高维空间中的类间关系.对真实数据集的实验结果表明,双几何体模型方法能有效地识别现有聚类可视化方法无法辨别的类间远近关系.
-
关键词
双几何体模型
聚类间远近关系
大类数
高维数据
划分聚类算法
-
Keywords
geometric double-entity model, far-near relations of clusters, many clusters, high-dimensional dataset, partitional clustering algorithms
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-