-
题名粗略不相似度量及其在层次聚类中的应用
被引量:1
- 1
-
-
作者
李春忠
郑玉棒
汪婷
-
机构
安徽财经大学统计与应用数学学院
-
出处
《工程数学学报》
CSCD
北大核心
2017年第4期354-366,共13页
-
基金
国家自然科学基金(61305070)
国家重点基础研究发展规划973计划(2013CB329404)
安徽省自然科学基金(KJ2015A076)~~
-
文摘
局部结构特征在数据分析过程中具有重要的作用.为获得简单有效的数据集局部结构化特征检测方法,本文结合重采样误差分析和传统的近邻选择方法提出了一种检测局部结构特征的方向一致性度量—粗略不相似性度量.该度量是一种优化的近邻选择方法,不仅考虑了传统的欧氏距离排序,而且考虑了局部方向结构特征.因其计算和存储复杂度小以及具有优越的结构检测性能,可应用于无监督学习形成一种层次化的子图聚类算法—RDClust,与经典聚类算法相比,其优势在于:一是计算复杂度较小,是近似线性算法;二是无需对类的形状和分布形式做任何的假设,可自动体现数据集的局部结构;三是有一个近邻参数,且该参数对结果较鲁棒.在人工和真实数据集上的实验显示了新的度量方式应用于新算法的优越性能.
-
关键词
聚类
近邻域
第k个近邻点连接
层次连接图
-
Keywords
clustering
nearest neighborhood
k-th nearest neighbor connection
hierarchical connection graph
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-