-
题名高阶异构数据层次联合聚类算法
被引量:6
- 1
-
-
作者
杨欣欣
黄少滨
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第1期200-210,共11页
-
基金
国家自然科学基金项目(71272216)
国家科技支撑计划基金项目(2012BAH08B02)
+1 种基金
中央高校基本科研业务专项资金项目(HEUCF100603
HEUCFZ1212)
-
文摘
在实际应用中,包含多种特征空间信息的高阶异构数据广泛出现.由于高阶联合聚类算法能够有效融合多种特征空间信息提高聚类效果,近年来逐渐成为研究热点.目前高阶联合聚类算法多数为非层次聚类算法.然而,高阶异构数据内部往往隐藏着层次聚簇结构,为了更有效地挖掘数据内部隐藏的层次聚簇模式,提出了一种高阶层次联合聚类算法(high-order hierarchical co-clustering algorithm,HHCC).该算法利用变量相关性度量指标Goodman-Kruskalτ衡量对象变量和特征变量的相关性,将相关性较强的对象划分到同一个对象聚簇中,同时将相关性较强的特征划分到同一个特征聚簇中.HHCC算法采用自顶向下的分层聚类策略,利用指标Goodman-Kruskalτ评估每层对象和特征的聚类质量,利用局部搜索方法优化指标Goodman-Kruskalτ,自动确定聚簇数目,获得每层的聚类结果,最终形成树状聚簇结构.实验结果表明HHCC算法的聚类效果优于4种经典的同构层次聚类算法和5种已有的非层次高阶联合聚类算法.
-
关键词
高阶异构数据
联合聚类
层次聚类
相关性度量
多种特征空间
-
Keywords
high-order heterogeneous data
co-clustering
hierarchical clustering
measure of association
multiple feature space
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-