-
题名谱聚类中选取特征向量的动态选择性集成方法
被引量:5
- 1
-
-
作者
王兴良
王立宏
武栓虎
-
机构
烟台大学计算机学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第5期452-462,共11页
-
基金
国家自然科学基金项目(No.61170224)
山东省自然科学基金项目(No.ZR2012FL07)
烟台大学青年基金项目(No.JS11Z8)资助
-
文摘
谱聚类中k个最大特征值对应的特征向量不一定使聚类结果达到最好,因此,文中采用特征向量组的选择性集成方法以提高谱聚类性能,涉及基特征向量组的选取、选择性集成策略等问题.利用训练数据的成对约束信息进行打分,选出较好的基特征向量组;应用测试数据在训练数据中的l-最近邻的聚类性能指标,动态评价每组特征向量,选出少量几个参与投票的特征向量组;对测试数据集的几个特征向量组数据进行谱聚类,并对结果进行簇配准,给出最终的聚类结果.实验表明,采用动态选择性集成方法能提高测试数据的聚类性能.
-
关键词
谱聚类
选择性集成
特征向量选取
约束计分
l-最近邻
-
Keywords
Spectral Clustering
Selective Ensemble
Eigenvector Selection
Constraint Score
l-Nearest Neighbor
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名谱聚类中特征向量的Bagging选取方法
被引量:2
- 2
-
-
作者
王兴良
王立宏
李海军
-
机构
烟台大学计算机学院
-
出处
《山东大学学报(工学版)》
CAS
北大核心
2013年第2期35-41,共7页
-
基金
国家自然科学基金资助项目(61170224)
山东省计算机网络重点实验室开放课题基金资助项目(SDKLCN-2012-03)
-
文摘
谱聚类算法中用亲和矩阵特征值最大的k个特征向量并不总是能有效地发现数据集的结构。为了选取较好特征向量,提出了一种特征向量的Bagging选取算法。以成对约束计分方法为评价标准,对特征向量进行评价并选出较好的特征向量,将多次选择的特征向量进行Bagging集成(Bootstrap aggregating),得出k个特征向量的组合。该算法能够较好地选取出特征向量,根据UCI实验数据集的测试,证实该算法对测试数据集可以得出较好的预测结果。
-
关键词
特征向量选择
谱聚类
Bagging方法
约束计分
拉普拉斯矩阵
-
Keywords
eigenvector selection
spectral clustering
Bagging method
constraint score
Laplacian matrix
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-