-
题名基于信息熵属性赋权的谱聚类算法研究
- 1
-
-
作者
赵月爱
武建
-
机构
太原师范学院计算机系
-
出处
《太原师范学院学报(自然科学版)》
2017年第1期46-52,共7页
-
基金
国家自然基金项目"用户行为数据"稀疏表示的理论与方法研究(61273294)
山西省科技攻关计划项目高速网络入侵检测技术研究(20110321024-02)
-
文摘
针对谱聚类算法在处理较大规模的样本时,在存储空间和计算时间上都存在瓶颈问题,文章分析了目前常见的两种解决方式,即基于稀疏化t近邻的谱聚类和基于Nystr9m矩阵低秩逼近的谱聚类方法.为了进一步提高这两种谱聚类算法的准确度,提出了采取基于信息熵属性赋权的欧式距离来计算样本间的相似度的方法.首先,计算样本各属性的权重;然后,计算样本间的相似度矩阵并应用到稀疏化t近邻的谱聚类和Nystr9m矩阵低秩逼近的谱聚类方法中;最后,在多个数据集上进行了验证.实验结果表明该方法在一些数据集上的聚类精确度要比原来谱聚类算法高,尤其在Pendigits数据集上,基于信息熵赋权的稀疏化t近邻谱聚类比稀疏化t近邻谱聚类方法精确度提高15.11%.
-
关键词
谱聚类
信息熵
稀疏化t近邻
Nystrm矩阵低秩逼近
-
Keywords
spectral clustering
information entropy
sparse t-nearest-neighbor
Nystrom low-rank approximation
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-