期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Hubness现象的高维数据混合聚类算法 被引量:3
1
作者 王妍 马燕 +2 位作者 黄慧 李顺宝 张玉萍 《电视技术》 2019年第6期17-23,共7页
高维数据聚类是聚类分析中的难点。K-hubs聚类算法是在K-means方法基础上,结合高维数据空间的Hubness现象对数据进行聚类。针对K-hubs聚类算法需要随机确定初始聚类中心,不适用于非超球状簇等问题,本文提出了基于多阶段层次聚类和划分... 高维数据聚类是聚类分析中的难点。K-hubs聚类算法是在K-means方法基础上,结合高维数据空间的Hubness现象对数据进行聚类。针对K-hubs聚类算法需要随机确定初始聚类中心,不适用于非超球状簇等问题,本文提出了基于多阶段层次聚类和划分聚类的高维数据混合聚类算法。该算法将数据点按其Hub值分为Hub点,Midhub点和Antihub点三类,然后对Hub点和Midhub点分别采用层次聚类,接着进一步采用层次聚类合并簇,最后,对Antihub点利用划分聚类合并到最近的簇。在UCI数据集上的实验结果表明,与其它最新的聚类算法相比,本文提出的算法在高维数据集上得到了较好的聚类结果。 展开更多
关键词 高维数据 聚类 hubness现象 层次聚类 K-MEANS算法
下载PDF
基于Hubness与类加权的k最近邻分类算法 被引量:6
2
作者 李金孟 林亚平 祝团飞 《计算机工程》 CAS CSCD 北大核心 2018年第4期248-252,261,共6页
针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式增加少数类在所有... 针对高维不平衡数据中维数灾难和类不平衡分布问题,提出一种改进k最近邻(kNN)分类算法HWNN。将样本的k发生分布作为其在预测时对各个类的支持度,以此减少高维数据中hubs对kNN分类带来的潜在负面影响。通过类加权的方式增加少数类在所有样本k发生中的分布比例,以提升对少数类样本的预测精度。在16个不平衡UCI数据集上的实验结果表明,该算法在高维不平衡数据中的分类结果优于典型kNN方法,且在普通维度的不平衡数据中优势同样明显。 展开更多
关键词 hubness现象 高维不平衡数据 维数灾难 数据分类 k发生 k最近邻分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部