期刊文献+

基于最小生成树的不平衡数据集聚类算法

Clustering Algorithm for Unbalanced Datasets Based on Minimum Spanning Tree
下载PDF
导出
摘要 采用传统不平衡数据集聚类算法直接对数据集编码树进行构建,而未对数据集密度特征进行提取,造成传统算法数据聚类效果差,因此提出了基于最小生成树的不平衡数据集聚类算法。先利用数据区域密度的敏感性,提取数据密度特征,再利用提取的数据集密度特征构建编码树,并计算不平衡聚类状态下的数据集,最后基于最小生成树实现不平衡数据集聚类。设计对比实验,实验结果表明该研究算法聚类效果最好,具有研究价值。 The traditional imbalanced dataset clustering algorithm is used to directly construct the dataset encoding tree without extracting the density features of the dataset,resulting in poor clustering performance of the traditional algorithm.Therefore,a minimum spanning tree based imbalanced dataset clustering algorithm is proposed.Firstly,the sensitivity of data region density is utilized to extract data density features.Then,an encoding tree is constructed using the extracted density features of the dataset,and the dataset in imbalanced clustering state is calculated.Finally,imbalanced dataset clustering is achieved based on the minimum spanning tree.Design comparative experiments,and the experimental results show that the clustering effect of this research algorithm is the best,which has research value.
作者 蓝欢玉 LAN Huanyu(Guangxi Polytechnic of Modern,Hechi Guangxi 547099,China)
出处 《信息与电脑》 2023年第14期120-122,共3页 Information & Computer
基金 2020年度广西高校中青年教师科研基础能力提升项目(项目编号:2020KY45011)。
关键词 最小生成树 不平衡数据集 数据集聚类 聚类算法 minimum generating tree unbalanced data set data cluster clustering algorithm
  • 相关文献

参考文献6

二级参考文献80

共引文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部