期刊文献+

利用多标签信息的聚类方法

One clustering method by using multi-label information
下载PDF
导出
摘要 k-means是当前使用最广泛的聚类算法,但其只对无标签信息的样本数据进行聚类,需用户提供初始聚类中心等信息且聚类花费时间长结果不稳定。当前很多数据集都带有多标签的信息,如何利用多标签信息更加快速有效的聚类是一个重要的研究方向。文中提出了多标签数据的聚类方法,首先对多标签信息进行聚类得到适当的初始聚类中心,然后再使用k-means算法对大量样本做聚类。试验结果表明,该聚类方法比使用随机初始聚类中心的k-means算法具有更好的时间性能和聚类结果。 K-means algorithm is currently most widely used clustering method,but it only clusters unlabeled sample data,which requires user to provide initial clusters centers and achieve unstable results at long time.Currently,many real datasets contain both samples and associated multi-label information.It is an important research topic how to do clustering with multi-label information rapidly and effectively.The article proposes a clustering method for multi-label information,which we do clustering on multi-label vectors to acquire appropriate initial clusters centers firstly and then use the k-means algorithm to cluster a large number of samples.The experimental results illustrate that the proposed method achieves better time performance and clustering results than the k-means algorithm using random initial clustering centers.
作者 杨国安 王志岗 YANG Guoan;WANG Zhigang(Tianjin Langyu Technology Development Company Ltd,Tianjin 300457,China;School of Computer Science and Engineering,Tianjin University of Technology,Tianjin 300384,China)
出处 《天津理工大学学报》 2024年第1期15-21,共7页 Journal of Tianjin University of Technology
基金 天津市教委科研计划项目(2017KJ254)。
关键词 多标签 聚类 K-MEANS 无标签 multi-label clustering k-means no-label
  • 相关文献

参考文献2

二级参考文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部