期刊文献+

考虑数据排序的改进CABOSFV聚类 被引量:2

Improved CABOSFV clustering considering data sort
下载PDF
导出
摘要 CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序以改进CABOSFV算法的聚类质量。采用UCI基准数据集进行实验,结果表明与传统的CABOSFV算法相比,CABOSFV_CS有效地提高了聚类准确率。 CABOSFV is an efficient algorithm based on sparse feature for high dimensional data clustering.However the clustering quality of the algorithm is sensitive to the order of input data.To this problem,improved CABOSFV clustering considering data sort(CABOSFV_CS) is proposed,which describes the sparse feature of data by defining a new concept sparseness index and improves the clustering quality of CABOSFV by sorting data according to the ascending sequence of sparseness index.UCI benchmark data sets are used to compare CABOSFV_CS with traditional CABOSFV algorithm.The empirical tests show that CABOSFV_CS increases the clustering accuracy effectively.
出处 《计算机工程与应用》 CSCD 北大核心 2011年第34期127-129,共3页 Computer Engineering and Applications
基金 国家自然科学基金(No.70771007) 中央高校基本科研业务费专项资金资助(No.FRF-TP-10-006B)~~
关键词 CABOSFV算法 高维数据 稀疏特征 聚类 CABOSFV algorithm high dimensional data sparse feature clustering
  • 相关文献

参考文献5

二级参考文献100

共引文献223

同被引文献5

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部