考虑数据排序的改进CABOSFV聚类被引量：2

Improved CABOSFV clustering considering data sort

下载PDF

导出

摘要 CABOSFV是基于稀疏特征进行高维数据聚类的高效算法,但算法的聚类质量受数据输入顺序的影响。针对此问题,提出考虑数据排序的改进CABOSFV聚类(CABOSFV_CS),通过定义稀疏性指数来描述数据的稀疏特征,并按照稀疏性指数升序对数据进行排序以改进CABOSFV算法的聚类质量。采用UCI基准数据集进行实验,结果表明与传统的CABOSFV算法相比,CABOSFV_CS有效地提高了聚类准确率。 CABOSFV is an efficient algorithm based on sparse feature for high dimensional data clustering.However the clustering quality of the algorithm is sensitive to the order of input data.To this problem,improved CABOSFV clustering considering data sort（CABOSFV_CS） is proposed,which describes the sparse feature of data by defining a new concept sparseness index and improves the clustering quality of CABOSFV by sorting data according to the ascending sequence of sparseness index.UCI benchmark data sets are used to compare CABOSFV_CS with traditional CABOSFV algorithm.The empirical tests show that CABOSFV_CS increases the clustering accuracy effectively.

作者武森王静谭一松

机构地区北京科技大学经济管理学院

出处《计算机工程与应用》 CSCD 北大核心 2011年第34期127-129,共3页 Computer Engineering and Applications

基金国家自然科学基金(No.70771007) 中央高校基本科研业务费专项资金资助(No.FRF-TP-10-006B)~~

关键词 CABOSFV算法高维数据稀疏特征聚类 CABOSFV algorithm high dimensional data sparse feature clustering

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1单世民,王新艳,张宪超.高维分类属性的子空间聚类算法[J].小型微型计算机系统,2009,30(10):2016-2021. 被引量：6
2姚忠,魏佳,吴跃.基于高维稀疏数据聚类的协同过滤推荐算法[J].信息系统学报,2008,2(2):78-96. 被引量：8
3Sen Wu,Xuedong Gao Management School, University of Science and Technology Beijing, Beijing 100083, China.CABOSFV algorithm for high dimensional sparse data clustering[J].Journal of University of Science and Technology Beijing,2004,11(3):283-288. 被引量：7
4杨博,刘大有,LIU Jiming,金弟,马海宾.复杂网络聚类方法[J].软件学报,2009,20(1):54-66. 被引量：209
5刘希宋,喻登科,李玥.基于客户知识的客户CABOSFV聚类[J].情报杂志,2008,27(2):7-9. 被引量：3

二级参考文献100

1邓爱林,左子叶,朱扬勇.基于项目聚类的协同过滤推荐算法[J].小型微型计算机系统,2004,25(9):1665-1670. 被引量：147
2余力,刘鲁.电子商务个性化推荐研究[J].计算机集成制造系统,2004,10(10):1306-1313. 被引量：104
3陈治纲,何丕廉,孙越恒,郑小慎.基于向量空间模型的文本分类系统的研究与实现[J].中文信息学报,2005,19(1):36-41. 被引量：43
4何光辉,魏曙光,王蔚韬.改进的聚类邻居协同过滤推荐算法[J].计算机科学,2004,31(11):147-149. 被引量：6
5黄巧莉,刘胜,刘飞.网络化销售和定制个性化信息推荐系统研究及应用[J].现代制造工程,2005(8):31-35. 被引量：1
6张海燕,丁峰,姜丽红.基于模糊聚类的协同过滤推荐方法[J].计算机仿真,2005,22(8):144-147. 被引量：25
7刘云峰,齐欢,Xiang’en Hu,Zhiqiang Cai.潜在语义分析权重计算的改进[J].中文信息学报,2005,19(6):64-69. 被引量：19
8欧立奇,陈莉,马煜.协同过滤算法中新项目推荐方法的研究[J].微计算机信息,2005,21(11X):186-187. 被引量：10
9陈涛,谢阳群.文本分类中的特征降维方法综述[J].情报学报,2005,24(6):690-695. 被引量：79
10张锋,常会友.使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J].计算机研究与发展,2006,43(4):667-672. 被引量：85

共引文献223

1宋智玲.蚁群算法优化结点和聚类技术在复杂网络中发现社团的研究[J].实验室研究与探索,2010,29(7):79-82.
2王晓芳.基于边链接权重的局部社团探测算法[J].农业网络信息,2012(12):32-33.
3武森,冯小东,吴庆海.基于稀疏指数排序的高维数据并行聚类算法[J].系统工程理论与实践,2011,31(S2):13-18. 被引量：1
4智源,行飞.复杂网络社区结构问题综述[J].阴山学刊（自然科学版）,2011,25(3):31-34. 被引量：2
5邓波,张玉超,金松昌,林旺群.基于MapReduce并行架构的大数据社会网络社团挖掘方法[J].计算机研究与发展,2013,50(S2):187-195. 被引量：10
6赵金利,张群华,余贻鑫,贾宏杰,杨锦.输电网网架结构的谱聚类分析算法[J].电力系统及其自动化学报,2009,21(4):8-11. 被引量：10
7田野,刘大有,杨博.复杂网络聚类算法在生物网络中的应用[J].计算机科学与探索,2010,4(4):330-337. 被引量：9
8王娟,靳京,钱伟中,秦志光.基于小波分解的群落流量异常检测[J].电子测量与仪器学报,2010,24(4):365-370. 被引量：5
9李峻金,向阳,牛鹏,刘丽明,芦英明.一种新的复杂网络聚类算法[J].计算机应用研究,2010,27(6):2097-2099. 被引量：8
10李孔文,顾庆,张尧,陈道蓄.一种基于聚集系数的局部社团划分算法[J].计算机科学,2010,37(7):46-49. 被引量：12

同被引文献5

1王丹,吴孟达,刘银山.粗糙关系数据库空间结构及其粗糙集模型[J].计算机工程与应用,2005,41(34):163-167. 被引量：8
2T Beaubouef, F E Petry, B. Buckles. Extension of the relational database and its algebra with rough set techniques[J]. Computational Intelligence, 1995, 11 (2): 233-245.
3安秋生.粗糙函数依赖的近似度量[J].计算机工程与应用,2009,45(1):144-146. 被引量：6
4韩凌波,王强,蒋正锋,郝志强.一种改进的k-means初始聚类中心选取算法[J].计算机工程与应用,2010,46(17):150-152. 被引量：93
5安秋生,徐久成,沈钧毅,王国胤.Rough关系数据库模型及其关系操作[J].计算机科学,2002,29(7):72-74. 被引量：8

引证文献2

1魏玲玲,邱桃荣.一种粗关系数据结构数据排序方法[J].微电子学与计算机,2013,30(4):149-151.
2武森,王蔷,姜敏,魏青.考虑加权排序的分类数据聚类算法[J].北京科技大学学报,2013,35(8):1093-1098. 被引量：2

二级引证文献2

1王连喜,蒋盛益.一种基于特征聚类的特征选择方法[J].计算机应用研究,2015,32(5):1305-1308. 被引量：20
2詹岑,董辉,徐型平.基于视频数据治理技术的社区安全管控应用浅析[J].警察技术,2019,0(6):15-18.

1徐德,谭维,杨燕,侯天子,黄乐.I-Miner环境下聚类分析算法研究与实现[J].现代计算机,2009,15(2):30-34.
2刘希宋,喻登科,李玥.基于客户知识的客户CABOSFV聚类[J].情报杂志,2008,27(2):7-9. 被引量：3
3梁辰,张庆.基于聚类的数据挖掘技术在电子商务CRM中的应用研究[J].电脑与电信,2008(6):92-93. 被引量：2
4向浩.DS-CABOSFV流数据聚类算法[J].中国科技成果,2011(16):64-66.
5殷佳,武森,王沙骋.CABOSFV算法的改进方法[J].情报探索,2007(9):112-114.
6祝琴,高学东,武森,陈敏,陈华.基于排序思想的高维稀疏数据聚类[J].计算机工程,2010,36(22):13-14. 被引量：2
7武森,张文丽,黄慧敏,叶俞飞.FD-CABOSFV区间变量高维数据聚类[J].信息系统学报,2012,6(1):77-87.
8李旭辉,郑丽英,徐顼,贾海鹏,何知军.一种基于高维空间聚类的离群数据发现算法[J].微电子学与计算机,2007,24(12):44-46. 被引量：2
9王东波,朱丹浩.基于CABOSFV聚类算法的汉语词汇类别知识挖掘研究[J].计算机科学,2013,40(7):211-215. 被引量：1
10高学东,吴玲玉.基于高维聚类技术的中文关键词提取算法[J].中国管理信息化,2011,14(9):23-27. 被引量：2

计算机工程与应用

2011年第34期

浏览历史

内容加载中请稍等...

考虑数据排序的改进CABOSFV聚类被引量：2

参考文献5

二级参考文献100

共引文献223

同被引文献5

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

考虑数据排序的改进CABOSFV聚类 被引量：2

参考文献5

二级参考文献100

共引文献223

同被引文献5

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

考虑数据排序的改进CABOSFV聚类被引量：2