基于可变加权的高维数据子空间聚类算法研究被引量：2

Study of subspace clustering algorithm of high dimensional data based on variable weighting methods

下载PDF

导出

摘要高维数据的稀疏性和"维灾"问题使得多数传统聚类算法失去作用,因此研究高维数据集的聚类算法己成为当前的一个热点。子空间聚类算法是实现高维数据集聚类的有效方法之一。介绍并实现了基于可变加权的高维数据子空间聚类算法SCAD和EWKM,并分别对人造数据、现实数据等数据集进行测试,根据测试结果进行分析,对比两种算法的性能及适用场合。 The sparsity and the problem of the curse of dimensionality of high--dimensional data, make the most of traditional clustering algorithms lose their action in high-dimensional space. Therefore, clustering of data in a high-dimensional space becomes a hot research area. Subspace clustering algorithm is one of the effective ways to handle problems of high-dimensional data clustering. This paper introduces and realizes two algorithms （SCAD and EWKM） that discover clusters in subspaces spanned by different combinations of dimensions via local weightings of features. We experiment these algorithms using synthetic datasets and real datasets, then analyze the results and contrast their performance and applicable occasions.

作者邓莹杨双远刘菡

机构地区厦门大学软件学院

出处《信息化纵横》 2009年第10期55-58,共4页

关键词高维数据稀疏子空间聚类精确率熵 high dimensional data sparsity subspace clustering precision entropy

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1Han Jiawei,Kamber Micheline,范明,孟小峰,等译.数据挖掘概念与技术[M].北京:机械工业出版社,2007:424-479.
2FRIGUI H, NASRAOUI O, Simuhaneous clustering and attribute discrimination[C]. Proceeding of the 9th IEEE International Conference on Fuzzy Systems, 2000.
3JING L. NG M. K. and HUANG. J. Z. An Entropy Weighting K-Means algorithm for subspace clustering of high-dimensional sparse data[J]. IEEE Transactions on Knowledge and Data Engineering, 2007,19(8) : 1-16.
4测试数据集.http://archive.ics.uci.edu/ml/machine-learning-databases.

共引文献42

1贾宗维,崔军,于慧娟.基于相异度度量的图聚类方法[J].山西农业大学学报（自然科学版）,2009,29(3):284-288. 被引量：2
2焦亚冰.数据挖掘中关联规则在超市商品管理中的应用[J].太原师范学院学报（自然科学版）,2009,8(2):93-95. 被引量：2
3高亚鲁,宋余庆,朱玉全.改进的CLIQUE优化算法[J].计算机工程与设计,2009,30(16):3801-3804. 被引量：4
4梅亮,高尚,葛世伦.基于概念分层的关联规则在酒店餐饮营业数据库的应用[J].江苏科技大学学报（自然科学版）,2009,23(4):352-357. 被引量：3
5张月琴.基于0-1矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2009,30(20):4662-4664. 被引量：8
6杨金凤,刘锋.一种新的改进Apriori算法[J].微型机与应用,2010,29(1):55-56. 被引量：1
7宋强,王莲芝,刘广利.基于熵变的DAG-SVMs的组合策略[J].计算机工程与设计,2010,31(4):832-835. 被引量：2
8仵雪婷,周明建.数据流挖掘方法研究[J].计算机与现代化,2010(4):46-50. 被引量：1
9侯新丽,孟晓伟,于松.基于矩阵的加权关联规则挖掘算法[J].电脑开发与应用,2010,23(6):34-36. 被引量：4
10谢明霞,郭建忠,陈科.改进k中值聚类及其应用[J].烟台大学学报（自然科学与工程版）,2010,23(3):217-222. 被引量：1

同被引文献4

1周晓云,孙志挥,张柏礼,杨宜东.高维数据流子空间聚类发现及维护算法[J].计算机研究与发展,2006,43(5):834-840. 被引量：17
2武森高学东.高维稀疏数据聚类算法CABOSFV.北京科技大学学报,2004,11(3):283-288.
3HanJiawei MichelineKambe.数据挖掘概念与技术[M].北京：机械工业出版社,2001..
4邓文韬.基于几何特征加权和选择的数据空间聚类算法研究[J].信息技术与信息化,2014(12):67-69. 被引量：2

引证文献2

1祝琴,高学东,武森,陈敏,陈华.基于排序思想的高维稀疏数据聚类[J].计算机工程,2010,36(22):13-14. 被引量：2
2孙兴文.基于特征加权与特征选择的数据挖掘算法研究[J].网络安全技术与应用,2016(11):76-77.

二级引证文献2

1祝琴,高学东,武森,陈华.高维稀疏数据对象——属性空间分割[J].数学的实践与认识,2011,41(7):184-189. 被引量：1
2王晨,尹静,王红春.基于分拣机器人零售电商订单动态聚类及仿真[J].包装工程,2020,41(3):170-175. 被引量：5

1詹艳梅,曾向阳,孙进才.基于粗糙集理论的目标特征选择方法[J].自然科学进展,2004,14(12):1483-1487. 被引量：2
2实现设备实时数据的读取、挖掘、管理与分析[J].现代制造,2014(30):16-16.
3可编程远程测控基站[J].现代制造,2009(26):60-60.
4单州莹,单文宜.GIS/SCADA/OMS的整体网络解决方案[J].自动化博览,2006,23(1):19-21.
5孙红娜.不要孤军作战[J].网管员世界,2009(24):9-9.
6兰高志.一种如何使木马失去作用的新方法[J].科学技术与工程,2009,9(14):4215-4218.
7虎子哥哥.摧毁还原精灵保护系统[J].黑客防线,2008(7):94-95.
8工业控制网络安全系列之六新一代基于服务的SCADA/DCS系统化体系架构[J].微型机与应用,2015,34(9):1-4. 被引量：1
9秦志光,包文意,赵洋,熊虎.云存储中一种模糊关键字搜索加密方案[J].信息网络安全,2015(6):7-12. 被引量：20
10李向军,徐国华,刘立平.一种文本聚类算法[J].西北大学学报（自然科学版）,2005,35(2):155-158. 被引量：3

信息化纵横

2009年第10期

浏览历史

内容加载中请稍等...

基于可变加权的高维数据子空间聚类算法研究被引量：2

参考文献4

共引文献42

同被引文献4

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于可变加权的高维数据子空间聚类算法研究 被引量：2

参考文献4

共引文献42

同被引文献4

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于可变加权的高维数据子空间聚类算法研究被引量：2