一种基于排序子空间的高维聚类算法及其可视化研究被引量：3

Clustering by Ordering Density-Based Subspaces and Visualization

下载PDF

导出

摘要为了有效地发现数据聚簇 ,尤其是任意形状的聚簇 ,近年来提出了许多基于密度的聚类算法 ,如DBSCAN ,OP TICS ,DENCLUE ,CLIQUE等提出了一个新的基于密度的聚类算法CODU(clusteringbyorderingdenseunit) ,基本思想是对单位子空间按密度排序 ,对每一个子空间 ,如果其密度大于周围邻居的密度则形成一个新的聚簇由于子空间的数目远小于数据对象的数目 ,因此算法效率较高同时 ,提出了一个新的数据可视化方法 ,将数据对象看做刺激光谱映射到三维空间。 Finding clusters on the basis of density distribution is a traditional approach to discover clusters with arbitrary shape Some density based clustering algorithms such as DBSCAN, OPTICS, DENCLUE, CLIQUE, etc have been explored in recent researches A new approach is presented, which is based on the ordered subspaces to find clusters The key idea is to sort the subspaces according to their density, and set a new cluster if the subspace is larger than its neighbors Since the number of the subspaces is much less than that of the data, very large databases with high dimensional data sets can be processed with high efficiency A new method is also presented to project high dimensional data, and then some results of clustering with visualization are demonstrated

作者刘勘周晓峥周洞汝

机构地区中南财经政法大学信息学院武汉大学计算机学院

出处《计算机研究与发展》 EI CSCD 北大核心 2003年第10期1509-1513,共5页 Journal of Computer Research and Development

关键词聚类基于密度数据可视化 cluster density based data visualization

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1T Zhang, R Ramakrishnan, M Livny. BIRCH: An efficient data clustering method for very large databases. In: Proc of the 1996 ACM SIGMOD Int'l Conf on Management of Data. Montreal, Quebec: ACM Press, 1996. 103-114.
2S Guha, R Rastogi, K Shim. Cure: An efficient clustering algorithm for large databases. In: Proc of 1998 ACM SIGMOD Int'l Conf on Management of Data. Seattle, Washington: ACM Press, 1998. 73-84.
3G Karypis, E H Flan, V Kumar. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. Gomputex, 1999,32(8) : 68-75.
4L Kaufman, P J Rousseeuw. Finding Groups in Data: An Introduction to Cluster Analysis. New York: John Wiley & Sons, 1990.
5R Ng, J W Han. Efficient and effective clustering method for spatial data mining. In: Proe of the 20th Int' 1 Conf on Very Large Data Bases (VLDB'94). Santiago, Chile: Morgan Kauflmann, 1994. 144-155.
6J W Han, M Darnber. Data Mining: Concepts and Techniques. San Francisco.. Morgan Kaufmann, 2001. 363-381.
7R Agrawal, J Gehrke, D Gunopulos et al. Automatic subspace clustering of high dimensional data for data mining applications. In: Proc of 1998 ACM SIGMOD Int'l Conf on Management of Data. Seattle, Washington: ACM Press, 1998. 94-105.
8M Ester, H P Kriegel, J Sander et al. A density-based algorithm for discovering clusters in large spatial databases. In: Proc of the 2nd Int'l Conf on Knowledge Discovery and Data Mining (KDD' 96). Portland, OR: AAAI Press, 1996. 226-231.
9M Ankerst, M M Breunig, H P Kriegel et al. OPTICS: Ordering points to identify the clustering structure. In: Proc of 1999 ACM SIGMOD Int'l Conf on Management of Data. Philadelphia, Pennsylvania: ACM Press, 1999. 49-60.
10H Ivan, M Guy, M S Marshall. Graph visualization and navigation in information visualization: A survey, IEEE Trans on Visualization and Computer Graphics, 2000, 6(2): 24-43.

同被引文献24

1付淇,李正凡.基于CLIQUE的聚类算法研究[J].华东交通大学学报,2006,23(5):79-82. 被引量：12
2杜峰,施文康,邓勇.基于Hausdroff距离的扩展模糊数相似性测度[J].上海交通大学学报,2005,39(4):614-617. 被引量：5
3王生生,刘大有,曹斌,刘杰.一种高维空间数据的子空间聚类算法[J].计算机应用,2005,25(11):2615-2617. 被引量：12
4任永功,于戈.一种多维数据的聚类算法及其可视化研究[J].计算机学报,2005,28(11):1861-1865. 被引量：13
5杜培军,唐宏,方涛.高光谱遥感光谱相似性度量算法与若干新方法研究[J].武汉大学学报（信息科学版）,2006,31(2):112-115. 被引量：21
6刘宝生,闫莉萍,周东华.几种经典相似性度量的比较研究[J].计算机应用研究,2006,23(11):1-3. 被引量：44
7胡彩平,秦小麟.空间数据挖掘研究综述[J].计算机科学,2007,34(5):14-19. 被引量：10
8邓敏,钮沭联,李志林.GIS空间目标的广义Hausdorff距离模型[J].武汉大学学报（信息科学版）,2007,32(7):641-645. 被引量：22
9徐遵义,晏磊,宁书年,刘光军.基于Hausdorff距离的海底地形匹配算法仿真研究[J].计算机工程,2007,33(9):7-9. 被引量：15
10Han Jiawei,Kamber M.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2001:224-249.

引证文献3

1胡健,董跃华.一种基于最近邻优先的知识聚类算法[J].江西理工大学学报,2008,29(5):72-74. 被引量：2
2项响琴,李红,陈圣兵.CLIQUE聚类算法的分析研究[J].合肥学院学报（自然科学版）,2011,21(1):54-58. 被引量：7
3施蓓琦,刘春,陈能,林文鹏.典型地物实测光谱的相似性测度与实验分析[J].同济大学学报（自然科学版）,2011,39(2):292-298. 被引量：6

二级引证文献15

1李国志,王洪春,李世全.一种基于分类的关联规则Apriori算法[J].江南大学学报（自然科学版）,2009,8(5):535-538. 被引量：3
2胡健,王慧.实时数据库中的知识发现后处理研究[J].江西理工大学学报,2011,32(5):63-66. 被引量：1
3路飞,刘志勇,田国会,李健.基于条件反射机制的用户行为习惯获取方法[J].系统仿真学报,2014,26(6):1274-1279.
4向柳明,周渭博,钟勇.基于高斯过程的CLIQUE改进算法[J].计算机应用,2015,35(A02):85-87. 被引量：7
5戴晓爱,杨晓霞,高孝杰,杨武年,贾虎军,杨叶,潘佩芬.基于高光谱非线性向量空间的光谱曲线特征差异性分析[J].遥感技术与应用,2015,30(6):1095-1102. 被引量：1
6高孝杰,简季,戴晓爱,陈婉佳.基于Fréchet距离的光谱曲线匹配应用分析[J].武汉大学学报（信息科学版）,2016,41(3):408-414. 被引量：15
7刘锦文,邢凯,芮伟康,张利萍,周慧.基于信息关联拓扑的互联网社交关系挖掘[J].计算机应用,2016,36(7):1875-1880. 被引量：3
8戴晓爱,贾虎军,张晓雪,吴芬芳,郭守恒,杨武年,杨叶.岷江上游亚高山典型森林植被高光谱特征识别[J].国土资源遥感,2016,28(3):174-180. 被引量：3
9戴晓爱,贾虎军,吴芬芳,杨晓霞.空间数据压缩的高光谱降维技术比较[J].遥感信息,2017,32(2):107-112. 被引量：5
10张淼,于文博,沈飞,谢长生,沈毅.基于改进Hough算法的高光谱数据直线检测方法研究[J].上海航天,2017,34(3):27-32. 被引量：2

1黄斯达,陈启买.基于相似性度量的高维聚类算法的研究[J].微计算机信息,2009,25(27):187-188. 被引量：4
2冯永,吴开贵,熊忠阳,吴中福.一种有效的并行高维聚类算法[J].计算机科学,2005,32(3):216-218. 被引量：6
3陈云开,卢正鼎,刘芳,郭洁.一种高维聚类算法及在洗钱侦测中的应用[J].计算机科学,2007,34(6):191-193. 被引量：5
4冯永,钟将,熊忠阳,叶春晓,吴中福.一种自底向上的高维聚类算法[J].重庆大学学报（自然科学版）,2006,29(9):106-110.
5单世民,邓贵仕,何英昊.基于密度的微粒群优化混合聚类算法[J].计算机工程,2007,33(8):170-172. 被引量：1
6余小高,余小鹏.基于距离和密度的无监督聚类算法的研究[J].计算机应用与软件,2010,27(7):122-125. 被引量：5
7宗瑜,李明楚,徐贯东,张彦春.局部显著单元高维聚类算法[J].电子与信息学报,2010,32(11):2707-2712. 被引量：1
8郏宣耀.基于相似性二次度量的高维数据聚类算法[J].计算机应用,2005,25(B12):176-177. 被引量：3
9顾冬娟,戴浩.改进的基于密度和网格的高维聚类算法[J].科技创新导报,2008,5(22):29-29.
10朱倩,黄志军.一种改进的基于密度和网格的高维聚类算法[J].舰船电子工程,2005,25(5):55-56. 被引量：5

计算机研究与发展

2003年第10期

浏览历史

内容加载中请稍等...

一种基于排序子空间的高维聚类算法及其可视化研究被引量：3

参考文献11

同被引文献24

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于排序子空间的高维聚类算法及其可视化研究 被引量：3

参考文献11

同被引文献24

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种基于排序子空间的高维聚类算法及其可视化研究被引量：3