基于网格带有参考参数的扩展聚类算法被引量：4

Extended Grid-based Clustering Algorithm with Referential Parameters

下载PDF

导出

摘要作者在前期研究工作中提出了一种基于网格的带有参考参数的聚类算法(GR-PC),该算法从用户的角度去看待聚类,最大程度地避免用户设置聚类参数的盲目性.本文对GRPC算法在高维性和可伸缩性两方面进行了扩展,将高维数据空间的聚类工作分解到二维数据空间来进行,并采用随机抽样技术来处理大规模的数据集.实验仿真表明,该算法能在三维及其以上的数据空间有效地聚类较大规模数据集. By calculating density threshold data, some effective referential parameters were worked out and provided for users, and a new kind of clustering algorithm called GRPC was presented. With the help of these referential parameters, we could not only cluster general data but also segregate high-density clusters from lowdensity clusters. The problem of low quality of clusters of traditional grid clustering algorithm was solved when we usually ignored the distribution of data on partitioning grid. Experiment results have proved that this new algorithm can differentiate between outliers or noises and dusters effectively and discover dusters of arbitrary shapes, with good clustering quality.

作者周炎涛吴正国易兴东

机构地区湖南大学电气与信息工程学院海军工程大学信息与电气工程学院

出处《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2009年第2期48-52,共5页 Journal of Hunan University:Natural Sciences

基金国家自然科学基金资助项目(10572048,50677069)

关键词网格密度阈值聚类算法数据挖掘 grid clustering density threshold clustering algorithm data mining

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1JIAWEI H, MICHELINE K. Data mining concepts and techniques[ M]. San Francisco: Morgan Kaufmarm Publishers, 2003.
2KAUFMAN L, ROUSSEEUW P J. Finding groups in data:an introduction to cluster analysis [ M.], New York: John Wiley&Sons, 1990.
3NG R,HAN .L Efficient and effective clustering method for spatial data mining[C]//Proc1994 Int Cord Very Large Data Bases (VLDB'94). Santiago, Chile, 1994:144 - 155.
4ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Proceeding of 2nd Int Conf On Knowledge Discovery and Data Mining. Portland: AAAI Press, 1996:226-231.
5KARYPIS G, HAN E H, KUMAR V. Chameleon: a hierarchical clustering algorithm using dynamic modeling[J]. IEEE Computer, 1999, 32(8): 68-75.
6UHA S, RASTOGI R, SHIM K. CURE: an effieient clustering algorithm for large databases[C]//A Proe of ACM SIGMOD International Conference on Managernent of Data. Seattle: ACM Press, 1998: 73 - 84.
7ERTOZ L, STEINBACH M, KUMAR V. Finding clusters of difexent sizes, shapes and densities in noisy[ C]//High Dimension: al Data. Canada: SIAM Press,2003:1 - 12.
8邱保志,张西芝.基于网格的参数自动化聚类算法[J].郑州大学学报（工学版）,2006,27(2):91-93. 被引量：14
9ZHOU Y T,YI X D,WU Z G. A grid-based clustering algorithm with referential value of parameters[C]//The Proceeding of International Symposium on Computer Science and Technology. Printed in the United States of America and China: The American Scholars Press, 2007 : 210 - 214.

二级参考文献5

1ESTER M, KRIEGEL H P, SANDER J, et al. A density- based algorithm for discovering clusters in large spatial databases with noise [ A ]. Proceeding of 2nd int Conf On Knowledge Discovery and Data Mining[ C ], Portland : AAAI Press, 1996. 226 - 231.
2KARYPIS G, HAN E H, KUMAR V. Chameleon: A hierarchical clustering algorithm using dynamic modeling[J]. IEEE Computer,1999,32(8) :68 - 75.
3GUHA S, RASTOGI R,SHIM K. CURE: An Efficient Clustering Algorithm for Large Databases [ C ]. New York :ACM Press, 1998.73 - 84.
4ERTOZ L, STEINBACH M, KUMAR V. Finding Clusters of Different Sizes, Shapes, and Densities in Noisy, High Dimensional Data [ C ]. Canada: SIAM Press, 2003,2003.1 - 12.
5HSU C M, CHEN M S. Subspace Clustering of High Dimensional Spatial Data with Noises [ C ]. Germany:Springer, 2004.31- 40.

共引文献13

1华斌,陈玲.基于聚类的科技经费决策分析模型[J].郑州大学学报（理学版）,2007,39(3):55-58. 被引量：2
2谭秀湖,刘国枝,孙旭.基于最小均方差下的3D模型数字水印算法[J].郑州大学学报（工学版）,2006,27(4):101-105. 被引量：3
3周炎涛,易兴东,吴正国.基于网格的带有参考参数的聚类算法[J].计算机工程,2008,34(9):98-100. 被引量：3
4吴强.基于电子商务网站的改进聚类算法的应用研究[J].郑州轻工业学院学报（自然科学版）,2008,23(3):103-107.
5张云鹏,张璐,翟正军,马春燕,戴维迪.一种不同的基于数据分区的并行构建密度树聚类算法(PCDTC)[J].西北工业大学学报,2008,26(4):524-529.
6张天伍,荆立夏.一种基于网格的引力聚类算法[J].微计算机信息,2009,25(18):270-271. 被引量：1
7孟建良,程伟想,牛为华.基于网格距离的高精度聚类算法[J].计算机应用与软件,2009,26(6):262-264. 被引量：4
8邱保志,卢海艇.基于网格和密度权值的模糊c均值聚类算法[J].计算机工程与设计,2010,31(4):822-824. 被引量：1
9邱保志,曹鹤玲.一种高效的基于联合熵的边界点检测算法[J].控制与决策,2011,26(1):71-74. 被引量：6
10邱保志,许敏.无参数聚类边界检测算法的研究[J].计算机工程,2011,37(15):23-26. 被引量：4

同被引文献50

1王建会,申展,胡运发.一种实用高效的聚类算法[J].软件学报,2004,15(5):697-705. 被引量：26
2李基拓,陆国栋.基于边折叠和质点弹簧模型的网格简化优化算法[J].计算机辅助设计与图形学学报,2006,18(3):426-432. 被引量：16
3HanJW,KambrM.数据挖掘概念与技术.第2版.北京:机械工业出版社,2001.251-305.
4Jiang DX, Tang C, Zhang AD. Cluster analysis for gene expression data: A survey. IEEE Trans. on Knowledge and Data Engineering, 2004,16(11): 1370-1386.
5Wang K J, Wang B J, Peng LQ. CVAP: Validation for Cluster Analyses. Data Science Journal,2009,8(20):88-93.
6Kuncheva LI, Vetrov DP. Evaluation of stability of k-means cluster ensembles with respect to random initialization. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2006,28(11): 1798-1808.
7Ng AY, Jordan MI, Weiss Y. On Spectral Clustering:Analysis and an Algorithm. Proc. of 14th Advances in Neural Information Processing Systems. 2001 849-856.
8Lange T, Roth V, Braun NIL, Buhmann JM. Stability-Based Validation of Clustering Solutions. Neural Computation, 2004,16(6): 1299-1323.
9Han Jiawei, Micheline Kamber, Written; Fan ming Meng Xi- aofeng, Trans. Data Minging: Concepts and Techniques [ M]. 2^nd ed, Beijing: China Machine Press, 2007.
10Anil K. Jain. Data clustering: 50years beyond K-means[J].Pat tern Recognition Letters, 2010,31 (8) : 651-666.

引证文献4

1李翔宇,王开军,郭躬德.挑选聚类算法的网格连通图方法[J].计算机系统应用,2012,21(9):103-107.
2李翔宇,王开军,郭躬德.基于算法选择和结果评估的自动聚类方法[J].计算机与数字工程,2012,40(11):39-42.
3徐德刚,徐戏阳,陈晓,赵盼磊,苏志芳,谢永芳,阳春华.基于Minkowski距离的一致聚类改进算法及应用研究[J].湖南大学学报（自然科学版）,2016,43(4):133-140. 被引量：3
4李铁瑞,吴慧,王奇胜,高博青.基于离散化的复杂曲面建筑网格划分方法[J].湖南大学学报（自然科学版）,2018,45(7):48-53. 被引量：3

二级引证文献6

1尹诗,杨坚争,尹清杰.基于一致聚类和PLS方法的电子商务竞争力形成机理研究[J].生产力研究,2016(12):7-12. 被引量：1
2高强,刘齐,张军阳,许永鹏.利用AP-SSVM算法识别GIS的局放缺陷类型[J].电气自动化,2018,40(1):108-111. 被引量：1
3黎佳,陈元坤,陈晓强,陈礼杰,吴雄,熊政超,朱爱珠.基于切比雪夫网格的自由曲面网格自适应及杆长优化[J].土木工程与管理学报,2020,37(3):91-95.
4郭小农,李政宁,计丽艳,欧阳辉.基于结点作用力和拉普拉斯平滑的单层球面网格处理方法[J].湖南大学学报（自然科学版）,2023,50(3):71-79. 被引量：1
5池宝涛,朱玉麒,郭前建,袁伟,张耀明.面向双层插值边界面法的非结构自动网格划分[J].湖南大学学报（自然科学版）,2023,50(4):76-86. 被引量：2
6杨玺,陈爽,彭子睿,高镇,王安龙.基于k-Medoids聚类和深度学习的分布式短期负荷预测[J].微型电脑应用,2024,40(1):80-83.

1周炎涛,易兴东,吴正国.基于网格的带有参考参数的聚类算法[J].计算机工程,2008,34(9):98-100. 被引量：3
2钟超雄.关于电气自动化控制设备的可靠性分析[J].华东科技（学术版）,2015,0(5):327-327.
3车载GPS推荐榜Top25——精准任我行[J].互联网周刊,2009(15):71-71.
4王兴伟,赵宏,朱家铿.支持分布系统中分布实体间相互协作的新型通信合作机制——成组远程过程调用机制[J].计算机工程与设计,1993,14(6):8-14. 被引量：1
5李鸣鹏,高宏,邹兆年.基于图压缩的k可达查询处理[J].软件学报,2014,25(4):797-812. 被引量：3
6姜胜辉,刘献礼,王义文,陈涛.基于Web的超硬刀具综合信息系统[J].哈尔滨理工大学学报,2007,12(2):48-50.
7黄志峰,杨良怀,龚卫华,陈立军.kμ-Tree:一种空间有效的嵌入式闪存数据库索引[J].小型微型计算机系统,2010,31(6):1097-1101. 被引量：1
8王晗,闫彩艳,游龙翔.一种新型电子变压器的研制[J].厦门大学学报（自然科学版）,2005,44(B06):302-306. 被引量：1
9周兵,沈钧毅,彭勤科.基于随机抽样和聚类特征的聚类算法[J].西安交通大学学报,2003,37(12):1234-1237. 被引量：6
10杜秀亭,杨晨光.基于最短主干道距离的零售户聚类研究[J].内蒙古大学学报（自然科学版）,2012,43(3):306-312.

湖南大学学报（自然科学版）

2009年第2期

浏览历史

内容加载中请稍等...

基于网格带有参考参数的扩展聚类算法被引量：4

参考文献9

二级参考文献5

共引文献13

同被引文献50

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于网格带有参考参数的扩展聚类算法 被引量：4

参考文献9

二级参考文献5

共引文献13

同被引文献50

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于网格带有参考参数的扩展聚类算法被引量：4