基于集聚度增量的空间聚类算法被引量：1

A Fast Algorithm of Spatial Clustering Based on Agglomeration

下载PDF

导出

摘要该文借鉴了复杂网络领域的模块度概念,构造了空间点集的集聚度函数。基于集聚度的增量值,提出一个快速的空间聚类算法。实验证明,该值同点集的类间均方差(SSB)与类内均方差(SSE)的比值(SSB/SSE)有相同的结论,可以评价不同的点集在空间分布上的集聚程度(即群簇结构是否明显),同时该算法可以在不预先设定聚类个数的情况下快速有效地得到聚类结果。 In the field of spatial analysis, clustering is always under the spotlight. Many methods for cluster detection have been well studied. Among them, there exists a key issue which many researchers are concentrated on. That is how to get the optimal clustering results when we don＇t know the number of clusters beforehand. In the field of complex networks, modularity is used to measure the clustering of links. Based on the modularity, a definition of agglomeration was proposed to measure the spatial clustering structure. Then, a fast algorithm was put forward for grouping space points based on the increment of agglomeration. The experiments show that the value of agglomeration can evaluate the clustering structure between different datasets, and the result is similar to the SSB/SSE（SSB is the variance between clusters, and SSE is the variance within the clusters）. In additional, the algorithm runs quickly and effectively.

作者陈娱许珺徐敏政

机构地区中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室中国科学院大学

出处《地理与地理信息科学》 CSCD 北大核心 2013年第4期104-108,共5页 Geography and Geo-Information Science

基金国家自然科学基金项目(41171296) 国家863计划项目(2012AA12A211)

关键词空间聚类群簇结构集聚度复杂网络模块度 spatial clustering cluster structure agglomeration complex network modularity

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献8

1罗可,蔡碧野,吴一帆,谢中科,张丽.数据挖掘中聚类的研究[J].计算机工程与应用,2003,39(20):182-184. 被引量：31
2LII)YD S P. Least .squares quantization in PCM[J]. IEEE Transac- tions on Information Theory, 1982,28 .. 128- 137.
3M,KRIEGEL H P,SANDER J,et al. A density-based al- gorithm for discovering clusters in large spatial databases[A]. Proceedings of the 2nd Internatinal Conference on KnowledgeDiscovery and Data Mining[C]. Amsterdam.. Elsevier Science, 1996. 226-231.
4NEWMAN M E J,GIRVAN M. Finding and evaluating community structure in networks[J]. Phys. Rev. E, 2004,69(026113).
5BARAB,/iSIAL徐彬(译).Linked[M].长沙:湖南科学技术出版社,2007.8.
6CLAUSET A, NEWMAN M E J, MOORE C. Finding commu- nity structure in very large networks[J]. Phys. Rev. E, 2004,70 (066111).
7TANPN,STEINBAcHM,KUMARV数据挖掘导论(英文版)[M].北京:机械工业出版社,2010.523-524.
8孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072

二级参考文献9

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2A K Jain,M N Murty,P J Flynn.Data clustering:A survey[J].ACM Computer Surv, 1999 ;31 : 264-323.
3R Agrawal,J Gehrke,D Gonopolos et al.Automatic subspace clustering of high dimensional data for data mining applications[C].In :Proc 1995 ACM-SIGMOD Int Conf Management of Data,Seattle,WA,.1998:94-105.
4R Agrawal,R Srikant.Privacy-preserving data mining[C].In :Proc 2000 ACM-SIGMOD Int'l Conf.Management of Data,Dallas,TX,2000:439-450.
5P Bradley,U Fayyad,C Reina.Scaling Clustering Algorithms to Large Databases[C].In:Knowledge Discovery and Data Mining,AAAI Press, Menlo Park,Calif, 1998:9-15.
6V Ganti et al.Clustering Large Datasets in Arbitrary Metric Spaces [C].In : Data Engineering, IEEECS Press, Los Alamitos, Calif, 1999 : 502-511.
7M Goebel,L Gruenwald.A survey of data mining and knowledge discovery software tools[J].SIGKDD Explorations, 1999: ( 1 ) :20-33.
8胡侃,夏绍玮.基于大型数据仓库的数据采掘:研究综述[J].软件学报,1998,9(1):53-63. 被引量：256
9罗可,吴杰.巨型数据库中的数据采掘[J].计算机工程与应用,2001,37(20):88-91. 被引量：9

共引文献1101

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10何睿,余娜,李淼,张峻巍,王浩杰,赵玉茗.基于单细胞RNA测序数据的细胞类型聚类算法[J].智能计算机与应用,2020,10(7):104-108. 被引量：2

同被引文献3

1王荣,李晋宏,宋威.基于关键字的用户聚类算法[J].计算机工程与设计,2012,33(9):3553-3557. 被引量：8
2陈克寒,韩盼盼,吴健.基于用户聚类的异构社交网络推荐算法[J].计算机学报,2013,36(2):349-359. 被引量：125
3马林兵,李鹏.基于子空间聚类算法的时空轨迹聚类[J].地理与地理信息科学,2014,30(4):7-11. 被引量：9

引证文献1

1郑束蕾,杨春雷,李瑛,王成舜.基于聚类分析和判别分析的地图用户分类研究[J].测绘与空间地理信息,2015,38(4):14-16. 被引量：3

二级引证文献3

1董卫华,廖华,詹智成,刘兵,王圣凯,杨天宇.2008年以来地图学眼动与视觉认知研究新进展[J].地理学报,2019,74(3):599-614. 被引量：38
2万刚,武易天.地图空间认知的数学基础[J].测绘学报,2021,50(6):726-738. 被引量：5
3董卫华,刘毅龙,黑巧松,杨天宇.泛地图空间认知理论与方法研究框架[J].武汉大学学报（信息科学版）,2022,47(12):2007-2014. 被引量：5

1潘宝明,张发勇,戈少娟.GIS技术在通信网络领域的应用[J].数字通信世界,2005(6):48-52.
2GEOPHYSICS[J].Abstracts of Chinese Geological Literature,1998,14(1):8-8.
3李静,罗灵军,钱文进,刘建.基于GIS的重庆市人口空间分布研究[J].地理空间信息,2013,11(2):42-46. 被引量：20
4杜爽,胡鹏,韩元利.三维空间点集可视化[J].测绘信息与工程,2006,31(2):27-29.
5庄佳芳,余思勤.基于探索性空间数据分析的我国港口空间格局[J].上海海事大学学报,2013,34(3):66-71. 被引量：10
6孔娟,周长伦,姜家轩,王春梅,许自国.空间聚类算法在数字化城市管理中的应用[J].信息技术与信息化,2008(2):74-76. 被引量：1
7SEISMIC GEOLOGY[J].Abstracts of Chinese Geological Literature,1995,11(3):10-12.
8朱春燕.有线电视地理信息系统的设计与实现[J].科技信息,2006(08X):20-20.
9王诗雨,雷国平.基于GIS的垦区农村居民点空间分布特征及影响因素分析[J].国土资源情报,2012(11):41-45. 被引量：4
10杨威.南极纪行(一)[J].海洋世界,2006(1):42-45.

地理与地理信息科学

2013年第4期

浏览历史

内容加载中请稍等...

基于集聚度增量的空间聚类算法被引量：1

参考文献8

二级参考文献9

共引文献1101

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于集聚度增量的空间聚类算法 被引量：1

参考文献8

二级参考文献9

共引文献1101

同被引文献3

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于集聚度增量的空间聚类算法被引量：1