面向属性空间分布特征的空间聚类被引量：3

Spatial clustering method considering spatial distribution feature in the attribute domain

导出

摘要空间聚类应当同时满足空间位置邻近和属性相似,在此背景下,为满足空间邻近实体之间趋势性和不均匀性的属性聚类需求,提出一种基于图论和信息熵的空间聚类算法。该算法主要是在Delaunay三角网空间位置聚类基础上,通过引入信息熵,采用多元相似性度量方法以解决二元关系在属性聚类中的缺陷,同时基于"等概率最大熵"原则提出了一种局部参数度量方法,用于表达邻近目标间属性分布的局部变化信息。将本文方法与多约束聚类方法和DDBSC聚类方法进行对比分析,结果表明:(1)在属性空间分布不均的情况下,本文方法的聚类精度要高于多约束方法和DDBSC方法,尤其是当属性空间分布不均程度不断扩大时,DDBSC和多约束算法会将空间簇内的实体误判为噪声;(2)在对异常值的敏感性问题上,3类方法都能识别出异常值的位置,但DDBSC和多约束算法对异常值具有一定的敏感性,聚类结果会掩盖属性分布的趋势性,本文方法受异常值影响很小。通过模拟实验和实际算例可以发现,在保证空间邻近的基础上本文方法具有如下优势:第一,能反映实体属性在空间分布中的趋势性特征;第二,能满足属性空间分布不均匀;第三,对异常值具有良好的稳健性。 Spatial clustering is important for spatial data mining and spatial analysis. Spatial objects in the same cluster should be similar in the spatial and attribute domains. Tendency and heterogeneity are important characteristics of geographic phenomena. Currently, most spatial clustering algorithms only consider either tendency or heterogeneity, failing to obtain satisfied clustering results. To overcome these limitations, a spatial clustering method based on graph theory and information entropy is developed in this work. The proposed algorithm involves two main steps： construct spatial proximity relationships and cluster spatial objects with similar attributes. Delannay triangulation with edge length constraints is first employed to construct spatial proximity relationships among objects. To obtain satisfactory results in spatial clustering with attribute similarity, the information entropy is introduced to overcome the defects of simil- arity measure with binary relation, which can reflect the clustering tendency of geographical phenomena. Furthermore, a local parameter measurement method based on the principle of ＂equal probability maximum entropy＂ is designed to adapt to the local change information of attribute distribution. The performance of the proposed algorithm was evaluated experimentally by comparing the leading state-of-the-art alternatives： DDB- SC and multi-constraint algorithms. Results showed that our method outperformed the two other algorithms as attributes are unevenly distributed in space. The sensitivity analysis of these algorithms showed that our method was the least sensitive to outliers. The effectiveness and practicability of the proposed algorithm were validated using simulated and real spatial datasets. Two experiments were performed to illustrate the three advantages of our algorithm：（1） It can reflect the tendency of the entity attribute in the spatial distribution. （2） It can meet the requirement that attributes are unevenly distributed in space. （3） It can discover clusters with arbitrary shape and is robust to outliers.

作者朱杰孙毅中李吉龙

机构地区南京师范大学虚拟地理环境教育部重点实验室江苏省地理信息资源开发与利用协同创新中心

出处《遥感学报》 EI CSCD 北大核心 2017年第6期917-927,共11页 NATIONAL REMOTE SENSING BULLETIN

基金国家自然科学基金(编号:41671392) 公安部科技强警基础工作专项项目(编号:2015GABJC39)~~

关键词空间聚类 DELAUNAY三角网信息熵趋势性不均匀性 spatial clustering, Delaunay triangulation, information entropy, tendency, heterogeneity

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献11

1邓敏,刘启亮,李光强,程涛.基于场论的空间聚类算法[J].遥感学报,2010,14(4):694-709. 被引量：14
2焦利民,洪晓峰,刘耀林.空间和属性双重约束下的自组织空间聚类研究[J].武汉大学学报（信息科学版）,2011,36(7):862-866. 被引量：14
3郭新辰,郗仙田,樊秀玲,韩啸.基于半监督的模糊C-均值聚类算法[J].吉林大学学报（理学版）,2015,53(4):705-709. 被引量：6
4周悦来,谭建豪.基于网格和信息熵的多密度聚类算法[J].计算机系统应用,2011,20(10):189-192. 被引量：3
5刘启亮,邓敏,石岩,彭东亮.一种基于多约束的空间聚类方法[J].测绘学报,2011,40(4):509-516. 被引量：25
6李凯,曹喆.一种基于神经网络的广义熵模糊聚类算法[J].电子学报,2016,44(8):1881-1886. 被引量：7
7焦利民,张欣,毛立凡.自组织双重空间聚类算法的城市扩张结构分析应用[J].地球信息科学学报,2015,17(6):638-643. 被引量：8
8李光强,邓敏,程涛,朱建军.一种基于双重距离的空间聚类方法[J].测绘学报,2008,37(4):482-488. 被引量：41
9石岩,邓敏,刘启亮,唐建波.融合尺度空间聚类思想的海温多尺度分区方法[J].武汉大学学报（信息科学版）,2013,38(12):1484-1489. 被引量：1
10贺辉,胡丹,余先川.基于自适应区间二型模糊聚类的遥感土地覆盖自动分类[J].地球物理学报,2016,59(6):1983-1993. 被引量：13

二级参考文献116

1王海起,王劲峰.基于分区的局域神经网络时空建模方法研究[J].遥感学报,2008,12(5):707-715. 被引量：2
2陈薇,孙增圻.二型模糊系统研究与应用[J].模糊系统与数学,2005,19(1):126-135. 被引量：26
3宫改云,高新波,伍忠东.FCM聚类算法中模糊加权指数m的优选方法[J].模糊系统与数学,2005,19(1):143-148. 被引量：81
4孙志伟,赵政.DBSCAN在非空间属性处理上的扩展[J].计算机应用,2005,25(6):1379-1381. 被引量：4
5王燕.基于信息熵的标称变量聚类算法研究[J].计算机应用,2006,26(8):1904-1905. 被引量：2
6蒋海昆,李永莉,曲延军,华爱军,代磊,郑建常,侯海峰.中国大陆中强地震序列类型的空间分布特征[J].地震学报,2006,28(4):389-398. 被引量：68
7ZHOU Jiaogen GUAN Jihong LI Pingxiang.DCAD:a Dual Clustering Algorithm for Distributed Spatial Databases[J].Geo-Spatial Information Science,2007,10(2):137-144. 被引量：15
8皇甫岗,李忠华,秦嘉政,张建国.川滇菱形块体强震活动关联分析[J].地震研究,2007,30(3):205-209. 被引量：16
9MILLER H, HAN J. Geographic Data Mining and Knowledge Discovery[M]. 2nd ed. London: CRC Press, 2009.
10ESTIVILL CASTRO V, LEE I. Multi-level Clustering and Its Visualization for Exploratory Spatial Analysis [J].GeoInformatica, 2002, 6(2): 123 152.

共引文献114

1刘扬洋,王小鹏,魏统艺.自适应多特征模糊聚类的多光谱遥感图像河流提取[J].测绘科学,2023,48(12):153-164.
2杨微,刘纪平,王勇.基于Heatmap的地理对象空间分布热度计算方法[J].测绘通报,2012(S1):391-393. 被引量：10
3邓敏,刘启亮,李光强,程涛.基于场论的空间聚类算法[J].遥感学报,2010,14(4):694-709. 被引量：14
4邓敏,刘启亮,李光强.采用聚类技术探测空间异常[J].遥感学报,2010,14(5):944-958. 被引量：11
5贾瑞玉,查丰,耿锦威,宁再早.一种基于引力的分层聚类算法[J].计算机技术与发展,2011,21(3):76-78. 被引量：2
6刘启亮,邓敏,王佳璆,彭思岭,梅小明,赵玲.时空一体化框架下时空异常探测[J].遥感学报,2011,15(3):457-474. 被引量：8
7殷俊华,李光强,陈翼,邓敏.基于概念格的空间聚类方法[J].计算机系统应用,2011,20(6):103-108. 被引量：2
8邓敏,彭东亮,刘启亮,石岩.一种基于场论的层次空间聚类算法[J].武汉大学学报（信息科学版）,2011,36(7):847-852. 被引量：8
9焦利民,洪晓峰,刘耀林.空间和属性双重约束下的自组织空间聚类研究[J].武汉大学学报（信息科学版）,2011,36(7):862-866. 被引量：14
10刘启亮,邓敏,彭东亮,王佳璆.基于力学思想的空间聚类有效性评价[J].武汉大学学报（信息科学版）,2011,36(8):982-986. 被引量：1

同被引文献34

1顾朝林,陈田,丁金宏,虞蔚.中国大城市边缘区特性研究[J].地理学报,1993,48(4):317-328. 被引量：262
2马超群,王瑞,王玉萍,严宝杰,陈宽民.基于区内出行比例的城市交通小区半径计算方法[J].交通运输工程学报,2007,7(1):68-72. 被引量：11
3费燕琼,张鑫,夏振兴.自重构模块化机器人的运动空间及自变形算法[J].机械工程学报,2009,45(3):197-202. 被引量：9
4李团结,张琰,李涛.周边桁架可展天线展开过程动力学分析及控制[J].航空学报,2009,30(3):444-449. 被引量：33
5赵锦焕,李文权.居民出行调查中交通小区划分方法的改进[J].交通运输工程与信息学报,2009,7(2):110-115. 被引量：6
6徐国栋,赵丹,向文豪,邱文勋,张世杰.可重构的卫星/运载复用电子系统设计[J].航空学报,2009,30(7):1298-1304. 被引量：4
7蔡远文,郭会,李岩.航天器在轨组装技术进展[J].兵工自动化,2009,28(10):6-8. 被引量：12
8陈寿文,李明东.一种混合均值聚类算法的实现[J].计算机工程与应用,2010,46(18):132-134. 被引量：4
9王海鹰,张新长,赵元.基于逻辑回归模型的城市边缘区界定方法研究[J].测绘通报,2010(10):7-10. 被引量：21
10王海鹰,张新长,康停军,赵元.基于多准则判断的城市边缘区界定及其特征[J].自然资源学报,2011,26(4):703-714. 被引量：17

引证文献3

1吕晶薇,高语斐,戴野,刘朝旭,齐云衫,张瀚博.异类细胞单元构型策略与装配研究[J].哈尔滨理工大学学报,2021,26(6):55-65. 被引量：1
2俞艳,何宇嘉,高昕欣,张宸赫,阎程.交通规划导向的科技赋能交通小区划分方法[J].现代城市研究,2024,39(6):100-106.
3王兆洋,杨晟,崔马军,沙亮.基于夜间灯光数据的城市边缘区识别方法[J].测绘标准化,2024,40(2):37-45.

二级引证文献1

1朱博,张钰朋,徐攀腾,宋述波,焦石,郑星星.实现位置同步的双电机交叉耦合控制策略[J].哈尔滨理工大学学报,2022,27(5):114-121. 被引量：3

1姜玉婷,秦克云.基于形式背景的属性约简关系[J].西华大学学报（自然科学版）,2017,36(5):31-35.
2刘洋,邓敏,邓悦,杨学习.基于Delaunay三角网和地理加权回归的降水空间异常探测方法研究[J].长江流域资源与环境,2017,26(11):1865-1874. 被引量：3
3翟卿,张静,李伟,董石飞,杨应明,薛国喜,孙浩.中国动物地理区划研究现状及展望[J].信阳师范学院学报（自然科学版）,2017,30(4):676-681. 被引量：6
4阎冬梅,赵忠明.基于小波单支重构的遥感影像云区提取[J].装备指挥技术学院学报,2001,12(4):6-10. 被引量：2
5吴陈,孙宏.一种对数据流进行聚类的改进算法[J].电子设计工程,2017,25(22):23-25. 被引量：1
6周伟燕,汪静,禹松林,王冬环,曾洁,张天娇,闫颖,张江涛,陈文祥,张传宝.胆固醇水溶液国家一级标准物质的定值与不确定度评定[J].中华医学杂志,2017,97(42):3338-3342.
7庄夏.基于局部参数模型共享的分布式入侵检测系统[J].计算机工程与设计,2017,38(11):2935-2939. 被引量：4
8魏永忠.辽宁大型真菌多元相似性聚类分析[J].防护林科技,2017,30(9):71-74.
9久路吐孜·艾力别克.浅析类比法在高中物理课堂教学中的应用[J].神州,2017,0(21):137-137.
10张国安.中国化工优势企业进入战略并购时代——基于化工行业、优势企业的数据分析[J].化工管理,2017,0(28):1-6.

遥感学报

2017年第6期

浏览历史

内容加载中请稍等...

面向属性空间分布特征的空间聚类被引量：3

参考文献11

二级参考文献116

共引文献114

同被引文献34

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向属性空间分布特征的空间聚类 被引量：3

参考文献11

二级参考文献116

共引文献114

同被引文献34

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

面向属性空间分布特征的空间聚类被引量：3