基于聚落的人口统计数据空间分解算法被引量：1

A settlement-based spatial dis-aggregation algorithm for demographic data

下载PDF

导出

摘要利用人口密度随机森林模型探讨人口密度与影响因子之间的非线性关系,是当前人口分布研究的前沿,但人口统计数据在空间分解过程中非正规约束下的最优输运问题尚未妥善解决。本文基于面积加权法,以矢量格式的村人口数据集为起点,以矢量格式的聚落和公顷网格数据集为约束,设计了一套顾及聚落分布的人口统计数据空间分解算法。通过将村常住人口数据依次分解至聚落和公顷网格之中,获得了栅格人口密度数据集(SJZ_RK)。分析表明,SJZ_RK数据集的人口总数为1039.60万人,仅产生0.04%的误差,说明本文提出的人口统计数据空间分解算法具有较高准确度。经测算,SJZ_RK数据集的人口分布基尼系数(0.8909)>GHS_POP(0.8548)>SJZ_CUN_RK(0.5898)>GPWv4(0.5897),说明考虑聚落分布状况的SJZ_RK数据集很好地刻画了人口分布的空间集聚和异质性特征,为构建人口密度随机森林模型等监督类机器学习模型训练样本提供了高质量的人口密度标签数据。在刻画非聚落区、城市聚落区、值域范围方面,SJZ_RK数据集更接近实际情况,其在前两方面优于GHS_POP数据集,其在这3个方面均显著优于SJZ_CUN_RK和GPWv4两个数据集。本文算法破解了2个难题:①优化了获取高精度栅格人口密度数据集的计算程序,实现了相对准确的人口分布离散化表达;②统一了人口密度标签数据和影响因子数据的粒度,从而为人口密度随机森林模型训练样本摆脱MAUP的困扰,为克服人口密度随机森林模型的区群谬误问题,创造了必要条件。 Exploring the non-linear relationship between population density and impact factors with random forest model of population density is the frontier of current population distribution research.However,the problem of optimal transport of demographic data under informal constraints in the process of spatial dis-ag-gregation has not been properly addressed.Based on an areal weighting technique,this study took into account the settlement distribution and developed a spatial dis-aggregation algorithm for demographic data.The al-gorithm began with a spatial dataset of the village population in vector format and used the settlements and hectare grid datasets as constraints.The raster dataset of population density(SJZ_RK)was obtained by dis-ag-gregating the village resident population data into settlements and hectare grids.The analysis demonstrated that the total population of the SJZ_RK dataset is 10.396 million,with only 0.04%error,indicating that the spatial dis-aggregation algorithm for demographic data proposed in this paper has high accuracy.The Gini coefficient of population distribution in SJZ_RK(0.8909)is greater than that in GHS_POP(0.8548),SJZ_CUN_RK(0.5898),and GPWv4(0.5897).This indicates that the SJZ_RK,which considers the distribution of settle-ments,effectively characterizes the spatial agglomeration and heterogeneity characteristics of population distri-bution.It provides high-quality population density label data for the construction of supervised machine learn-ing model training samples such as population density random forest models.In terms of depicting non-settle-ment areas,urban settlement areas,and value domain ranges,the SJZ_RK was more accurate than the GHS_POP in the first two aspects,and significantly outperformed GPWv4 and SJZ_CUN_RK in these three aspects.The algorithm in this article resolved two problems.1)The program for calculating a high precision population density raster dataset was optimized,resulting in a relatively precise discrete representation of popu-lation distribution.2)The raster granularity of the population density labeled data and the influence factor data was unified,so that the training samples of the population density random forest model were free from the MAUP,and the necessary conditions were created to overcome the ecological fallacy.

作者李艳成温佩璋刘劲松 Li Yancheng;Wen Peizhang;Liu Jinsong(School of Geographical Sciences,Hebei Normal University,Shijiazhuang 050024,Hebei,China;Hebei Technology Innovation Center for Remote Sensing Identification of Environmental Change,Shijiazhuang 050024,Hebei,China;Geographic Experiment Teaching Demonstration Center of Hebei Province,Shijiazhuang 050024,Hebei,China;Hebei Key Laboratory of Environmental Change and Ecological Construction,Shijiazhuang 050024,Hebei,China)

机构地区河北师范大学地理科学学院河北省环境变化遥感识别技术创新中心河北师范大学地理计算与规划研究中心河北省环境演变与生态建设重点实验室

出处《地理科学》 CSCD 北大核心 2024年第7期1196-1205,共10页 Scientia Geographica Sinica

基金国家自然科学基金项目(42071167,40871073) 第二次青藏高原综合科学考察研究(2019QZKK0406) 河北省自然科学基金项目(D2007000272) 河北师范大学重点发展基金项目(L2024ZD07)资助。

关键词人口密度面积加权分解算法聚落 population density areal weighting dis-aggregation algorithm settlement

分类号 K901.3 [历史地理—人文地理学]

引文网络
相关文献

参考文献11

1尹春,孙斌栋,姚夏劼.人口密度与城市宜居性关系的一般性规律探索[J].地理科学,2024,44(2):179-191. 被引量：1
2闫东升,孙伟,孙晓露.长江三角洲人口时空格局演变及驱动因素研究[J].地理科学,2020,40(8):1285-1292. 被引量：21
3顾朝林.当代地理学新进展[J].中学地理教学参考,2022(13):30-33. 被引量：2
4柏中强,王卷乐,杨飞.人口数据空间化研究综述[J].地理科学进展,2013,32(11):1692-1702. 被引量：82
5江东,王乃斌,刘红辉.人口数据空间化的处理方法[J].地理学报,2002,57(B12):70-75. 被引量：77
6符海月,李满春,赵军,刘永学.人口数据格网化模型研究进展综述[J].人文地理,2006,21(3):115-119. 被引量：46
7刘艺,杨歆佳,刘劲松.基于随机森林的人口密度模型优化试验研究[J].全球变化数据学报（中英文）,2020,4(4):402-416. 被引量：6
8李玲玲,刘劲松,李智,温佩璋,李艳成,刘艺.人口密度随机森林模型优化实验研究[J].地理学报,2023,78(5):1304-1320. 被引量：2
9徐宗本.人工智能的10个重大数理基础问题[J].中国科学：信息科学,2021,51(12):1967-1978. 被引量：20
10刘涛,彭荣熙,卓云霞,曹广忠.2000—2020年中国人口分布格局演变及影响因素[J].地理学报,2022,77(2):381-394. 被引量：64

二级参考文献165

1翟振武,刘雯莉.七普数据质量与中国人口新“变化”[J].人口研究,2021,45(3):46-56. 被引量：28
2刘艺,杨歆佳,刘劲松.基于随机森林的人口密度模型优化试验研究[J].全球变化数据学报（中英文）,2020,4(4):402-416. 被引量：6
3王雪梅,李新,马明国.干旱区内陆河流域人口统计数据的空间化—以黑河流域为例[J].干旱区资源与环境,2007,21(6):39-47. 被引量：17
4顾朝林,陈璐.人文地理学的发展历程及新趋势[J].地理学报,2004,59(z1):11-20. 被引量：51
5樊杰.地理学的综合性与区域发展的集成研究[J].地理学报,2004,59(z1):33-40. 被引量：72
6周尚意.英美文化研究与新文化地理学[J].地理学报,2004,59(z1):162-166. 被引量：88
7张从宣.用经纬网格单元编制人口密度图——以京津唐地区为例[J].地域研究与开发,1985,4(2):57-66. 被引量：2
8胡序威.国土规划与区域规划[J].经济地理,1982,2(1):3-8. 被引量：15
9思睿.俄罗斯的人文地理学──渊源与发展趋势[J].国外社会科学,1994(5):55-59. 被引量：1
10王雪梅,李新,马明国.基于遥感和GIS的人口数据空间化研究进展及案例分析[J].遥感技术与应用,2004,19(5):320-327. 被引量：49

共引文献318

1刘艺,杨歆佳,刘劲松.基于随机森林的人口密度模型优化试验研究[J].全球变化数据学报（中英文）,2020,4(4):402-416. 被引量：6
2赖先龙,韩念龙,黄鹏锦.基于NPP/VIIRS夜间灯光数据海南省人口空间化研究[J].科技通报,2021,37(12):24-29. 被引量：1
3郑国庆,张改素,谢新鹏,杨振凯,王世鹏.省际交汇区人口密度时空变化及影响因素分析——以省直管县永城市为例[J].河南大学学报（自然科学版）,2024,54(1):30-42.
4贺智,陈逸敏,刘凯.AI时代地理信息科学一流本科专业课程建设探索[J].测绘通报,2023(S02):60-63.
5李丹彤,尹琴丽,周志峰,何志明.城镇尺度人口空间化的地理国情数据反演——以石蟆镇为例[J].工程勘察,2020,48(11):47-51. 被引量：1
6徐晓明.我国的经济类型区和综合经济区划分新探[J].经济地理,2006,26(S1):29-36. 被引量：3
7王文志,余卓渊.人口数据的多边形标志边界栅格化算法[J].重庆大学学报（自然科学版）,2012,35(S1):99-104.
8时若栋,李晶.对我国区域经济发展差异的研究——基于我国2002～2005年的数据分析[J].河北金融,2008(10):8-12. 被引量：1
9王雪梅,李新,马明国.基于遥感和GIS的人口数据空间化研究进展及案例分析[J].遥感技术与应用,2004,19(5):320-327. 被引量：49
10廖顺宝,李泽辉.四川省人口分布与土地利用的关系及人口数据空间化试验[J].长江流域资源与环境,2004,13(6):557-561. 被引量：40

同被引文献11

1刘艺,杨歆佳,刘劲松.基于随机森林的人口密度模型优化试验研究[J].全球变化数据学报（中英文）,2020,4(4):402-416. 被引量：6
2卓莉,陈晋,史培军,辜智慧,范一大,一之瀬俊明.基于夜间灯光数据的中国人口密度模拟[J].地理学报,2005,60(2):266-276. 被引量：222
3郑度,欧阳,周成虎.对自然地理区划方法的认识与思考[J].地理学报,2008,63(6):563-573. 被引量：127
4刘劲松,陈辉,杨彬云,王卫,相云,赵超.河北省年均降水量插值方法比较[J].生态学报,2009,29(7):3493-3500. 被引量：46
5高义,王辉,王培涛,孙晓宇,吕婷婷.基于人口普查与多源夜间灯光数据的海岸带人口空间化分析[J].资源科学,2013,35(12):2517-2523. 被引量：94
6谭敏,刘凯,柳林,朱远辉,王大山.基于随机森林模型的珠江三角洲30 m格网人口空间化[J].地理科学进展,2017,36(10):1304-1312. 被引量：41
7江东,杨小唤,王乃斌,刘红辉.基于RS、GIS的人口空间分布研究[J].地球科学进展,2002,17(5):734-738. 被引量：136
8王铮,夏海斌,田园,王魁,花卉,耿文均,田丽,郑保利,赵金彩.胡焕庸线存在性的大数据分析——中国人口分布特征的生态学及新经济地理学认识[J].生态学报,2019,39(14):5166-5177. 被引量：17
9白颖,王森,伍速锋,郭玥.人口密度与交通强度关系研究[J].综合运输,2021,43(8):21-25. 被引量：2
10Yue Qiu,Xuesheng Zhao,Deqin Fan,Songnian Li,Yijing Zhao.Disaggregating population data for assessing progress of SDGs:methods and applications[J].International Journal of Digital Earth,2022,15(1):2-29. 被引量：2

引证文献1

1LI Lingling,LIU Jinsong,LI Zhi,WEN Peizhang,LI Yancheng,LIU Yi.Experimental study of population density using an optimized random forest model[J].Journal of Geographical Sciences,2024,34(8):1636-1656.

1张学敏,赵国栋.我国研究生教育资源配置效率的时空格局与演化[J].教育科学文摘,2024,43(1):39-40.
2丁晓龙,胡振彪,王斌斌,王刚.一种基于实景三维的无人机低空飞行底图构建方法[J].测绘通报,2024(S01):57-60.
3中华神经科杂志编辑部.本刊关于论文发表后撤稿的规定[J].中华神经科杂志,2024,57(7):788-788.
4刘澜,邱冰,蔡润晖,熊星,汤鹏.山水格局对传统村镇聚落分布的影响机制[J].南京林业大学学报（自然科学版）,2024,48(3):165-171. 被引量：1
5孙鹏.地方社会变迁背景下的烟叶产业发展趋势分析[J].中文科技期刊数据库（文摘版）社会科学,2024(8):0188-0191.
6吴晓龙,邱飞,周良文.蒙特卡罗方法在核测井中的应用[J].石油地质与工程,2024,38(4):39-43.
7肖晓玲,刘洋,倪之贻.二维柱坐标系中子输运问题的边界型算法[J].核科学与技术,2024,12(3):238-251.
8薛广洲.从两个“文艺座谈会讲话”透视精神塑造与文化使命[J].毛泽东邓小平理论研究,2024(4):16-23.
9付香云.国家治理现代化中的德治与法治“双螺旋”互动机理[J].中文科技期刊数据库（文摘版）社会科学,2024(8):0005-0008.
10胡晓萌.算法主义的伦理批判[J].伦理学研究,2024(4):101-108.

地理科学

2024年第7期

浏览历史

内容加载中请稍等...

基于聚落的人口统计数据空间分解算法被引量：1

参考文献11

二级参考文献165

共引文献318

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于聚落的人口统计数据空间分解算法 被引量：1

参考文献11

二级参考文献165

共引文献318

同被引文献11

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于聚落的人口统计数据空间分解算法被引量：1