期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于聚落的人口统计数据空间分解算法 被引量:1
1
作者 李艳成 温佩璋 刘劲松 《地理科学》 CSSCI CSCD 北大核心 2024年第7期1196-1205,共10页
利用人口密度随机森林模型探讨人口密度与影响因子之间的非线性关系,是当前人口分布研究的前沿,但人口统计数据在空间分解过程中非正规约束下的最优输运问题尚未妥善解决。本文基于面积加权法,以矢量格式的村人口数据集为起点,以矢量格... 利用人口密度随机森林模型探讨人口密度与影响因子之间的非线性关系,是当前人口分布研究的前沿,但人口统计数据在空间分解过程中非正规约束下的最优输运问题尚未妥善解决。本文基于面积加权法,以矢量格式的村人口数据集为起点,以矢量格式的聚落和公顷网格数据集为约束,设计了一套顾及聚落分布的人口统计数据空间分解算法。通过将村常住人口数据依次分解至聚落和公顷网格之中,获得了栅格人口密度数据集(SJZ_RK)。分析表明,SJZ_RK数据集的人口总数为1039.60万人,仅产生0.04%的误差,说明本文提出的人口统计数据空间分解算法具有较高准确度。经测算,SJZ_RK数据集的人口分布基尼系数(0.8909)>GHS_POP(0.8548)>SJZ_CUN_RK(0.5898)>GPWv4(0.5897),说明考虑聚落分布状况的SJZ_RK数据集很好地刻画了人口分布的空间集聚和异质性特征,为构建人口密度随机森林模型等监督类机器学习模型训练样本提供了高质量的人口密度标签数据。在刻画非聚落区、城市聚落区、值域范围方面,SJZ_RK数据集更接近实际情况,其在前两方面优于GHS_POP数据集,其在这3个方面均显著优于SJZ_CUN_RK和GPWv4两个数据集。本文算法破解了2个难题:①优化了获取高精度栅格人口密度数据集的计算程序,实现了相对准确的人口分布离散化表达;②统一了人口密度标签数据和影响因子数据的粒度,从而为人口密度随机森林模型训练样本摆脱MAUP的困扰,为克服人口密度随机森林模型的区群谬误问题,创造了必要条件。 展开更多
关键词 人口密度 面积加权 分解算法 聚落
下载PDF
Experimental study of population density using an optimized random forest model
2
作者 LI Lingling LIU Jinsong +3 位作者 LI Zhi wen peizhang LI Yancheng LIU Yi 《Journal of Geographical Sciences》 SCIE CSCD 2024年第8期1636-1656,共21页
Random forest model is the mainstream research method used to accurately describe the distribution law and impact mechanism of regional population.We took Shijiazhuang as the research area,with comprehensive zoning ba... Random forest model is the mainstream research method used to accurately describe the distribution law and impact mechanism of regional population.We took Shijiazhuang as the research area,with comprehensive zoning based on endowments as the modeling unit,conducted stratified sampling on a hectare grid cell,and systematically carried out incremental selection experiments of population density impact factors,optimizing the population density random forest model throughout the process(zonal modeling,stratified sampling,factor selection,weighted output).The results are as follows:(1)Zonal modeling addresses the issue of confusion in population distribution laws caused by a single model.Sampling on a grid cell not only ensures the quality of training data by avoiding the modifiable areal unit problem(MAUP)but also attempts to mitigate the adverse effects of the ecological fallacy.Stratified sampling ensures the stability of population density label values(target variable)in the training sample.(2)Zonal selection experiments on population density impact factors help identify suitable combinations of factors,leading to a significant improvement in the goodness of fit(R^(2))of the zonal models.(3)Weighted combination output of the population density prediction dataset substantially enhances the model's robustness.(4)The population density dataset exhibits multi-scale superposition characteristics.On a large scale,the population density in plains is higher than that in mountainous areas,while on a small scale,urban areas have higher density compared to rural areas.The optimization scheme for the population density random forest model that we propose offers a unified technical framework for uncovering local population distribution law and the impact mechanisms. 展开更多
关键词 population density random forest model endowment zones stratified sampling factor selection weighted output
原文传递
人口密度随机森林模型优化实验研究 被引量:3
3
作者 李玲玲 刘劲松 +3 位作者 李智 温佩璋 李艳成 刘艺 《地理学报》 EI CSSCI CSCD 北大核心 2023年第5期1304-1320,共17页
随机森林模型是精准刻画区域人口分布规律和影响机制的主流研究方法。本文以石家庄为实验区,以综合禀赋分区为建模单元,在公顷网格粒度上分区开展分层采样,系统进行了递增式人口密度影响因子遴选实验,全流程(分区建模、分层采样、因子... 随机森林模型是精准刻画区域人口分布规律和影响机制的主流研究方法。本文以石家庄为实验区,以综合禀赋分区为建模单元,在公顷网格粒度上分区开展分层采样,系统进行了递增式人口密度影响因子遴选实验,全流程(分区建模、分层采样、因子遴选、加权输出)优化了人口密度随机森林模型。研究表明:①分区建模抑制了模型混淆人口分布法则问题;在栅格粒度上采样,不仅使训练样本数据质量摆脱了MAUP的困扰,而且在形式上尝试降低区群谬误的不良影响;分层采样确保了样本数据集中人口密度标签值的分布稳定性。②利用人口密度随机森林模型,分区开展人口密度影响因子遴选实验,逐步提升了模型的拟合优度R^(2);距聚落距离是各区人口密度的主要影响因子;各区的人口分布影响机制存在显著差异,创新禀赋因子对城镇地区人口密度有较强影响,自然禀赋因子对乡村地区人口密度有较强影响。③对人口密度预测数据集进行优化组合,显著提高了模型的鲁棒性。④所获人口密度数据集具有多尺度叠加特征,大尺度上呈现出平原人口密度高于山区,小尺度上呈现出城镇人口密度高于乡村的“核心—边缘”特征。人口密度随机森林模型优化方案为揭示地方性人口分布规律和人口分布影响机制提供了统一的技术框架。 展开更多
关键词 人口密度 随机森林模型 禀赋分区 分层采样 因子遴选 加权输出
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部