摘要
本研究基于浙江省统计局“全面覆盖+精准画像”数据库,从人员、家庭、社会环境三个层面构建浙江省居民收入预测指标体系,并结合抽样调查数据形成部分群体收入标签,构建浙江省居民年收入预测分析模型,综合运用轻量级梯度提升决策树算法(LightGBM)和重采样算法(SMOTE)利用有限样本标签对常住人口个体收入进行预测。在模型预测基础上,对浙江省居民收入总体分布、群体画像和影响因素进行深入挖掘,为浙江省“全面覆盖+精准画像”数据库中人群收入特征分析提供了算法支撑,为“扩中提低”人群识别提供了科学依据。
出处
《统计科学与实践》
2022年第9期17-21,共5页
Statistical Theory and Practice