摘要
数据缺失是在数据收集中普遍存在的现象,因而缺失数据的插补问题就成了数据分析领域的重要命题.常用的插补模型有参数模型、非参数模型和半参数模型,其中关于半参数模型的研究较少,考虑到半参数模型的优越性,文章将半参数回归模型与插补方法相结合,利用最小二乘核估计构建半参数模型,再利用辅助变量对目标变量进行估计来建立缺失数据的插补数据集,进而实现缺失数据的插补,并通过案例探究该方法的实现及其可行性.
Data missing is a common phenomenon. Missing data imputation is an important issue in data analyzing. Parametric model, nonparametric model and semi-parametric model are the common models used to impute missing data. Considering the advantages of semi-parametric model, the essay tries to combine the imputation method with semi-parametric model. Firstly, the essay estimates semi-parametric model through using the least squares kernel estimator. Then covariate vectors are used to estimate the target variable in order to establish a data set that can be used for imputation.
出处
《太原师范学院学报(自然科学版)》
2015年第3期1-6,共6页
Journal of Taiyuan Normal University:Natural Science Edition
基金
国家社科基金项目"中国城维护调查一体化数据准确性评估修正研究"(13BTJ021)
关键词
缺失数据
插补方法
半参数模型
missing data
imputation
semi-parametric model