摘要
数据是当前各研究领域研究对象的信息载体,但在理论研究、数据收集、统计判断过程中,常因理论缺失、经验不足、主观判断等导致收集的数据不完整。尤其在存在相关变量的数据集上,数据的缺失将影响整体规律的判断。因此,一种针对不完整数据集的处理方法,用以实现有效数据预处理,支撑科学研究显得尤为重要。围绕专家在某评估数据集中缺失数据的现象,区分数据类型,对于数值型数据,采用基于链式方程的多重插补法插补;对于类别型数据,采用Logistic回归模型插补,并通过专家自身偏好一致性及专家共识度评价指标,比较插补结果的优劣。
出处
《信息技术与信息化》
2024年第8期44-48,共5页
Information Technology and Informatization