摘要
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和Ad Hoc对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10%时,Ad Hoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥35%时,三种方法均无效。结论:对不同缺失率的费用科目缺失数据集,MI和Ad Hoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势。
出处
《计算机应用》
CSCD
北大核心
2007年第B06期438-439,共2页
journal of Computer Applications