摘要
数据清洗是数据分析的基础,高质量的数据才能分析出更有价值的信息。电力营销业务数据中的免费用电数据,存在非常多的归类标签,如是否有效、有效日期、时间、重复次数、关联用户数、重复类型、年度拆分等,需要采用多种数据处理方法,对数据中的不一致性、缺失值、重复数据进行处理,基于已有字段提取新的信息,得到高质量的数据,才能更精准地支撑建模分析工作。本文就免费电数据进行清洗的流程、技术,以及建模分析应用展开论述。
作者
梁卫宁
周钰书
唐文彬
刘森
陈玲娜
LIANG Wei-ning;ZHOU Yu-shu;TANG Wen-bin;LIU Sen;CHEN Ling-na
出处
《信息技术与信息化》
2020年第7期87-90,共4页
Information Technology and Informatization