用户电力数据的爆炸式增长给原始数据修正带来许多难点。文章提出用函数型数据分析(Functional Data Analysis,FDA)对错误和缺失数据进行修正与补全。通过函数估计方法,将原有观测个体的离散数据映射到一个新的函数空间,将数据中缺失的...用户电力数据的爆炸式增长给原始数据修正带来许多难点。文章提出用函数型数据分析(Functional Data Analysis,FDA)对错误和缺失数据进行修正与补全。通过函数估计方法,将原有观测个体的离散数据映射到一个新的函数空间,将数据中缺失的成分利用相似用户曲线特征进行修复,并搭建了针对电力大数据的数据清洗整体框架。在真实数据集上的测试结果表明,该算法能够准确地提取用户的用电特征曲线,并对错误数据和缺失数据进行准确地修复。展开更多
文摘用户电力数据的爆炸式增长给原始数据修正带来许多难点。文章提出用函数型数据分析(Functional Data Analysis,FDA)对错误和缺失数据进行修正与补全。通过函数估计方法,将原有观测个体的离散数据映射到一个新的函数空间,将数据中缺失的成分利用相似用户曲线特征进行修复,并搭建了针对电力大数据的数据清洗整体框架。在真实数据集上的测试结果表明,该算法能够准确地提取用户的用电特征曲线,并对错误数据和缺失数据进行准确地修复。