基于单一模型的传统窃电检测精度有待提高,应用Stacking集成学习策略,提出一种新的窃电模型,并根据实际业务需要构造MAP(mean average precision)检测指标。为实现降维效果,按时间多维度拆解用户日用电量特征,并采用Embedding特征选择,...基于单一模型的传统窃电检测精度有待提高,应用Stacking集成学习策略,提出一种新的窃电模型,并根据实际业务需要构造MAP(mean average precision)检测指标。为实现降维效果,按时间多维度拆解用户日用电量特征,并采用Embedding特征选择,选取其中的重要度高特征;采用贝叶斯优化调参,结合XGBoost、LightGBM和CatBoost集成模型对数据进行交叉验证和预测;分别拼接验证结果和预测结果,Stacking的基分类器采用逻辑斯蒂回归进行集成训练,输出最终预测结果。以2016 CCF竞赛数据为算例,验证了所提出的窃电模型的有效性和可行性。展开更多
文摘基于单一模型的传统窃电检测精度有待提高,应用Stacking集成学习策略,提出一种新的窃电模型,并根据实际业务需要构造MAP(mean average precision)检测指标。为实现降维效果,按时间多维度拆解用户日用电量特征,并采用Embedding特征选择,选取其中的重要度高特征;采用贝叶斯优化调参,结合XGBoost、LightGBM和CatBoost集成模型对数据进行交叉验证和预测;分别拼接验证结果和预测结果,Stacking的基分类器采用逻辑斯蒂回归进行集成训练,输出最终预测结果。以2016 CCF竞赛数据为算例,验证了所提出的窃电模型的有效性和可行性。