期刊文献+

基于电网生产项目数据预处理研究 被引量:1

Research on Data Preprocessing of Power Grid Production Projects
下载PDF
导出
摘要 数据作为现代企业的宝贵资源,占据着越来越重要的地位,它是科学管理的基础、正确决策的前提、有效调控的手段。本文介绍了数据预处理的主要方法,包括:数据清洗、数据集成、数据变换和数据归约。根据这些数据方法来对2015-2017年电网生产项目的原始数据进行处理。其中重点包括:缺失值的处理,异常值的处理,变量和变量值的变换,以及数据精简。最终为电网生产项目优化的分析建模和算法提供可靠性的数据支持。 As a valuable resource of modern enterprises,data occupies a more and more important position.It is the basis of scientific management,the premise of correct decision-making,and the effective means of regulation and control.This paper introduces the main methods of data preprocessing,including data cleaning,data integration,data transformation and data reduction.According to these data methods,the original data of 2015-2017 power grid production project are processed.The emphasis includes the processing of missing value,the processing of outlier value,the transformation of variable and variable value,and the simplification of data.Finally,it provides reliable data support for the analysis,modeling and algorithm of power grid production project optimization.
作者 杨凯 赵明洲 毛文瑞 张瑛楠 Yang Kai;Zhao Mingzhou;Mao Wenrui;Zhang Yingnan(Institute of Management Science,Guangdong Power Grid Corporation,Guangzhou Guangdong,510000)
出处 《电子测试》 2019年第1期80-81,共2页 Electronic Test
关键词 数据分析 数据挖掘 数据预处理 缺失值 异常值 data analysis data mining data preprocessing missing value outlier value
  • 相关文献

参考文献4

二级参考文献33

  • 1李金昌,徐雪琪.数据挖掘质量问题探讨[J].统计研究,2004,21(7):49-52. 被引量:5
  • 2曾黄麟.粗集理论及其应用(一)[J].四川轻化工学院学报,1996,9(1):18-28. 被引量:41
  • 3王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量:264
  • 4TOM Soukup,IAN Davidson.可视化数据挖掘-数据可视化和数据挖掘的技术与工具[M].朱建秋,等,译.北京:电子工业出版社,2004:59-115.
  • 5岳希明,张曙光,等.中国经济增长速度研究与争论[M].北京:中信出版社,2002:3-51.
  • 6SOIBELMAN L M, HYUNJOO Kim. Data Preparation Process for Construction Knowledge Generation through Knowledge Disoovery in Databases[J]. Journal of Computing in Civil Engineering,2002(1):39-48.
  • 7RODERICH J A Little,RUBIN Donald B.缺失数据统计分析(中文版)[M].孙山泽,译.北京:中国统计出版社,2004:3-16.
  • 8CARRIERE K C. Methods for Repeated Measures Data Analysis with Missing Values[J]. Journal of Statistical Planning and Inference, 1999(7) :221 - 236.
  • 9SMOLINSKI, WALCZAK, EINAX J W. Exploratory Analysis of Data Sets with Missing Elements and Outliers [J]. Chemosphere, 2002(49):233 - 245.
  • 10PYLE Dorian. Data Preparation for Data Mining[M]. Paperback, Bk&CD edition, 1999: 89-190.

共引文献1769

同被引文献10

引证文献1

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部