期刊文献+

营销数据清洗及治理方法的研究及应用

下载PDF
导出
摘要 数据清洗是数据分析的基础,高质量的数据才能分析出更有价值的信息。电力营销业务数据中的免费用电数据,存在非常多的归类标签,如是否有效、有效日期、时间、重复次数、关联用户数、重复类型、年度拆分等,需要采用多种数据处理方法,对数据中的不一致性、缺失值、重复数据进行处理,基于已有字段提取新的信息,得到高质量的数据,才能更精准地支撑建模分析工作。本文就免费电数据进行清洗的流程、技术,以及建模分析应用展开论述。
作者 梁卫宁 周钰书 唐文彬 刘森 陈玲娜 LIANG Wei-ning;ZHOU Yu-shu;TANG Wen-bin;LIU Sen;CHEN Ling-na
出处 《信息技术与信息化》 2020年第7期87-90,共4页 Information Technology and Informatization
  • 相关文献

参考文献2

二级参考文献22

  • 1王咏梅,陈家琪,耿玉良.一种可交互的数据清洗系统[J].计算机工程与设计,2005,26(4):955-957. 被引量:7
  • 2刘奕群,张敏,马少平.面向信息检索需要的网络数据清理研究[J].中文信息学报,2006,20(3):70-77. 被引量:5
  • 3Rahm E, Do H. H. Data Cleaning: Problems and Current Approaches[J]. IEEE Data Engineering Bulletin, 2000, 23(4): 3- 13.
  • 4Galhardas H, Florescu D. An Extensible Framework for Data Cleaning[C]. In: Proceedings of the 16th IEEE International Conference on Data Engineering. San Diego, California, 2000 : 312 - 312.
  • 5BI Case Study[ EB/OL]. [2007 - 01 - 09 ]. http ://www. parsintl. com/pdf/14705 - BIJ - Informatica. pdf.
  • 6Harte - Hanks Trillium Software [ EB/OL]. [ 2007 - 01 - 09 ]. http ://www. trilliumsoftware. com.
  • 7Bohn K, Converting Data for Warehouses [ J]. DBMS, 1997, 10 (7) : 61 -66.
  • 8Helena G. Generative and Transformational Techniques in Software Engineering. In : Helena G eds. Data Cleaning and Transformation Using the AJAX Framework [ M ]. Springer Berlin/Heidelberg,2006.
  • 9Monge A, Elkan C. The Field Matching Problem: Algorithms and Applications[ C ]. In: Proceedings of the 2nd International Conference of Knowledge Discovery and Data Mining. Portland, Oregon, 1996.
  • 10Masek W, Paterson M A. Faster Algorithm Computing String Edit Distance [ J ]. Journal of Computer System Science, 1980 (20) : 18 - 31.

共引文献151

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部