期刊文献+

一种基于规则的交互式数据清洗框架的设计 被引量:2

The Design Of A Rule-based Interactive Data Cleaning Framework
下载PDF
导出
摘要 针对目前数据清洗框架中普遍存在的交互性和可扩展性差的问题,本文从数据清洗的定义出发,分析了数据清洗的原理和流程,并在此基础上提出了一种基于规则的交互式数据清洗框架。该框架具有较好的交互性、可扩展性和通用性。 For dealing with the problem of poor interactivity and scalability which widely exists in the current data cleaning frameworks, the principle and flow of data cleaning are analyzed from definition. Based on that, a ruled - based interactive data cleaning framework is proposed in this paper, which has an advantage over other frameworks in interaction, extension and currency.
作者 张武 刘波
出处 《微计算机应用》 2009年第10期64-68,共5页 Microcomputer Applications
关键词 数据清洗 数据质量 清洗规则 交互式 Data Cleaning, Data Quality, Cleaning Rule, Interactive
  • 相关文献

参考文献10

  • 1郭志懋,周傲英.数据质量和数据清洗研究综述[J].软件学报,2002,13(11):2076-2082. 被引量:264
  • 2Erhard Rahm,Hong Hai Do. Data cleaning: problems and current approaches [ J ] . IEEE Data Engineering Bulletin. 2000,23(4) :3 - 13.
  • 3韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5. 被引量:102
  • 4Lee, M. L. , Ling, T. W. , Low, W.L. IntelliClean: a knowledge - based intelligent data cleaner. In: Proceedings of the 6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Boston: ACM Press, 2000. 290 -294.
  • 5Galhardas, H. , Florescu, D. , Shasha, D. , et al. AJAX: an extensible data cleaning tool. In: Chen, W. D. , Naughton, J. F. , Bernstein,P. A. , eds. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. Texas: ACM, 2000. 590.
  • 6Raman, V. , Hellerstein, J. Potter's wheel: an interactive data cleaning system. In: Apers, P. , Atzeni, P. , Ceri, S. , et al, eds. Proceedings of the 27th International Conference on Very Large Data Bases. Roma: Morgan Kaufmann, 2001. 381 -390.
  • 7黄大荣,黄席樾.基于粗糙集理论的数据清洗模型[J].计算机工程与应用,2004,40(31):164-165. 被引量:3
  • 8覃华,苏一丹,李陶深.基于遗传神经网络的数据清洗方法[J].计算机工程与应用,2004,40(3):45-46. 被引量:11
  • 9方南晖,黄文强,张为.基于专家系统体系结构的数据清洗器设计[J].计算机应用,2002,22(8):50-52. 被引量:4
  • 10Jiawen Han.数据挖掘:概念与技术(第二版).北京:机械工业出版社,2006.

二级参考文献113

  • 1韩京宇,徐立臻,董逸生.一种大数据量的相似记录检测方法[J].计算机研究与发展,2005,42(12):2206-2212. 被引量:32
  • 2林瑞,马少平.人工智能导论[M].北京:清华大学出版社,1999.
  • 3杨伦标, 高英仪. 模糊数学原理及应用(第二版)[M].广州:华南理工大学出版社,1996.
  • 4陈广明, 方南晖. 企业级数据共享研究-权威数据[A]. 中国计算机学会2001全国软件技术研讨会论文集[C].中国计算机学会大连计算机学会,2001.
  • 5EricSperley 陈武 袁国忠译.企业数据仓库规划建立与实现[M].北京:中国机械工业出版社,2000..
  • 6Pawlak Z.Rough set theory and its applications to data analysis[J].Cybernetics and Systems,1998
  • 7张文修等.粗糙集理论与方法[M].科学出版社,2003
  • 8Aebi, D., Perrochon, L. Towards improving data quality. In: Sarda, N.L., ed. Proceedings of the International Conference on Information Systems and Management of Data. Delhi, 1993. 273~281.
  • 9Wang, R.Y., Kon, H.B., Madnick, S.E. Data quality requirements analysis and modeling. In: Proceedings of the 9th International Conference on Data Engineering. Vienna: IEEE Computer Society, 1993. 670~677.
  • 10Rahm, E., Do, H.H. Data cleaning: problems and current approaches. IEEE Data Engineering Bulletin, 2000,23(4):3~13.

共引文献357

同被引文献24

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部