期刊文献+

KDD中的数据清理技术研究 被引量:1

Research on data cleaning technique of KDD
下载PDF
导出
摘要 数据清理是KDD的首要步骤;没有好的数据环境,就不会有理想的挖掘结果。介绍了数据的一般特征,讨论了KDD中数据清理技术的清除空缺、噪声处理及不一致数据等问题,指出通用性和自适应性差是目前数据清理工具存在的主要问题。 Data cleaning is a principal step of KDD; there is no ideal result without appropriate data environment. The general data character was presented. Some questions were discussed including the missing value cleaning, noise processing and unconformable data. And it was pointed that the improving of universal and adaptive properties was key of data cleaning technique.
作者 张小平 马垣
出处 《鞍山科技大学学报》 2003年第2期87-89,共3页 Journal of Anshan University of Science and Technology
关键词 KDD 数据清理 数据挖掘 噪声 通用性 自适应性 KDD data cleaning noise
  • 相关文献

参考文献9

  • 1Han Jiawei Kamber M.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
  • 2郭平 聂亚可 陈黎 等.数据清理方法论[J].计算机科学,2001,28(5):209-211.
  • 3JAIN A K, MURTY M N, FLYNN P J. Data clustering: a survey[ J]. ACM Computer Surv, 1999,31:264- 323.
  • 4NETER J,KUTNER M H, NACHTSHEIM C J,et al.Applied linear statistical model,4thed[M]. Chicago:Irwin, 1996:5- 30.
  • 5JOHNSON R A, WICHERN D A. Applied multivariate statistical analysis, 3rd ed[ C]//Englewood Cliffs. N J: Prentice Hall, 199"2:20 -46.
  • 6HERNANDEZ M A,STOLFO S J.Real-world is dirty:data cleaning and the merge/purge problem[J]. Data Mining and Knowledge Discovery, 1998,2( 1 ) :9 - 37.
  • 7AGRAWAL R, IMIELINSKI T SWAMI A. Database mining: a performance perspective [ J ]. IEEE. Transactionon Knowledge and Data Engineering, 1993,5(6) :914 - 925.
  • 8QUINLAN J R. Unknown attribute values in induction[ C]//In Proc 6th int Workshop on Machine Leaning. NY: Ithaca, 1989:164 -168.
  • 9PYLE D. Data preparation for data mining[M]. San Francisco:Morgan Dauhnann, 1999:25 - 55.

共引文献30

同被引文献2

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部