摘要
1 引言数据挖掘(Data Mining,简称DM),也称为数据库中的知识发现KDD(Knowledge Discovery inDatabase),是近几年来随着数据库和人工智能发展起来的一门新兴的数据库技术。其处理对象是大量的日常业务数据,目的是为了从这些数据中抽取一些有价值的知识或信息。原始业务数据是知识和信息提取的源泉,对于数据挖掘就显得十分重要。目前所进行的关于数据挖掘的研究工作,大多着眼于数据挖掘算法的探讨,而忽视了对数据处理的研究。
Data Mining (DM) is a new hot research point in database area. Because the real-world data is not ideal.it is necessary to do some data preprocessing to meet the requirement of DM algorithms. In this paper,we discuss the procedure of data preprocessing and present the work of data preprocessing in details. We also discuss the methods and technologies used in data preprocessing.
出处
《计算机科学》
CSCD
北大核心
2000年第4期54-57,共4页
Computer Science
基金
天津市自然基金"大型数据库的数据挖掘技术研究(983600411)
关键词
数据挖掘
数据库
数据预处理
知识发现
Data mining .Tuple .Attribute .Knowledge-base .Rough-set ,Genetic algorithm