摘要
数据仓库中的数据必须进行预处理后才能达到数据挖掘的要求。将数据预处理集成于数据仓库的构建过程中,提出一种基于数据仓库的数据预处理过程模型。讨论了数据预处理的各种算法并通过实例说明利用信息增益进行数据预处理的过程。
The data of the data warehouse cant meet the request of attaining the data mining until they carry on data preprocessing. This paper gathers data preprocessing in the process of the data warehouse, puts forward a kind of data's preparation to handle the process model, discusses kinds of algorithms and elucidate with facts the process in which the information is used to gain the benefit.
出处
《淮阴工学院学报》
CAS
2005年第5期44-46,共3页
Journal of Huaiyin Institute of Technology
关键词
数据挖掘
数据预处理
信息增益
data mining
data preprocessing
information gain