摘要
本文以病种分析为例,介绍了在数据仓库中数据清洗的方法――二次清洗法,二次清洗完成的工作是不同的,第一次的清洗主要负责清洗源数据中的"脏数据",第二次清洗则负责维度的提取。
The paper introduce the secondary cleaning method of data cleaning in datawarehouse. The two times cleaning affects on different range. The first data cleaning is to deal with the "dirty data' and the second data cleaning process the extract the information of diamension.
出处
《医学信息》
2008年第11期1939-1943,共5页
Journal of Medical Information
关键词
数据清洗
二次清洗
数据仓库
data cleaning
secondary cleaning
data warehouse