期刊文献+

在数据仓库环境中提高数据质量

下载PDF
导出
摘要 数据仓库是数据挖掘的重要基础,要提高数据挖掘的质量,就必须提高数据的质量,在数据仓库环境中提高数据质量是一个复杂艰苦的工作,需要持续不断地进行,才能有效地改善数据质量。提高数据质量的方法主要有:入数据仓库前对数据进行数据预处理,特别是其中的数据清洗,它能明显的改善数据质量;在使用一段时间后,要定期对入数据仓库后的数据进行数据刷新、数据过滤等措施,以保证数据仓库中的数据是有效的、最新的,能对人们进行知识决策提供支持。
作者 吴忠 文勇
出处 《江西公路科技》 2006年第B11期44-47,49,共5页
  • 相关文献

参考文献6

二级参考文献53

  • 1[1]Bitton D, DeWitt D J. Duplicate record elimination in large data files. ACM Trans Database Systems, 1983, 8(2):255-65
  • 2[2]Hernandez M, Stolfo S. The Merge/Purge problem for large databases. In: Proc ACM SIGMOD International Conference on Management of Data, 1995. 127-138
  • 3[3]Howard B Newcombe, Kennedy J M, Axford S J, James A P. Automatic linkage of vital records. Science, 1959, 130:954-959
  • 4[4]DeWitt D J, Naught J F, Schneider D A. An evaluation of non-equijoin algorithms. In: Proc 17th International Conference on Very Large Databases, Barcelona, Spain, 1991. 443-452
  • 5[5]Hylton J A. Identifying and merging related bibliographic records[MS dissertation]. MIT: MIT Laboratory for Computer Science Technical Report 678, 1996
  • 6[6]Monge A E, Elkan C P. An efficient domain-independent algorithm for detecting approximately duplicate database records. In: Proc DMKD'97, Tucson Arizona, 1997
  • 7[7]Kukich K. Techniques for automatically correcting words in text. ACM Computing Surveys, 1992, 24(4):377-439
  • 8[8]Wagner R A, Fischer M J. The string-to-string correction problem. J ACM, 1974, 21(1):168-173
  • 9[9]Lowrance R, Robert A Wagner. An extension of the string-to-string correction problem. J ACM, 1975, 22(2):177-183
  • 10[10] Sellers P H. On the theory and computation of evolutionary distances. SIAM J Applied Mathematics, 1974, 26(4):787-793

共引文献335

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部