期刊文献+

交通运输数据质量检测与清洗关键技术研究 被引量:1

下载PDF
导出
摘要 通过交通运输行业各类信息系统的建设与部省联网,建立了全国统一的道路运输经营业户、运营车辆、从业人员等数据,目前,部级中心数据库的数据已达2 000万条记录。但从数据质量分析情况看,普遍存在数据记录不完整、错误数据比较多、数据指标内容不规范等问题。为此,研究设计了一套规范、高效、灵活、实用的数据清洗模型,并开发相应的数据清洗系统辅助完成清洗工作,取得了良好的应用效果,同时也为今后进一步研究提高部省联网数据质量,以及交通运输行业类似联网系统建设中的数据质量保障工作提供了便捷的技术手段和丰富的实践经验。
出处 《交通建设与管理》 2014年第8X期267-271,共5页 Transport Construction & Management
  • 相关文献

参考文献3

二级参考文献106

  • 1韩京宇,徐立臻,董逸生.一种大数据量的相似记录检测方法[J].计算机研究与发展,2005,42(12):2206-2212. 被引量:32
  • 2P Vassiliadis,Z vagena,S Skiadopoulos et al. Arktos:A Tool For Data Cleaning and Transformation in Data Warehouse Environments[J].Data Engineering,2000;23(4) :42~47
  • 3Erhard Rahm,H Hai Do. Data Cleaning:Problem and Current Approaches [J].Data Engineering,2000;23(4):3~13
  • 4H Galhardas, D Florescu, D Shasha. Declarative Data Cleaning: Language,Model,and Algorithms[C].In:VLDB 2001,Rome Italy,2001
  • 5W H Inmon,R D Hackathorn. Using the Data Warehouse[M].John Wiley & sons ,Inc, 1994
  • 6Aebi, D., Perrochon, L. Towards improving data quality. In: Sarda, N.L., ed. Proceedings of the International Conference on Information Systems and Management of Data. Delhi, 1993. 273~281.
  • 7Wang, R.Y., Kon, H.B., Madnick, S.E. Data quality requirements analysis and modeling. In: Proceedings of the 9th International Conference on Data Engineering. Vienna: IEEE Computer Society, 1993. 670~677.
  • 8Rahm, E., Do, H.H. Data cleaning: problems and current approaches. IEEE Data Engineering Bulletin, 2000,23(4):3~13.
  • 9Galhardas, H., Florescu, D., Shasha, D., et al. AJAX: an extensible data cleaning tool. In: Chen, W.D., Naughton, J.F., Bernstein, P.A., eds. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. Texas: ACM, 2000. 590.
  • 10Hernandez, M.A., Stolfo, S.J. Real-World data is dirty: data cleansing and the merge/purge problem. Data Mining and Knowledge Discovery, 1998,2(1):9~37.

共引文献350

同被引文献3

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部