期刊文献+

浅谈医学数据常见质量问题及其清洗方法 被引量:1

下载PDF
导出
摘要 随着社会经济的发展和大数据时代的到来,各行业的数据量越来越大,医疗卫生领域尤为明显。数据数量的增长同时,数据质量的控制也给广大研究人员带来一定的困扰。该文在充分文献分析的基础上,探讨了常见的数据质量问题及其清洗方法,总结了数据清洗六个步骤,旨在为卫生研究人员提供参考。
作者 武瑞仙 周红
出处 《科技资讯》 2016年第6期150-150,152,共2页 Science & Technology Information
  • 相关文献

参考文献2

二级参考文献49

  • 1韩京宇,胡孔法,徐立臻,董逸生.一种在线数据清洗方法[J].应用科学学报,2005,23(3):292-296. 被引量:2
  • 2刘奕群,张敏,马少平.面向信息检索需要的网络数据清理研究[J].中文信息学报,2006,20(3):70-77. 被引量:5
  • 3Van den Broeck J, Argeseanu Cunningham S, Eeckels R, et al. Data CleaningDetecting, Diagnosing, and Editing Data Abnormalities[J]. PLoS Med, 2005, 2 (10): e267.
  • 4Ron Cody. Cody's Data Cleaning Techniques Using SAS software [M]. Cary, NC: SAS Institute Inc, 1999.
  • 5Burlew, Michele M. SAS Macro Programming Made Easy, Second Edition[M]. Cary, NC: SAS Institute Inc, 2006.
  • 6Delwiche, Lora D, Slaughter, Susan J. The Little SAS Book: A Primer, Third Edition [M]. Cary, NC: SAS institute inc, 2003.
  • 7Hon D B, Dewi V J.Duplicate record elimination in large data files[J].ACM Transactions on Database Sys- tem, 1995.
  • 8Lee M L, Lu H, Ling T W, et al.Cleaning data for mining and warehousing[C]//DEXA'99,1999.
  • 9Fan Wenfei.Extending dependencies with conditions for data cleaning[C]//8th IEEE International Conference on Computer and Information Technology, 2008 :185-190.
  • 10Eckerson W W.Data quality and the bottom line:achiev- ing business success through a commitment to high quality data[R].The Data Warehousing Institute,2002.

共引文献49

同被引文献8

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部