期刊文献+

基于Hadoop医学数据平台的数据清洗 被引量:2

下载PDF
导出
摘要 随着医院信息化的不断深入和普及,病人的电子病历、药物信息、诊治记录和病人的个人信息等,存在着重复、不完整或错误的数据,无法在数据库中清晰明了地获取每个病人的信息,因此医学数据清洗应运而生。实现一个基于Kettle工具和Python语言的数据清洗平台。平台使用Kettle工具和Python语言对简单的医学重复数据、医学错误数据及医学不完整数据按照设计的清洗流程以及清洗规则进行清洗,之后通过Kettle转换存储到Hadoop平台的Hive数据仓库中,从而得到有价值的医疗数据并应用到医疗大数据分析和挖掘中。
机构地区 河北北方学院
出处 《电脑编程技巧与维护》 2020年第1期121-122,176,共3页 Computer Programming Skills & Maintenance
基金 河北省高等学校科学技术研究项目(ZD2018241) 河北省高等学校科学技术研究青年基金项目(QN2018155) 河北北方学院2019年度大学生创新创业训练项目(xj201910)
  • 相关文献

参考文献1

共引文献5

同被引文献14

引证文献2

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部