摘要
医学检验数据具有体量大、类型繁多和特征高维等特点,是临床决策所需信息的主要来源,目前其应用价值受到传统基于病种专属专用数据处理分析模式的束缚,带来大量重复性的数据采集、数据处理工作,导致相关科研工作取数难、用数难、工作效率低。大数据和数据挖掘是实现数据价值的有效手段,数据挖掘可分为描述模式和预测模式,描述模式描述了数据的一般性质,预测模式根据当前数据进行总结,对此机器学习具有天然优势,机器学习预测能力依赖数据质量。根据机器学习对数据质量、数据格式的要求,采用大数据技术对某医院近5年(2016—2021年)的全量1.4亿多条医学检验数据做系统性的数据集成、数据治理和数据开发,构建医学检验大数据作为机器学习数据源。结果表明,医学检验大数据实现了一次生成,全病种全量数据的高效率、无限制使用的目标,为将来全量医学检验大数据的构建探索了实践路径。
出处
《电脑知识与技术》
2023年第7期73-76,共4页
Computer Knowledge and Technology
基金
深圳市科技计划项目(ZDSYS20210623092001003)。