目的建立一个机器学习模型能够准确预测急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者死亡风险,选取合适的填充方式解决现有电子健康记录(electronic health record,EHR)中存在的稀疏性、不规则性问题,辅助医生进...目的建立一个机器学习模型能够准确预测急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者死亡风险,选取合适的填充方式解决现有电子健康记录(electronic health record,EHR)中存在的稀疏性、不规则性问题,辅助医生进行临床决策。方法从重症监护医学信息数据库(medical information mart for intensive care,MIMIC-Ⅲ)中筛选符合“柏林定义”的ARDS患者,并对患者入院24 h内的生命体征、实验室指标、诊断代码、影像学报告等数据进行回顾性分析,首先使用非负潜在因子分解填补缺失值,然后构建两阶段的堆叠异构集成学习方法,预测患者30 d内的死亡风险,采用受试者工作特征曲线下面积(area under the receiver operation characteristic curve,AUROC)、准确度、精确度、F1值等指标对模型进行评价,并进行特征重要性分析。结果本研究共纳入2576个患者,80%用于训练,20%用于模型测试。利用不同填充方式对数据进行处理,非负潜在因子分解相较于其他填充方式能够更好地保留原数据的分布结构,有着更高的填充精度。对填充好的数据进行建模,两阶段堆叠集成模型的准确度为0.841,AUROC为0.846,F1值为0.586,相较于其他机器学习模型展示出了更好的预测能力。结论两阶段的堆叠异构集成学习模型能够较好地实现对ARDS患者死亡风险预测。展开更多
文摘目的建立一个机器学习模型能够准确预测急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者死亡风险,选取合适的填充方式解决现有电子健康记录(electronic health record,EHR)中存在的稀疏性、不规则性问题,辅助医生进行临床决策。方法从重症监护医学信息数据库(medical information mart for intensive care,MIMIC-Ⅲ)中筛选符合“柏林定义”的ARDS患者,并对患者入院24 h内的生命体征、实验室指标、诊断代码、影像学报告等数据进行回顾性分析,首先使用非负潜在因子分解填补缺失值,然后构建两阶段的堆叠异构集成学习方法,预测患者30 d内的死亡风险,采用受试者工作特征曲线下面积(area under the receiver operation characteristic curve,AUROC)、准确度、精确度、F1值等指标对模型进行评价,并进行特征重要性分析。结果本研究共纳入2576个患者,80%用于训练,20%用于模型测试。利用不同填充方式对数据进行处理,非负潜在因子分解相较于其他填充方式能够更好地保留原数据的分布结构,有着更高的填充精度。对填充好的数据进行建模,两阶段堆叠集成模型的准确度为0.841,AUROC为0.846,F1值为0.586,相较于其他机器学习模型展示出了更好的预测能力。结论两阶段的堆叠异构集成学习模型能够较好地实现对ARDS患者死亡风险预测。