目的评估患者时间序列相似性,验证融合时间序列相似性的K近邻(K-nearest neighbor,KNN)模型是否可以有效提高患者结局预测的效果。方法整合Medical Information Mart for Intensive Care(MIMIC-Ⅲ)数据库中急性心肌梗死患者的人口学信...目的评估患者时间序列相似性,验证融合时间序列相似性的K近邻(K-nearest neighbor,KNN)模型是否可以有效提高患者结局预测的效果。方法整合Medical Information Mart for Intensive Care(MIMIC-Ⅲ)数据库中急性心肌梗死患者的人口学信息、药物使用情况、疾病诊断、影像学报告、实验室指标以及手术操作数据,使用Jaccard系数、欧氏距离、编辑距离以及动态时间规整计算患者相似性。分别以入院基线数据和住院全程数据计算患者相似性,进而对患者死亡、长时住院和长时重症监护(intensive care unit,ICU)进行预测。使用接受者操作特征曲线下面积(area under curve,AUC)评估预测效果,与基于静态数据的支持向量机(support vector machine,SVM)模型、基于时间序列的长短时记忆(long short-term memory,LSTM)模型进行对比。结果输入数据为住院全程数据时,KNN模型在死亡和长时住院预测中AUC值为0.877和0.946,高于SVM模型(0.825,0.930)和LSTM模型(0.853,0.928);输入数据为入院基线数据时,KNN模型在三个结局预测中AUC值为0.680、0.738、0.728,与SVM模型(0.719,0.715,0.708)相比各有高低。结论时间序列患者相似性与机器学习方法相结合可以有效提高信息利用率和模型的预测效果。展开更多
文摘目的评估患者时间序列相似性,验证融合时间序列相似性的K近邻(K-nearest neighbor,KNN)模型是否可以有效提高患者结局预测的效果。方法整合Medical Information Mart for Intensive Care(MIMIC-Ⅲ)数据库中急性心肌梗死患者的人口学信息、药物使用情况、疾病诊断、影像学报告、实验室指标以及手术操作数据,使用Jaccard系数、欧氏距离、编辑距离以及动态时间规整计算患者相似性。分别以入院基线数据和住院全程数据计算患者相似性,进而对患者死亡、长时住院和长时重症监护(intensive care unit,ICU)进行预测。使用接受者操作特征曲线下面积(area under curve,AUC)评估预测效果,与基于静态数据的支持向量机(support vector machine,SVM)模型、基于时间序列的长短时记忆(long short-term memory,LSTM)模型进行对比。结果输入数据为住院全程数据时,KNN模型在死亡和长时住院预测中AUC值为0.877和0.946,高于SVM模型(0.825,0.930)和LSTM模型(0.853,0.928);输入数据为入院基线数据时,KNN模型在三个结局预测中AUC值为0.680、0.738、0.728,与SVM模型(0.719,0.715,0.708)相比各有高低。结论时间序列患者相似性与机器学习方法相结合可以有效提高信息利用率和模型的预测效果。