基于集成学习模型预测重症患者再入重症监护病房的风险被引量：8

Prediction of intensive care unit readmission for critically ill patients based on ensemble learning

下载PDF

导出

摘要目的:基于集成学习算法建立患者再入重症监护病房(intensive care unit,ICU)的风险预测模型,并比较各个模型的预测性能。方法:使用美国重症医学数据库(medical information mart for intensive care,MIMIC)-Ⅲ,根据纳入、排除标准筛选患者,提取人口学特征、生命体征、实验室检查、合并症等可能对结局有预测作用的变量,基于集成学习方法随机森林、自适应提升算法(adaptive boosting,AdaBoost)和梯度提升决策树(gradient boosting decision tree,GBDT)建立再入ICU预测模型,并比较集成学习与Logistic回归的预测性能。使用五折交叉验证后的平均灵敏度、阳性预测值、阴性预测值、假阳性率、假阴性率、受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)和Brier评分评价模型效果,基于最佳性能模型给出重要性排序前10位的预测变量。结果:所有模型中,GBDT(AUROC=0.858)优于随机森林(AUROC=0.827),略好于AdaBoost(AUROC=0.851)。与Logistic回归(AUROC=0.810)相比,集成学习算法在区分度上均有较大的提升。GBDT算法给出的变量重要性排序中,平均动脉压、收缩压、舒张压、心率、尿量、血肌酐等变量排序靠前,相对而言,再入ICU患者的心血管功能和肾功能更差。结论:基于集成学习算法的患者再入ICU预测模型表现出较好的性能,优于Logistic回归。使用集成学习算法建立的再入ICU风险预测模型可用于识别再入ICU风险高的患者,医务人员可针对高风险患者采取干预措施,改善患者的整体临床结局。 Objective:To develop machine learning models for predicting intensive care unit(ICU)readmission using ensemble learning algorithms.Methods:A publicly accessible American ICU database,medical information mart for intensive care(MIMIC)-Ⅲas the data source was used,and the patients were selected by the inclusion and exclusion criteria.A set of variables that had the predictive ability of outcome including demographics,vital signs,laboratory tests,and comorbidities of patients were extracted from the dataset.We built the ICU readmission prediction models based on ensemble learning methods including random forest,adaptive boosting(AdaBoost),and gradient boosting decision tree(GBDT),and compared the prediction performance of the machine learning models with a conventional Logistic regression model.Five-fold cross validation was used to train and validate the prediction models.Average sensitivity,positive prediction value,negative prediction value,false positive rate,false negative rate,area under the receiver operating characteristic curve(AUROC)and Brier score were used as performance measures.After constructing the prediction models,top 10 predictive variables based on importance ranking were identified by the model with the best discrimination.Results:Among these ICU readmission prediction models,GBDT(AUROC=0.858)had better performance than random forest(AUROC=0.827),and was slightly superior to AdaBoost(AUROC=0.851)in terms of AUROC.Compared with Logistic regression(AUROC=0.810),the discrimination of the three ensemble learning models was much better.The feature importance provided by GBDT showed that the top ranking variables included vital signs and laboratory tests.The patients with ICU readmission had higher mean arterial pressure,systolic blood pressure,diastolic blood pressure,and heart rate than the patients without ICU readmission.Meanwhile,the patients readmitted to ICU experienced lower urine output and higher serum creatinine.Overall,the patients having repeated admissions during their hospitalization showed worse heart function and renal function compared with the patients without ICU readmission.Conclusion:The ensemble learning based ICU readmission prediction models had better performance than Logistic regression model.Such ensemble learning models have the potential to aid ICU physicians in identifying those patients with high risk of ICU readmission and thus help improve overall clinical outcomes.

作者林瑜吴静依蔺轲胡永华孔桂兰 LIN Yu;WU Jing-yi;LIN Ke;HU Yong-hua;KONG Gui-lan(National Institute of Health Data Science, Peking University, Beijing 100191, China;Department of Epidemiology and Biostatistics, Peking University School of Public Health, Beijing 100191, China;Advanced Institute of Information Technology, Peking University, Hangzhou 311215, China;Peking University Medical Informatics Center, Beijing 100191, China)

机构地区北京大学健康医疗大数据国家研究院北京大学公共卫生学院流行病与卫生统计系北京大学信息技术高等研究院北京大学医学信息学中心

出处《北京大学学报（医学版）》 CAS CSCD 北大核心 2021年第3期566-572,共7页 Journal of Peking University:Health Sciences

基金国家自然科学基金(81771938、91846101) 北京市自然科学基金(7212201) 北京大学医学部-密歇根大学医学院转化医学与临床研究联合研究所项目(BMU2020JI011)。

关键词重症监护病房病人再入院机器学习试验预期值 Intensive care units Patient readmission Machine learning Predictive value of tests

分类号 R459.7 [医药卫生—急诊医学]

引文网络
相关文献

同被引文献80

1王忠,武哲.数据挖掘在审计信息分析中的应用[J].计算机应用研究,2005,22(2):167-169. 被引量：12
2徐兵,唐丽萍,张浩,陶凌,李泽浦.影响心衰患者再入院的多因素分析[J].中国心血管病研究,2008,6(3):205-208. 被引量：16
3胡俊俊,孙静.一种新型的计算机审计模型[J].计算机应用研究,2008,25(3):782-785. 被引量：4
4翟文卉.怡那林、倍他乐克、螺内酯治疗全心衰疗效分析[J].中国当代医药,2009,16(8):55-56. 被引量：1
5刘华,王春生,刘岚,庄亚敏,杨晓梅,张颖.心脏外科术后患者重返重症监护病房的原因及危险因素分析[J].中华医学杂志,2012,92(4):272-275. 被引量：11
6杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013,33(6):1574-1578. 被引量：116
7梁志文,杨金民,李元旗.基于多项式模型和低风险的贝叶斯垃圾邮件过滤算法[J].中南大学学报（自然科学版）,2013,44(7):2787-2792. 被引量：10
8郭奕瑞,李玉倩,王高帅,刘晓田,张路宁,张红艳,王炳源,王重建.人工神经网络模型在2型糖尿病患病风险预测中的应用[J].郑州大学学报（医学版）,2014,49(2):180-183. 被引量：23
9秦荣生.大数据、云计算技术对审计的影响研究[J].审计研究,2014(6):23-28. 被引量：571
10任珂.外科重症监护病房患者的重返原因及预后危险因素分析[J].中国实用医药,2014,9(34):237-238. 被引量：5

引证文献8

1吴彤,张贯虹,陈婷婷.基于正则化贪心森林算法的情感分析方法研究[J].合肥学院学报（综合版）,2021,38(5):109-114. 被引量：1
2毛金凤,石红霞,崔新晨,蔡毓畅,宋美.基于Stacking集成机器学习算法的审计风险评估研究[J].电脑知识与技术,2022,18(4):15-18.
3王琦琪,戴家佳,崔熊卫.基于集成学习模型的糖尿病患病风险预测研究[J].软件导刊,2022,21(4):62-66. 被引量：3
4章秋霞.大数据时代集成医学指标完善疾病风险预测的效果[J].中医药管理杂志,2022,30(13):163-165.
5王婷,杨阳,刘宁.非计划重返ICU风险预测模型的系统评价[J].中华现代护理杂志,2022,28(28):3913-3918.
6杨晓,周会兰,王玲,方杰,杨茂凡,陈柯宇,高杰.重返ICU风险预测模型的系统评价[J].中国循证医学杂志,2023,23(1):67-74. 被引量：1
7林之韵,程云章,耿晓斌.基于XGBoost的危重症患者住院时间分类预测模型和风险因素研究[J].生物医学工程研究,2023,42(1):36-42. 被引量：2
8徐瑞,肖海军,胡琛.基于WGBDT的心衰患者半年内再入院风险预测[J].中南民族大学学报（自然科学版）,2023,42(3):425-432.

二级引证文献7

1刘成.基于AdaBoost算法在电商评论情感中的应用[J].数字技术与应用,2022,40(3):60-62. 被引量：1
2戴晓霞,李娟,王晨阳,朱国军,刘冰.基于机器学习的脂肪肝预测模型构建[J].湖北医药学院学报,2022,41(6):574-577. 被引量：1
3龚中良,刘强,李大鹏,文韬,管金伟,易宗霈,申飘.基于XGBoost的掺伪茶油光谱鉴别模型[J].中国粮油学报,2023,38(8):190-196.
4李宣霖,王憭瑶,黄琳,郑明智,温成平.类风湿关节炎前状态病情转归动态预测模型的探索与构建[J].中医杂志,2023,64(24):2516-2521. 被引量：1
5花露露,曹晓春,王劲草,王金,焦昱璇.基于XGBoost的钻井液体系分类预测模型研究[J].钻井液与完井液,2023,40(6):765-770. 被引量：1
6王晓东,杨军,唐杰,吴亚利.智慧重症监护室建设背景下生命支持设备的临床辅助决策效能分析[J].中国医学装备,2024,21(2):132-137.
7董雪凡,田建丽,马静宜,李阳,贾起月.术后患者尿潴留发生风险预测模型的系统评价[J].中华现代护理杂志,2024,30(10):1352-1358.

1储爱琴,张甜,方跃艳,袁丽,管晓红,张海玲.肾移植患者非计划性再入院及危险因素的调查研究[J].International Journal of Nursing Sciences,2020,7(3):291-296. 被引量：1
2曹晶晶,赵淑娟,高传玉,刘伟,蔡海霞,马培志.健康生活方式与不同性别慢性心力衰竭患者再住院风险的相关性[J].中华心血管病杂志,2021,49(1):54-59. 被引量：13
3郭春宣,钟纯正,李琦,高元杰,李文斌,欧诒丹.循环miR-143和miR-182预测急性缺血性卒中患者转归的价值[J].国际脑血管病杂志,2021,29(3):184-188. 被引量：2
4侯乐,邹聪,莫称龙,陈钊,施海姗,章慧,陈俊羽,周晓明,刘燕明,陈林,方雅秀,郑东.高敏C反应蛋白/白蛋白比值与缺血性卒中后认知损害的相关性[J].国际脑血管病杂志,2020,28(12):904-909. 被引量：3
5张持,何晓璐,田玉蓉,俞刘珍熊,张康睿,杨若蕊,吴君仓.平均血小板体积预测静脉溶栓治疗的急性缺血性卒中患者的转归[J].国际脑血管病杂志,2021,29(3):169-173. 被引量：3
6张孟恩,李宗友,陆景红,许辉,蔡辉,翟明锋.嗜酸性粒细胞预测急性缺血性卒中患者短期转归[J].国际脑血管病杂志,2021,29(2):95-99. 被引量：4
7王佳,杨春晓.中性粒细胞/淋巴细胞比值在接受再灌注治疗的缺血性卒中患者中的预测作用[J].国际脑血管病杂志,2021,29(4):291-293. 被引量：3
8李大中,李昉,张克延.基于变量选择深度信念神经网络的风速预测[J].华北电力大学学报（自然科学版）,2021,48(1):62-68. 被引量：6
9程纯.基于特征工程方法的电影评分影响因素重要性分析[J].现代电影技术,2020(12):30-36.
10黄敏强,匡蕾,韩伟.急诊滞留时间与需要入住ICU的脓毒症患者的预后分析:一项基于大型数据库的回顾性队列研究[J].中华灾害救援医学,2021,9(6):1021-1027.

北京大学学报（医学版）

2021年第3期

浏览历史

内容加载中请稍等...

基于集成学习模型预测重症患者再入重症监护病房的风险被引量：8

同被引文献80

引证文献8

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于集成学习模型预测重症患者再入重症监护病房的风险 被引量：8

同被引文献80

引证文献8

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于集成学习模型预测重症患者再入重症监护病房的风险被引量：8