-
题名基于集成学习算法的肝癌术后复发预测模型构建
被引量:1
- 1
-
-
作者
张夕
柴玉婷
罗艳虹
徐钧
郭亚荣
-
机构
山西医科大学公共卫生学院卫生统计学教研室
山西医科大学第一医院肿瘤科
山西医科大学第一医院肝胆胰外科及肝脏移植中心
-
出处
《中华肿瘤防治杂志》
CAS
北大核心
2024年第2期101-106,共6页
-
基金
山西省留学人员科技活动择优资助项目(20210004)
中央引导地方科技发展资金项目(YDZJSX2021A041)
中国博士后科学基金(2021M702051)。
-
文摘
目的通过集成学习算法对肝癌术后患者进行复发预测,为肝癌患者的术后治疗提供指导。方法回顾性分析山西医科大学第一医院2017-01-01-2022-12-31入院接受外科手术治疗的471例肝癌患者临床资料。采用极端梯度提升(XGBoost)、随机森林(RF)模型、最小绝对值收敛和选择算子(LASSO)3种算法筛选影响因素;采用合成少数类过采样法(SMOTE)平衡数据,同时构建XGBoost分类模型,并与RF、支持向量机(SVM)和logistic回归模型进行比较;基于准确度、灵敏度、F1值和受试者工作特征曲线下面积(AUC)4个指标评价模型性能;应用沙普利加法解释(SHAP)及列线图对模型进行解释及可视化,得出相对较优的复发预测模型。结果采用RF筛选出的年龄、凝血酶原时间、肝叶位置、天冬氨酸转氨酶、脉管侵犯、血小板计数、CD10、腹水、分化程度和淋巴细胞绝对值是对肝癌术后复发影响较大的10个因素,并综合危险因素构建预测肝癌术后复发风险列线图;同时,所构建的XGBoost模型(准确度为0.905,灵敏度为0.852,F1为0.900,AUC为0.905)取得了最优的分类性能。结论本研究构建的XGBoost模型具有较好的分类性能,结合SHAP及列线图可以使模型更具解释性。此模型可以识别复发高危人群,指导临床制定个性化诊疗方案。
-
关键词
肝癌
术后复发
机器学习
极端梯度提升
沙普利加法解释
-
Keywords
liver cancer
postoperative recurrence
machine learning
extreme gradient boosting
Shapley Additive explanation
-
分类号
R735.7
[医药卫生—肿瘤]
-