目的采用随机生存森林算法分析影响肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)治疗不可切除肝细胞癌(hepatocellular carcinoma,HCC)患者的预后因素,并构建预后模型。方法回顾性选择2014年1月至2017年12月复旦大...目的采用随机生存森林算法分析影响肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)治疗不可切除肝细胞癌(hepatocellular carcinoma,HCC)患者的预后因素,并构建预后模型。方法回顾性选择2014年1月至2017年12月复旦大学附属中山医院肝肿瘤内科收治的一线治疗为TACE的HCC患者636例,并按照7∶3比例划分为训练集(n=445)和验证集(n=191)。根据患者的临床数据、实验室指标及随访生存数据,建立Cox比例风险模型和基于机器学习算法的随机生存森林模型,并评估2种模型的预测能力。结果肿瘤负荷、年龄、基线G-谷氨酰转肽酶水平、基线甲胎蛋白水平和白蛋白-胆红素分级是影响TACE治疗不能切除HCC患者的独立预后因素。Cox回归模型的训练集1年、3年、5年的ROC曲线下面积(area under the curve,AUC)为0.782、0.796和0.791,验证集为0.750、0.766和0.766。随机生存森林模型训练集1年、3年和5年AUC为0.896、0.894和0.875,验证集为0.743、0.763和0.770。随机生存森林模型能将患者区分为预后好组和预后差组,两组生存期差异有统计学意义(P<0.05)。决策曲线显示随机生存森林模型的净获益优于Cox比例风险模型。结论随机生存森林模型是预测TACE治疗不可切除HCC患者预后的可靠工具。展开更多
目的探究影响鼻咽癌患者预后的因素,并构建其术后Nomogram图。方法利用SEER*Stat Version 8.4.0.1软件下载监测、流行病学和最终结果(SEER)数据库数据,收集2000年1月1日2017年12月30日确诊为鼻咽癌的1411例患者的相关数据,使用Cox回归...目的探究影响鼻咽癌患者预后的因素,并构建其术后Nomogram图。方法利用SEER*Stat Version 8.4.0.1软件下载监测、流行病学和最终结果(SEER)数据库数据,收集2000年1月1日2017年12月30日确诊为鼻咽癌的1411例患者的相关数据,使用Cox回归与随机生存森林相结合的方法筛选影响预后的相关因素,绘制总体生存率的Nomogram图。通过内部验证及一致性指数(C指数)、校准曲线、受试者工作特征曲线下面积(AUC)对预测效果进行验证和评价。结果年龄、性别、种族、肿瘤组织学分级、肿瘤分期、放疗信息、是否进行肿瘤切除手术、肿瘤转移信息、首要恶性指标信息、婚姻状态均是影响鼻咽癌患者生存预后的独立因素。训练集C指数为0.782,AUC为0.723;验证集C指数为0.751,AUC为0.718。Cox回归模型具有良好的预测能力。结论基于SEER数据库构建Nomogram图生存预后模型可较为准确地对鼻咽癌患者进行生存预测,为临床研究提供帮助。展开更多
目的建立并验证接受抗逆转录病毒治疗(antiretroviral therapy,ART)的HIV感染者或AIDS患者(persons living with HIV or AIDS,PLWHA)发生AIDS相关性死亡的预测模型。方法基于2003—2019年中国艾滋病综合防治信息系统中符合条件的PLWHA...目的建立并验证接受抗逆转录病毒治疗(antiretroviral therapy,ART)的HIV感染者或AIDS患者(persons living with HIV or AIDS,PLWHA)发生AIDS相关性死亡的预测模型。方法基于2003—2019年中国艾滋病综合防治信息系统中符合条件的PLWHA建立回顾性队列,采用随机过采样少数类(random over-sampling minority examples,ROSE)技术和随机生存森林算法建立和验证AIDS相关性死亡的预测模型,通过时间依赖Brier评分和时间依赖ROC曲线下面积对预测模型进行评价。根据训练集预测风险值的三分位数对验证集进行风险分层,通过Kaplan-Meier曲线和log-rank检验比较三组的生存率。结果本研究共纳入360例研究对象,随访时间中位数为36.72(10.62,60.69)个月,120例研究对象发生AIDS相关性死亡。根据候选预测因子的重要性,选择年龄、CD4^(+)T淋巴细胞计数、Hb和HCV感染建立预测模型1;在预测模型1的基础上,剔除变量重要性较低的HCV感染,建立预测模型2。在验证集中,两个预测模型预测1~5年AIDS相关性死亡风险的Brier评分均低于0.15,预测18~42个月AIDS相关性死亡风险的AUC均高于0.70,两者的校准度和区分度均较好。预测模型2的区分度优于预测模型1。基于预测模型2预测的风险值进行风险分层,死亡风险值<2.37为低风险组,2.37~<26.83为中风险组,≥26.83为高风险组,低、中和高风险组间生存率的差异有统计学意义(log-rankP<0.001)。结论本研究建立的AIDS相关性死亡预测模型包含年龄、CD4^(+)T淋巴细胞计数和Hb共3个预测因子,预测1~3年AIDS相关性死亡的校准度和区分度较好,对预测PLWHA个体AIDS相关性死亡风险及早期干预有潜在价值。展开更多
文摘目的采用随机生存森林算法分析影响肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)治疗不可切除肝细胞癌(hepatocellular carcinoma,HCC)患者的预后因素,并构建预后模型。方法回顾性选择2014年1月至2017年12月复旦大学附属中山医院肝肿瘤内科收治的一线治疗为TACE的HCC患者636例,并按照7∶3比例划分为训练集(n=445)和验证集(n=191)。根据患者的临床数据、实验室指标及随访生存数据,建立Cox比例风险模型和基于机器学习算法的随机生存森林模型,并评估2种模型的预测能力。结果肿瘤负荷、年龄、基线G-谷氨酰转肽酶水平、基线甲胎蛋白水平和白蛋白-胆红素分级是影响TACE治疗不能切除HCC患者的独立预后因素。Cox回归模型的训练集1年、3年、5年的ROC曲线下面积(area under the curve,AUC)为0.782、0.796和0.791,验证集为0.750、0.766和0.766。随机生存森林模型训练集1年、3年和5年AUC为0.896、0.894和0.875,验证集为0.743、0.763和0.770。随机生存森林模型能将患者区分为预后好组和预后差组,两组生存期差异有统计学意义(P<0.05)。决策曲线显示随机生存森林模型的净获益优于Cox比例风险模型。结论随机生存森林模型是预测TACE治疗不可切除HCC患者预后的可靠工具。
文摘目的探究影响鼻咽癌患者预后的因素,并构建其术后Nomogram图。方法利用SEER*Stat Version 8.4.0.1软件下载监测、流行病学和最终结果(SEER)数据库数据,收集2000年1月1日2017年12月30日确诊为鼻咽癌的1411例患者的相关数据,使用Cox回归与随机生存森林相结合的方法筛选影响预后的相关因素,绘制总体生存率的Nomogram图。通过内部验证及一致性指数(C指数)、校准曲线、受试者工作特征曲线下面积(AUC)对预测效果进行验证和评价。结果年龄、性别、种族、肿瘤组织学分级、肿瘤分期、放疗信息、是否进行肿瘤切除手术、肿瘤转移信息、首要恶性指标信息、婚姻状态均是影响鼻咽癌患者生存预后的独立因素。训练集C指数为0.782,AUC为0.723;验证集C指数为0.751,AUC为0.718。Cox回归模型具有良好的预测能力。结论基于SEER数据库构建Nomogram图生存预后模型可较为准确地对鼻咽癌患者进行生存预测,为临床研究提供帮助。
文摘目的建立并验证接受抗逆转录病毒治疗(antiretroviral therapy,ART)的HIV感染者或AIDS患者(persons living with HIV or AIDS,PLWHA)发生AIDS相关性死亡的预测模型。方法基于2003—2019年中国艾滋病综合防治信息系统中符合条件的PLWHA建立回顾性队列,采用随机过采样少数类(random over-sampling minority examples,ROSE)技术和随机生存森林算法建立和验证AIDS相关性死亡的预测模型,通过时间依赖Brier评分和时间依赖ROC曲线下面积对预测模型进行评价。根据训练集预测风险值的三分位数对验证集进行风险分层,通过Kaplan-Meier曲线和log-rank检验比较三组的生存率。结果本研究共纳入360例研究对象,随访时间中位数为36.72(10.62,60.69)个月,120例研究对象发生AIDS相关性死亡。根据候选预测因子的重要性,选择年龄、CD4^(+)T淋巴细胞计数、Hb和HCV感染建立预测模型1;在预测模型1的基础上,剔除变量重要性较低的HCV感染,建立预测模型2。在验证集中,两个预测模型预测1~5年AIDS相关性死亡风险的Brier评分均低于0.15,预测18~42个月AIDS相关性死亡风险的AUC均高于0.70,两者的校准度和区分度均较好。预测模型2的区分度优于预测模型1。基于预测模型2预测的风险值进行风险分层,死亡风险值<2.37为低风险组,2.37~<26.83为中风险组,≥26.83为高风险组,低、中和高风险组间生存率的差异有统计学意义(log-rankP<0.001)。结论本研究建立的AIDS相关性死亡预测模型包含年龄、CD4^(+)T淋巴细胞计数和Hb共3个预测因子,预测1~3年AIDS相关性死亡的校准度和区分度较好,对预测PLWHA个体AIDS相关性死亡风险及早期干预有潜在价值。