期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于随机生存森林的供水管道漏损风险评估
1
作者 周灵俊 陶涛 +2 位作者 李建勤 姜成浩 葛震 《净水技术》 CAS 2024年第S01期29-36,141,共9页
供水管网漏损正得到越来越多的关注,管道漏损不仅造成水资源的浪费,还可能引发城市安全事故,而管道漏损风险评估是供水企业进行漏损控制的重要步骤。在供水管道的生存分析中,未发生漏损的管道被认为是删失数据,而在构建漏损风险评估模... 供水管网漏损正得到越来越多的关注,管道漏损不仅造成水资源的浪费,还可能引发城市安全事故,而管道漏损风险评估是供水企业进行漏损控制的重要步骤。在供水管道的生存分析中,未发生漏损的管道被认为是删失数据,而在构建漏损风险评估模型时未漏损的管道数据同样十分重要。研究利用生存分析能够处理删失数据的特点,采用随机生存森林算法构建H市供水管网漏损风险评估模型。结果表明,该模型有良好的预测精度,模型C指数超0.75。并且模型能准确识别影响漏损的关键因素,变量重要性结果说明管道固有属性比环境变量对管道漏损的影响程度更大。研究进一步分析了在不同温度和降雨下漏损风险动态变化,将预测漏损风险分为5个等级,发现寒冷干燥气候下管网中漏损风险等级Ⅱ和Ⅲ级管道数量最多,说明供水管网在冬季干燥天气下发生漏损概率最大。模型还预测管道在未来不同管龄下的生存概率,通过设定生存概率阈值判定何时发生漏损,结果表明短期漏损问题尚未十分严重,但10年后H市供水管网中漏损管道数量将明显增多。该研究为供水企业提供了长短期的漏损风险预测,并考虑环境因素对漏损的影响,有助于制定更为精确的管道维护和管道更新策略。 展开更多
关键词 随机生存森林 生存分析 供水管网 风险评估 删失数据
下载PDF
基于随机生存森林的低级别脑胶质瘤复发预测模型
2
作者 毛丹怡 曾庆 +2 位作者 杨裕隆 陈宇轩 钱金山 《统计学与应用》 2024年第1期151-163,共13页
背景:低级别脑胶质瘤(LGG)患者在治疗后仍可能面临复发的风险。本研究旨在考虑复发与死亡相关性的基础上分析影响LGG患者复发的因素,并建立复发预测模型。方法:收集来自TCGA数据库LGG患者的临床数据,最终纳入457例LGG患者。建立联合脆... 背景:低级别脑胶质瘤(LGG)患者在治疗后仍可能面临复发的风险。本研究旨在考虑复发与死亡相关性的基础上分析影响LGG患者复发的因素,并建立复发预测模型。方法:收集来自TCGA数据库LGG患者的临床数据,最终纳入457例LGG患者。建立联合脆弱模型分析复发危险因素,采用随机生存森林(Random Survival Forest,RSF)的方法建立LGG复发预测模型,同时建立Cox模型作为比较。结果:主要治疗结局、年龄、ICD-O-3组织学编码、首次症状持续时间、术后、肿瘤组织学分级和放射治疗作为预测因子纳入LGG复发预测模型。与Cox模型相比,RSF模型具有较好的区分度和校准度,具体表现为,基于bootstrap重抽样数据集计算1、3和、5年RSF的C指数分别为0.813、0.748和0.745,Cox分别为0.824、0.724和0.727,RSF在1、3、5年的AUC值分别为0.824、0.746和0.754,而Cox分别为0.833、0.713和0.730;校准曲线也表明RSF模型表现更优。结论:复发和死亡事件不应独立看待,RSF在复杂生存数据的预测建模方面具有优势,未来期待更多探索预测脑胶质瘤患者复发的方法和工具,且这些方法能得到在临床上的实践应用。 展开更多
关键词 低级别脑胶质瘤 复发预测模型 随机生存森林 联合脆弱模型 TCGA
下载PDF
随机生存森林模型预测肝动脉化疗栓塞治疗肝细胞癌患者的预后
3
作者 杜琪 殷欣 任正刚 《中国临床医学》 2024年第2期177-185,共9页
目的采用随机生存森林算法分析影响肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)治疗不可切除肝细胞癌(hepatocellular carcinoma,HCC)患者的预后因素,并构建预后模型。方法回顾性选择2014年1月至2017年12月复旦大... 目的采用随机生存森林算法分析影响肝动脉化疗栓塞(transcatheter arterial chemoembolization,TACE)治疗不可切除肝细胞癌(hepatocellular carcinoma,HCC)患者的预后因素,并构建预后模型。方法回顾性选择2014年1月至2017年12月复旦大学附属中山医院肝肿瘤内科收治的一线治疗为TACE的HCC患者636例,并按照7∶3比例划分为训练集(n=445)和验证集(n=191)。根据患者的临床数据、实验室指标及随访生存数据,建立Cox比例风险模型和基于机器学习算法的随机生存森林模型,并评估2种模型的预测能力。结果肿瘤负荷、年龄、基线G-谷氨酰转肽酶水平、基线甲胎蛋白水平和白蛋白-胆红素分级是影响TACE治疗不能切除HCC患者的独立预后因素。Cox回归模型的训练集1年、3年、5年的ROC曲线下面积(area under the curve,AUC)为0.782、0.796和0.791,验证集为0.750、0.766和0.766。随机生存森林模型训练集1年、3年和5年AUC为0.896、0.894和0.875,验证集为0.743、0.763和0.770。随机生存森林模型能将患者区分为预后好组和预后差组,两组生存期差异有统计学意义(P<0.05)。决策曲线显示随机生存森林模型的净获益优于Cox比例风险模型。结论随机生存森林模型是预测TACE治疗不可切除HCC患者预后的可靠工具。 展开更多
关键词 随机生存森林模型 Cox比例风险回归 肝动脉化疗栓塞 肝细胞癌 预后模型
下载PDF
基于随机生存森林构建中医药干预的IgA肾病蛋白尿风险预测模型
4
作者 翁雪莹 卢登勇 +5 位作者 石晓冬 吴慧敏 陈宇珊 左金巾 罗芳 钟建 《世界科学技术-中医药现代化》 CSCD 北大核心 2023年第7期2313-2320,共8页
目的基于随机生存森林算法构建中医药干预的IgA肾病蛋白尿风险预测模型,筛选IgA肾病蛋白尿预后风险因素。方法回顾性收集129例确诊为IgA肾病的临床资料,按照60%、40%的比例随机划分成训练集与测试集,在训练集中运用随机生存森林算法构... 目的基于随机生存森林算法构建中医药干预的IgA肾病蛋白尿风险预测模型,筛选IgA肾病蛋白尿预后风险因素。方法回顾性收集129例确诊为IgA肾病的临床资料,按照60%、40%的比例随机划分成训练集与测试集,在训练集中运用随机生存森林算法构建中医药干预的IgA肾病蛋白尿风险预测模型,利用VIMP法筛选预后风险因素,并在测试集中采用time-dependent ROC曲线(tdROC)对模型预测性能进行验证。结果据VIMP值表明IgA肾病蛋白尿预后风险因素依次为eGFR、高血压、中医药干预、24 hUPRO>1 g、肾小球硬化比例、Lee分级、肥胖、血脂异常、高尿酸血症、低蛋白血症、贫血、年龄、性别。eGFR与发生持续蛋白尿风险率呈非线性负相关。肾小球硬化比例>0.3时与持续蛋白尿风险率呈近似线性正相关。结论该中医药干预的IgA肾病蛋白尿风险预测模型具有一定的预测性能,可判断经中医药干预的IgA肾病患者蛋白尿预后,有助于临床随访监测及制定个体化治疗方案。 展开更多
关键词 IGA肾病 随机生存森林 中医药 预测模型
下载PDF
随机生存森林预测M1期老年结直肠癌患者生存
5
作者 刘璐 庞琳 田彦璋 《中国老年学杂志》 CAS 北大核心 2023年第24期5903-5908,共6页
目的应用随机生存森林算法构建M1期老年结直肠癌(CRC)患者预后预测模型并对预测结果进行评价。方法收集SEER数据库2010~2015年诊断的6118例、>60岁M1期CRC患者的临床数据,通过Cox回归分析影响老年CRC远处转移患者预后的相关因素,随... 目的应用随机生存森林算法构建M1期老年结直肠癌(CRC)患者预后预测模型并对预测结果进行评价。方法收集SEER数据库2010~2015年诊断的6118例、>60岁M1期CRC患者的临床数据,通过Cox回归分析影响老年CRC远处转移患者预后的相关因素,随机生存森林模型分析预后因素的交互作用。采用一致性指数、校准曲线及预测误差曲线评估预测模型的效能。结果婚姻状况、分化程度、T分期、N分期、原发灶手术、淋巴结清扫、化疗、CEA状态、骨转移、肝转移、肺转移是M1期结直肠癌患者的独立预后因素,化疗、原发手术部位及T分期之间存在强交互作用。接受手术和化疗(中位OS:22个月)>单纯化疗(中位OS:14个月)>单纯手术(中位OS:7个月)>两者都不接受(中位OS:4个月)。将随机生存森林模型VIMP法筛选的预后因素构建列线图,测试集6个月、1年、3年、5年受试者工作特征(ROC)曲线下面积(AUC)值分别为0.796、0.759、0.736和0.750。校对曲线显示,模型预测的生存率与患者实际的生存率之间具有良好一致性。预测误差曲线显示,RSF-Cox模型预测错误率低于Cox模型。结论随机生存林模型预测效果好,可以有效预测M1期老年CRC患者总体生存率,对患者个性化预后和临床指导决策有一定实用价值。 展开更多
关键词 结直肠癌 预后模型 机器学习 随机生存森林 列线图
下载PDF
基于SEER数据库鼻咽癌患者生存预后的Cox回归与随机生存森林分析
6
作者 肖志伟 韦岳昆 +2 位作者 傅永 黄代政 黄超 《现代医药卫生》 2023年第10期1630-1635,1639,共7页
目的探究影响鼻咽癌患者预后的因素,并构建其术后Nomogram图。方法利用SEER*Stat Version 8.4.0.1软件下载监测、流行病学和最终结果(SEER)数据库数据,收集2000年1月1日2017年12月30日确诊为鼻咽癌的1411例患者的相关数据,使用Cox回归... 目的探究影响鼻咽癌患者预后的因素,并构建其术后Nomogram图。方法利用SEER*Stat Version 8.4.0.1软件下载监测、流行病学和最终结果(SEER)数据库数据,收集2000年1月1日2017年12月30日确诊为鼻咽癌的1411例患者的相关数据,使用Cox回归与随机生存森林相结合的方法筛选影响预后的相关因素,绘制总体生存率的Nomogram图。通过内部验证及一致性指数(C指数)、校准曲线、受试者工作特征曲线下面积(AUC)对预测效果进行验证和评价。结果年龄、性别、种族、肿瘤组织学分级、肿瘤分期、放疗信息、是否进行肿瘤切除手术、肿瘤转移信息、首要恶性指标信息、婚姻状态均是影响鼻咽癌患者生存预后的独立因素。训练集C指数为0.782,AUC为0.723;验证集C指数为0.751,AUC为0.718。Cox回归模型具有良好的预测能力。结论基于SEER数据库构建Nomogram图生存预后模型可较为准确地对鼻咽癌患者进行生存预测,为临床研究提供帮助。 展开更多
关键词 SEER数据库 Nomogram图 鼻咽癌 生存预后 随机生存森林
下载PDF
随机生存森林模型在肺癌患者预后分析中的应用 被引量:12
7
作者 李淼 罗天娥 +3 位作者 郭强 于智凯 赵晋芳 段燕 《中国卫生统计》 CSCD 北大核心 2021年第3期327-331,共5页
目的应用随机生存森林模型探讨肺癌患者预后影响因素的重要性并对预测结果进行评价。方法对山西省某三甲医院342例确诊的肺癌患者进行随访研究,建立随机生存森林模型,并与传统的Cox回归模型进行比较。结果342例肺癌患者中226例患者发生... 目的应用随机生存森林模型探讨肺癌患者预后影响因素的重要性并对预测结果进行评价。方法对山西省某三甲医院342例确诊的肺癌患者进行随访研究,建立随机生存森林模型,并与传统的Cox回归模型进行比较。结果342例肺癌患者中226例患者发生死亡,中位生存时间为28.23月。治疗方式、肿瘤大小、临床分期等变量是影响肺癌患者预后的重要因素,淋巴结转移、分化程度、病理分型、年龄是中度预测因素,并分析了变量之间的交互作用。二者的模型比较结果显示随机生存森林模型预测错误率以及预测误差均低于Cox回归模型。结论随机生存森林模型拟合效果好,可用于右删失生存数据的分析,不但能发现重要的影响因素,还能发现变量之间的交互作用,为肺癌患者预后状况的改善,提升生命质量提供科学依据。 展开更多
关键词 随机生存森林模型 COX回归模型 肺癌 预后分析
下载PDF
基于随机生存森林的交通事件持续时间预测 被引量:11
8
作者 高珍 柯阿香 +1 位作者 余荣杰 王雪松 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第9期1304-1310,共7页
采用随机生存森林模型开展交通事件持续时间分析,克服了传统决策树模型易过度拟合和传统生存分析需限制性假定及识别协变量交互作用的缺陷.该研究基于上海城市快速路网交通事件数据,结合道路几何线形、交通运行、天气状况等数据.原始数... 采用随机生存森林模型开展交通事件持续时间分析,克服了传统决策树模型易过度拟合和传统生存分析需限制性假定及识别协变量交互作用的缺陷.该研究基于上海城市快速路网交通事件数据,结合道路几何线形、交通运行、天气状况等数据.原始数据库分为训练数据(80%)和测试数据(20%).分析结果表明事件类型、路段长度、发生地点、剩余车道数、交通流量等变量对交通事件持续时间有显著影响;影响时间预测准确率结果表明随机生存森林模型预测精度显著优于随机森林的预测精度. 展开更多
关键词 交通运行管理 交通事件持续时间预测 随机生存森林 城市快速路
下载PDF
随机生存森林在小细胞肺癌预后分析中的应用 被引量:1
9
作者 解瑞飞 吴波 《中国现代医生》 2016年第17期4-8,F0003,共6页
目的辨识与小细胞肺癌具有本质关联的基因变量,可以帮助临床医生制定个性化治疗方案,延长患者生存期,提高患者预后生活质量。方法共入组117例小细胞肺癌患者,含41000个基因变量,8个一般特征。利用随机生存森林方法结合基因表达谱及预后... 目的辨识与小细胞肺癌具有本质关联的基因变量,可以帮助临床医生制定个性化治疗方案,延长患者生存期,提高患者预后生活质量。方法共入组117例小细胞肺癌患者,含41000个基因变量,8个一般特征。利用随机生存森林方法结合基因表达谱及预后数据从一系列基因变量中探索与小细胞肺癌具有密切相关的基因变量。结果一般特征及EGFR、K-ras、p53表达在预后上无明显差异;所挑选的前12个基因中,FTCD、BTC、PSMC4、SLC43A1与小细胞肺癌具有密切的关系,而UCHL5、PSMC4与PSMD7、PCSK4、VPS13D与VPS13A具有调控依赖关系。结论随机生存森林可以高效的辨识与预后具有密切相关的本质基因。 展开更多
关键词 小细胞肺癌 随机生存森林 基因表达谱 生存分析 基因调控
下载PDF
随机生存森林在高维基因组数据生存分析中的应用 被引量:6
10
作者 宋欠欠 武晓岩 +1 位作者 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2013年第6期786-789,共4页
目的探讨随机生存森林(RSF)在高维基因组数据生存分析中的应用和适用性。方法通过模拟实验和实际数据分析,对随机生存森林、生存支持向量机(SSVM)和偏Cox回归(PCR)三种方法进行比较,并用生存预测的一致性错误率对其进行评价。结果模拟... 目的探讨随机生存森林(RSF)在高维基因组数据生存分析中的应用和适用性。方法通过模拟实验和实际数据分析,对随机生存森林、生存支持向量机(SSVM)和偏Cox回归(PCR)三种方法进行比较,并用生存预测的一致性错误率对其进行评价。结果模拟实验表明,在有交互作用的情况下,RSF的log-rank和logrankscore方法的预测效果均优于SSVM和PCR方法;实际数据分析结果显示,随机生存森林与生存支持向量机和偏Cox回归的预测效果相近,应用RSF方法筛选变量后建立的RSF模型能够在一定程度上提高预测效果。结论随机生存森林方法适用于高维生存数据的研究,对疾病的生存时间预测和预后因素分析具有实用价值。 展开更多
关键词 随机生存森林 偏Cox回归 生存预测变量筛选
下载PDF
基于随机生存森林的企业财务危机研究 被引量:1
11
作者 肖叶宇 张闪 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期1-6,共6页
以沪深两市A股制造业上市公司为样本,将随机生存森林模型引入企业财务危机研究中去.通过计算两种度量下变量重要性排名,发现营业收入增长率和息税前利润对财务危机的影响最大.随后将随机生存森林与Cox、后向逐步Cox和Lasso-Cox模型进行... 以沪深两市A股制造业上市公司为样本,将随机生存森林模型引入企业财务危机研究中去.通过计算两种度量下变量重要性排名,发现营业收入增长率和息税前利润对财务危机的影响最大.随后将随机生存森林与Cox、后向逐步Cox和Lasso-Cox模型进行对比,随机生存森林的预测性能要优于3种Cox模型.同时结合随机生存森林下的生存函数和累积风险函数,对公司被特别处理的时间进行分析,结果显示模型有很好的预警功效,可以为各利益相关方的决策提供依据. 展开更多
关键词 随机生存森林 生存分析 财务危机预警
下载PDF
基于随机生存森林的信用评分大数据研究 被引量:3
12
作者 周丽峰 《统计与管理》 2021年第10期11-18,共8页
信用评分技术是现代金融机构预测贷款违约风险的主要方法,目前银行、互联网金融平台等金融机构在原来关注违约概率的基础上,提出了估计不同时刻的违约风险及贷款寿命分布等更高要求。因此,常规基于分类的信用评分方法不再适用,有必要探... 信用评分技术是现代金融机构预测贷款违约风险的主要方法,目前银行、互联网金融平台等金融机构在原来关注违约概率的基础上,提出了估计不同时刻的违约风险及贷款寿命分布等更高要求。因此,常规基于分类的信用评分方法不再适用,有必要探索基于生存分析的信用评分模型。本研究将随机生存森林的方法应用于信用大数据的风险预测,并分别将其与Cox比例风险模型、基于Lasso惩罚的Cox模型、基于岭估计惩罚的Cox模型进行比较分析,不同情形的实验结果显示,随机生存森林的预测效果最好。此外,我们还借助随机生存森林对变量进行重要性评分排序并予以解释。本研究对提高贷款机构的决策能力和水平,具有一定的参考意义。 展开更多
关键词 信用评分 随机生存森林 COX比例风险模型 惩罚Cox模型
下载PDF
基于随机生存森林与网络拓扑信息的食管癌风险预测
13
作者 崔海波 刘川 +2 位作者 张凯 税长荣 刘伟 《高师理科学刊》 2018年第5期34-39,共6页
为精确预测食管癌病人的存活风险,通过构建食管癌编码基因(mRNA)和非编码基因(ncRNA)共表达网络,利用随机游走挖掘网络节点的拓扑权重,并与随机生存森林(RSF)整合,构建食管癌风险预测模型.结合5倍交叉证实和独立数据集验证,利用C-index... 为精确预测食管癌病人的存活风险,通过构建食管癌编码基因(mRNA)和非编码基因(ncRNA)共表达网络,利用随机游走挖掘网络节点的拓扑权重,并与随机生存森林(RSF)整合,构建食管癌风险预测模型.结合5倍交叉证实和独立数据集验证,利用C-index评估算法预测性能.识别出了用于构建风险预测模型的最优lnc RNA分子标签,并实现了食管癌生存风险的精确预测. 展开更多
关键词 随机生存森林 随机游走 风险预测模型 C-index 5倍交叉证实
下载PDF
基于随机生存森林的动静脉内瘘晚期失功预后因素研究
14
作者 翁雪莹 吴慧敏 +3 位作者 陈宇珊 左金巾 罗芳 钟建 《中国实用内科杂志》 CAS CSCD 北大核心 2024年第3期235-242,共8页
目的 基于随机生存森林(RSF)探讨维持性血液透析(MHD)患者动静脉内瘘(AVF)晚期失功的预后因素。方法选取2018年10月至2022年6月在广西中医药大学第一附属医院首次行AVF术的156例MHD患者作为随访研究对象,根据随访期间患者是否发生终点... 目的 基于随机生存森林(RSF)探讨维持性血液透析(MHD)患者动静脉内瘘(AVF)晚期失功的预后因素。方法选取2018年10月至2022年6月在广西中医药大学第一附属医院首次行AVF术的156例MHD患者作为随访研究对象,根据随访期间患者是否发生终点事件分成内瘘通畅组(116例)和内瘘失功组(40例),研究AVF晚期失功的预后因素。结果 RSF结果显示动静脉内瘘晚期失功的预后因素依次为血小板计数、甘油三酯、纤维蛋白原、年龄、白蛋白、血钙、D-二聚体及C反应蛋白。Cox比例风险回归模型结果显示血小板计数(HR 1.02,95%CI 1.012~1.030,P<0.001)及血钙(HR 8.84,95%CI 1.186~65.840,P=0.034)为AVF晚期失功的独立影响因素。根据Brier分数绘制的预测误差曲线可知RSF的预测性能总体上优于Cox比例风险回归模型。通过RSF-Cox模型最终确定有效预后因素为血小板计数、甘油三酯、纤维蛋白原、年龄、白蛋白、血钙。结论 RSF在分析动静脉内瘘晚期失功预后因素中有着良好的选择能力,本研究构建的RSF模型可帮助临床医师识别具有高危因素的患者并进行对症干预,便于加强内瘘护理和及时干预以延长AVF使用时间。 展开更多
关键词 随机生存森林 COX比例风险回归模型 动静脉内瘘 晚期失功 维持性血液透析
原文传递
基于随机森林生存模型的AMI患者PCI术后的不良事件风险分析
15
作者 朱祥 喻舜 +2 位作者 刘星雨 王胜南 吴磊 《重庆医科大学学报》 CAS CSCD 北大核心 2024年第3期295-302,共8页
目的:综合分析经皮冠状动脉介入术(percutaneous coronary intervention,PCI)后的急性心肌梗死(acute myocardial infarction,AMI)患者预后影响因素,并构建预测模型和预后评分体系,为临床血管个性化治疗提供参考。方法:本研究回顾性收集... 目的:综合分析经皮冠状动脉介入术(percutaneous coronary intervention,PCI)后的急性心肌梗死(acute myocardial infarction,AMI)患者预后影响因素,并构建预测模型和预后评分体系,为临床血管个性化治疗提供参考。方法:本研究回顾性收集从2018年1月至2022年6月所有在江西省南昌大学第二附属医院行PCI术的AMI患者,随访结局是术后首次发生主要心血管不良事件(major adverse cardiovascular events,MACE)。采用十倍交叉验证的Lasso回归确定纳入模型的变量,构建随机生存森林(random survival forest,RSF)模型和Cox比例风险模型,采用受试者工作特征曲线(receiver operating characteristic,ROC)下面积(area under curve,AUC)和校准曲线评估模型性能。根据RSF模型拟合结果绘制风险计算器。结果:研究最终共纳入3 880例AMI患者,其中术后1年内发生主要心血管不良事件473例(12.2%)。Lasso回归筛选出性别、急性心肌梗死类型、高血压等15个变量。多因素Cox回归结果显示,糖尿病、左室射血分数较低(30%~40%)、血管狭窄程度是术后MACE发生的影响因素。验证集中,RSF和Cox模型的AUC分别为0.774(95%CI=0.761~0.787)和0.597(95%CI=0.581~0.613)。绘制的校准曲线提示,该模型在预测1年MACE风险方面具有较高的准确性,构建的RSF评分最佳截断点(Score=133)也能准确区分MACE累计发病风险(P<0.001)。结论:构建的RSF模型及评分综合上述因素,能有效预测术后MACE发病风险并进行风险分层,帮助临床心血管医生制定个性化治疗方案。 展开更多
关键词 急性心肌梗死 主要心血管不良事件 随机生存森林 COX回归 预后评分
下载PDF
基于随机生存森林算法建立和验证接受抗逆转录病毒治疗后艾滋病相关性死亡预测模型
16
作者 王慧 王威 +2 位作者 夏艳华 张慧 朱有霞 《国际流行病学传染病学杂志》 CAS 2024年第2期84-92,共9页
目的建立并验证接受抗逆转录病毒治疗(antiretroviral therapy,ART)的HIV感染者或AIDS患者(persons living with HIV or AIDS,PLWHA)发生AIDS相关性死亡的预测模型。方法基于2003—2019年中国艾滋病综合防治信息系统中符合条件的PLWHA... 目的建立并验证接受抗逆转录病毒治疗(antiretroviral therapy,ART)的HIV感染者或AIDS患者(persons living with HIV or AIDS,PLWHA)发生AIDS相关性死亡的预测模型。方法基于2003—2019年中国艾滋病综合防治信息系统中符合条件的PLWHA建立回顾性队列,采用随机过采样少数类(random over-sampling minority examples,ROSE)技术和随机生存森林算法建立和验证AIDS相关性死亡的预测模型,通过时间依赖Brier评分和时间依赖ROC曲线下面积对预测模型进行评价。根据训练集预测风险值的三分位数对验证集进行风险分层,通过Kaplan-Meier曲线和log-rank检验比较三组的生存率。结果本研究共纳入360例研究对象,随访时间中位数为36.72(10.62,60.69)个月,120例研究对象发生AIDS相关性死亡。根据候选预测因子的重要性,选择年龄、CD4^(+)T淋巴细胞计数、Hb和HCV感染建立预测模型1;在预测模型1的基础上,剔除变量重要性较低的HCV感染,建立预测模型2。在验证集中,两个预测模型预测1~5年AIDS相关性死亡风险的Brier评分均低于0.15,预测18~42个月AIDS相关性死亡风险的AUC均高于0.70,两者的校准度和区分度均较好。预测模型2的区分度优于预测模型1。基于预测模型2预测的风险值进行风险分层,死亡风险值<2.37为低风险组,2.37~<26.83为中风险组,≥26.83为高风险组,低、中和高风险组间生存率的差异有统计学意义(log-rankP<0.001)。结论本研究建立的AIDS相关性死亡预测模型包含年龄、CD4^(+)T淋巴细胞计数和Hb共3个预测因子,预测1~3年AIDS相关性死亡的校准度和区分度较好,对预测PLWHA个体AIDS相关性死亡风险及早期干预有潜在价值。 展开更多
关键词 获得性免疫缺陷综合征 艾滋病相关性死亡 预测模型 随机生存森林 ROSE技术 抗逆转录病毒治疗
原文传递
随机生存森林:基于机器学习算法的生存分析模型 被引量:7
17
作者 陈哲 许恒敏 +5 位作者 李哲轩 张阳 周彤 游伟程 潘凯枫 李文庆 《中华预防医学杂志》 CAS CSCD 北大核心 2021年第1期104-109,共6页
传统的生存分析方法虽在生物医学领域已有广泛应用,但需满足一些前提假设。随机生存森林方法可克服这一弱点。本文以美国梅奥诊所的肝脏原发性胆汁肝硬化的数据为例,从随机生存森林的原理、建模步骤、实例演示和适用性讨论等方面进行阐... 传统的生存分析方法虽在生物医学领域已有广泛应用,但需满足一些前提假设。随机生存森林方法可克服这一弱点。本文以美国梅奥诊所的肝脏原发性胆汁肝硬化的数据为例,从随机生存森林的原理、建模步骤、实例演示和适用性讨论等方面进行阐述,以期为读者进行生存分析提供新的思路和方法。 展开更多
关键词 模型 统计学 人工智能 随机生存森林
原文传递
条件推断森林在生存分析中的应用 被引量:1
18
作者 刘颖欣 康佩 +1 位作者 许军 安胜利 《南方医科大学学报》 CAS CSCD 北大核心 2020年第4期475-482,共8页
目的探讨条件推断森林在生存分析中的应用与优势。方法通过模拟研究和实例应用比较比例风险模型、加速失效时间模型、随机生存森林、条件推断森林4种方法的预测能力,用Brier score进行评价。结果模拟研究显示两类森林模型比其他2种回归... 目的探讨条件推断森林在生存分析中的应用与优势。方法通过模拟研究和实例应用比较比例风险模型、加速失效时间模型、随机生存森林、条件推断森林4种方法的预测能力,用Brier score进行评价。结果模拟研究显示两类森林模型比其他2种回归模型预测更准确稳定,其中条件推断森林在数据存在多分类变量、共线性、交互作用等情况下预测效果优于其余3种模型,且在大样本、高删失率数据中更容易体现该优势;实例说明条件推断森林预测效果最优。结论条件推断森林可用于生存分析,且当存在多分类变量、共线性、交互作用时,与其他常见生存分析方法相比,具有更高的准确性和稳定性。 展开更多
关键词 条件推断森林 随机生存森林 比例风险模型 加速失效模型 生存分析
下载PDF
预测乳腺癌术后死亡的两种模型建立及其性能和临床应用价值对比
19
作者 丁伟 刘钊 +4 位作者 刘小华 许雪宁 吕帝 陈佳宇 侯先存 《肿瘤综合治疗电子杂志》 2024年第2期117-125,共9页
目的 比较随机生存森林(random survival forest,RSF)模型和Cox回归模型对乳腺癌患者术后死亡风险的预测性能。方法 回顾性分析徐州医科大学附属医院2014年1月至2016年12月收治的482例接受手术治疗的原发性乳腺癌患者的临床资料,按照患... 目的 比较随机生存森林(random survival forest,RSF)模型和Cox回归模型对乳腺癌患者术后死亡风险的预测性能。方法 回顾性分析徐州医科大学附属医院2014年1月至2016年12月收治的482例接受手术治疗的原发性乳腺癌患者的临床资料,按照患者随访期间生存情况,将其分别纳入存活组(n=446)和死亡组(n=36)。比较两组年龄、体重指数(body mass index,BMI)、临床分期、雌激素受体(estrogen receptor,ER)状态等资料,将Cox单因素回归分析中差异有统计学意义的因素分别使用RSF和Cox回归建立预测模型。使用受试者操作特征曲线(receiver operating characteristic curve,ROC曲线)评价两种模型预测乳腺癌患者术后死亡风险的曲线下面积(area under curve,AUC)和效能,并使用Kaplan-Meier曲线评价两种模型指导风险分层的价值,最后根据RSF模型预测结果建立在线动态预后预测分析网站。结果 随访截至2023年11月,所有患者均获得有效随访,中位随访时间93.30个月,随访期间死亡36例。多因素Cox回归显示,术前空腹血糖(fasting blood glucose,FBG)、术前尿酸(uric acid,UA)、N分期和ER表达与乳腺癌患者术后死亡风险均显著相关(均P<0.05)。RSF最优模型包括年龄、N分期、病理分级、术前UA、术前癌胚抗原(carcinoembryonic antigen,CEA)、肿瘤最大径、术前FBG、术前糖类抗原153、放疗和化疗方案这10个变量。RSF模型1、3、5年AUC、敏感度和特异度均高于Cox回归模型,Brier分数均低于Cox模型,整体预测性能显著优于Cox模型(P<0.05)。对患者风险分层后,两种模型低风险组和高风险组生存比较差异均有统计学意义(均P<0.05)。在线动态预后预测分析网站操作方便,临床医生只需填入相关信息,即可直接得到患者预后生存情况。结论 基于RSF和Cox回归建立的模型均能够为乳腺癌患者术后死亡风险的预测提供可靠参考,但RSF模型的预测性能和稳定性略优于Cox模型,结合在线实时动态预测患者总体生存情况和不同时间点的死亡风险情况,具有更高的临床指导意义和价值。 展开更多
关键词 乳腺癌 随机生存森林 COX回归 死亡风险 预测模型
下载PDF
基于决策树集成学习在癌症风险分层中的应用
20
作者 殷清燕 车露美 刘星宇 《计算机与数字工程》 2024年第1期169-173,189,共6页
论文提出了基于决策树集成学习的癌症风险分层方法,并将其应用在TCGA癌症数据集。首先对原始数据进行数据清洗与预处理,构建基于决策树集成学习的生存分析模型;针对每个算法进行贝叶斯超参数优化,获得最优的C-index和time-dependent AU... 论文提出了基于决策树集成学习的癌症风险分层方法,并将其应用在TCGA癌症数据集。首先对原始数据进行数据清洗与预处理,构建基于决策树集成学习的生存分析模型;针对每个算法进行贝叶斯超参数优化,获得最优的C-index和time-dependent AUC性能评价值,结果表明随机生存森林RSF和梯度提升树GBM性能较好。基于RSF和GBM风险评分进行癌症风险分层,在识别高危和低危患者群体方面具有显著作用。 展开更多
关键词 集成学习 随机生存森林 梯度提升树 生存分析 风险分层
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部