背景前列腺癌是男性泌尿生殖系统最常见的恶性肿瘤之一,其与前列腺增生之间的快速鉴别是临床面临的难题之一,需要可靠方法进行分类预测。目的基于XGBoost算法构建前列腺癌与前列腺增生的分类预测模型,识别癌症风险因素并分析其在早期诊...背景前列腺癌是男性泌尿生殖系统最常见的恶性肿瘤之一,其与前列腺增生之间的快速鉴别是临床面临的难题之一,需要可靠方法进行分类预测。目的基于XGBoost算法构建前列腺癌与前列腺增生的分类预测模型,识别癌症风险因素并分析其在早期诊断中的应用价值。方法于"前列腺癌数据集"(2019年由解放军总医院国家临床医学科学数据中心,国家人口与健康科学数据共享平台提供)中获取前列腺癌与前列腺增生患者的临床数据,在数据预处理基础上按照7∶3划分训练集和测试集;应用XGBoost算法构建前列腺癌与前列腺增生的分类模型;基于训练集确定模型参数,并在测试集上完成模型的有效性验证,利用SHAP方法分析模型特征的临床意义。结果共纳入前列腺癌患者1224例、前列腺增生患者1255例,平均年龄分别为65.86岁、67.70岁;选取年龄、体质量指数、前列腺特异性抗原(prostate specific antigen,PSA)系列指标及其他生化检验指标共23个特征构建分类模型。模型对前列腺癌预测的曲线下面积、准确率、召回率、精确率和F1值分别为0.81、0.74、0.70、0.72、0.74;游离PSA/总PSA、总PSA、无机磷、游离PSA是前列腺早期诊断中最重要的4个指标;SHAP分析结果表明游离PSA/总PSA≤0.132与无机磷≥1.09 mmol/L是前列腺癌诊断中需要被关注的分界值。结论应用XGBoost算法可构建前列腺癌预测的有效分类模型,利用SHAP分析获取的特征指标分界值可为前列腺癌的临床早期筛查提供有益参考。展开更多
目的使用XGBoost算法建立阻塞性睡眠呼吸暂停(OSA)的机器学习预测模型。方法纳入680例于首都医科大学附属北京同仁医院行整夜多道睡眠图监测患者,收集其性别、年龄、颈围以及体质量指数(body mass index,BMI)、夜间最低血氧饱和度、夜...目的使用XGBoost算法建立阻塞性睡眠呼吸暂停(OSA)的机器学习预测模型。方法纳入680例于首都医科大学附属北京同仁医院行整夜多道睡眠图监测患者,收集其性别、年龄、颈围以及体质量指数(body mass index,BMI)、夜间最低血氧饱和度、夜间平均血氧饱和度、3%氧减指数等信息,作为机器学习的输入特征,以XGBoost算法建立OSA的自动预测模型,并与其他几种常用的机器学习算法(如支持向量机、随机森林、决策树等)建立的模型结果进行对比。结果在四分类(正常受试者,轻度、中度、重度OSA)中,XGBoost分类器在所有算法中表现最好,综合分类准确率为93.4%,F1值得分分别为94.7%、78.7%、86.7%、98.1%,ROC曲线下面积(AUC)分别为98.0%、85.0%、92.0%和98.0%。结论基于XGBoost算法成功建立成人OSA预测模型,可用于临床OSA的诊断与筛查。展开更多
文摘背景前列腺癌是男性泌尿生殖系统最常见的恶性肿瘤之一,其与前列腺增生之间的快速鉴别是临床面临的难题之一,需要可靠方法进行分类预测。目的基于XGBoost算法构建前列腺癌与前列腺增生的分类预测模型,识别癌症风险因素并分析其在早期诊断中的应用价值。方法于"前列腺癌数据集"(2019年由解放军总医院国家临床医学科学数据中心,国家人口与健康科学数据共享平台提供)中获取前列腺癌与前列腺增生患者的临床数据,在数据预处理基础上按照7∶3划分训练集和测试集;应用XGBoost算法构建前列腺癌与前列腺增生的分类模型;基于训练集确定模型参数,并在测试集上完成模型的有效性验证,利用SHAP方法分析模型特征的临床意义。结果共纳入前列腺癌患者1224例、前列腺增生患者1255例,平均年龄分别为65.86岁、67.70岁;选取年龄、体质量指数、前列腺特异性抗原(prostate specific antigen,PSA)系列指标及其他生化检验指标共23个特征构建分类模型。模型对前列腺癌预测的曲线下面积、准确率、召回率、精确率和F1值分别为0.81、0.74、0.70、0.72、0.74;游离PSA/总PSA、总PSA、无机磷、游离PSA是前列腺早期诊断中最重要的4个指标;SHAP分析结果表明游离PSA/总PSA≤0.132与无机磷≥1.09 mmol/L是前列腺癌诊断中需要被关注的分界值。结论应用XGBoost算法可构建前列腺癌预测的有效分类模型,利用SHAP分析获取的特征指标分界值可为前列腺癌的临床早期筛查提供有益参考。
文摘目的使用XGBoost算法建立阻塞性睡眠呼吸暂停(OSA)的机器学习预测模型。方法纳入680例于首都医科大学附属北京同仁医院行整夜多道睡眠图监测患者,收集其性别、年龄、颈围以及体质量指数(body mass index,BMI)、夜间最低血氧饱和度、夜间平均血氧饱和度、3%氧减指数等信息,作为机器学习的输入特征,以XGBoost算法建立OSA的自动预测模型,并与其他几种常用的机器学习算法(如支持向量机、随机森林、决策树等)建立的模型结果进行对比。结果在四分类(正常受试者,轻度、中度、重度OSA)中,XGBoost分类器在所有算法中表现最好,综合分类准确率为93.4%,F1值得分分别为94.7%、78.7%、86.7%、98.1%,ROC曲线下面积(AUC)分别为98.0%、85.0%、92.0%和98.0%。结论基于XGBoost算法成功建立成人OSA预测模型,可用于临床OSA的诊断与筛查。