目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LA...目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LASSO)进行特征变量筛选。按7∶3随机分组,在训练集中采用得到的最优变量构建梯度提升(Catboost)、支持向量机(SVM)、Logistic回归(LR)预测模型,在测试集中进行验证。采用χ2检验比较3种模型的准确率,进一步通过净重新分类指数(NRI)、综合判别改善指数(IDI)、ROC曲线下面积(AUC)评估模型的预测性能,并对纳入因素进行重要性评估。结果:LASSO回归得到性别、年龄、腰围(WC)、尿素(BU)、总蛋白(TP)、肾小球滤过率(GFR)、甘油三酯葡萄糖指数(TyG)等7项特征变量,基于该7项特征变量构建的SVM、Catboost模型的准确率优于LR模型(P<0.05)。SVM、Catboost、LR模型测试集的AUC(95%CI)分别为0.760(0.736~0.784)、0.766(0.742~0.790)和0.676(0.649~0.703)。进一步评估显示SVM模型预测效果最优,Catboost次之,LR最差(SVM vs Catboost/LR:NRI>0,IDI>0,P<0.05;Catboost vs LR:NRI>0,IDI>0,P<0.001)。特征重要性评估显示年龄的重要性最大,其次是WC。结论:基于性别、年龄、WC、BU、TP、GFR、TyG构建的SVM模型具备较好的预测价值。该预测模型的建立可对健康体检人群进行危险分层,有助于尽早发现结直肠癌早期病变。展开更多
利用体检数据预测肌少症的患病风险,探索预测肌少症的重要因素,以实现肌少症的早期诊断.基于2019年上海某医院的5641名人员的体检数据,利用Wilcoxon秩和检验和卡方检验找出差异显著的特征,使用8种机器学习方法对是否患有肌少症进行预测...利用体检数据预测肌少症的患病风险,探索预测肌少症的重要因素,以实现肌少症的早期诊断.基于2019年上海某医院的5641名人员的体检数据,利用Wilcoxon秩和检验和卡方检验找出差异显著的特征,使用8种机器学习方法对是否患有肌少症进行预测.采用受试者操作曲线下面积(AUC)评价模型预测效果,建立较优的肌少症预测模型,并利用特征评分寻找预测肌少症的重要因素.LightGBM(Light-gradient boosting machine)、随机森林和逻辑回归预测效果较优,测试集AUC值达到0.93以上.模型确定了年龄、体质量、身高、身体质量指数(body mass index,BMI)、腰围、臀围、舒张压以及平均红细胞血红蛋白量、高密度脂蛋白、平均红细胞体积、红细胞、甘油三酯是预测肌少症的重要因素,体格检查、血检指标、血常规、肝肾功能、生活习惯和一般信息是预测肌少症重要体检项目.文章建立了有效的肌少症患病风险预测模型,确定了预测肌少症的重要因素和体检项目,在一定程度上有助于肌少症患者的管理.展开更多
文摘目的:探讨结直肠息肉的影响因素并构建早期风险预测模型。方法:收集2016年11月至2021年10月于郑州大学第一附属医院健康管理中心同时进行结肠镜检查和血常规、生化指标检查的4997名受检者资料,包括22项指标,使用最小绝对收缩选择算子(LASSO)进行特征变量筛选。按7∶3随机分组,在训练集中采用得到的最优变量构建梯度提升(Catboost)、支持向量机(SVM)、Logistic回归(LR)预测模型,在测试集中进行验证。采用χ2检验比较3种模型的准确率,进一步通过净重新分类指数(NRI)、综合判别改善指数(IDI)、ROC曲线下面积(AUC)评估模型的预测性能,并对纳入因素进行重要性评估。结果:LASSO回归得到性别、年龄、腰围(WC)、尿素(BU)、总蛋白(TP)、肾小球滤过率(GFR)、甘油三酯葡萄糖指数(TyG)等7项特征变量,基于该7项特征变量构建的SVM、Catboost模型的准确率优于LR模型(P<0.05)。SVM、Catboost、LR模型测试集的AUC(95%CI)分别为0.760(0.736~0.784)、0.766(0.742~0.790)和0.676(0.649~0.703)。进一步评估显示SVM模型预测效果最优,Catboost次之,LR最差(SVM vs Catboost/LR:NRI>0,IDI>0,P<0.05;Catboost vs LR:NRI>0,IDI>0,P<0.001)。特征重要性评估显示年龄的重要性最大,其次是WC。结论:基于性别、年龄、WC、BU、TP、GFR、TyG构建的SVM模型具备较好的预测价值。该预测模型的建立可对健康体检人群进行危险分层,有助于尽早发现结直肠癌早期病变。
文摘利用体检数据预测肌少症的患病风险,探索预测肌少症的重要因素,以实现肌少症的早期诊断.基于2019年上海某医院的5641名人员的体检数据,利用Wilcoxon秩和检验和卡方检验找出差异显著的特征,使用8种机器学习方法对是否患有肌少症进行预测.采用受试者操作曲线下面积(AUC)评价模型预测效果,建立较优的肌少症预测模型,并利用特征评分寻找预测肌少症的重要因素.LightGBM(Light-gradient boosting machine)、随机森林和逻辑回归预测效果较优,测试集AUC值达到0.93以上.模型确定了年龄、体质量、身高、身体质量指数(body mass index,BMI)、腰围、臀围、舒张压以及平均红细胞血红蛋白量、高密度脂蛋白、平均红细胞体积、红细胞、甘油三酯是预测肌少症的重要因素,体格检查、血检指标、血常规、肝肾功能、生活习惯和一般信息是预测肌少症重要体检项目.文章建立了有效的肌少症患病风险预测模型,确定了预测肌少症的重要因素和体检项目,在一定程度上有助于肌少症患者的管理.