-
题名2型糖尿病风险预测模型性能比较研究
被引量:1
- 1
-
-
作者
郭金旦
高艳艳
高怀林
陈禹保
-
机构
中国医学科学院医学实验动物研究所、国家人类疾病动物模型资源库国家卫生健康委员会人类疾病比较医学重点实验室
河北省唐山开滦医疗健康集团马家沟医院
河北以岭医院糖尿病研究所
-
出处
《中国生物工程杂志》
CAS
CSCD
北大核心
2023年第11期35-42,共8页
-
基金
京津冀基础研究合作重大项目(19JCZDJC64700(Z)
河北省自然科学基金(H2019106062)资助项目。
-
文摘
目的:探讨5种常见机器学习算法在2型糖尿病风险预测模型构建中的预测性能差异与应用价值。方法:利用Pima Indians等公共糖尿病数据集,对Logistic回归(LR)、支持向量机(SVM)、决策树(DT)、朴素贝叶斯(NB)和k最近邻域法(KNN)5种常见算法分别建模,设置不同训练集比例和随机重复抽样,以准确性、稳定性作为主要评判标准对不同模型进行比较研究。结果:对于所有模型,训练集比例在0.8~0.85时预测效果最佳,并且能够容忍一定的缺失值,训练集的随机抽样也会影响预测效果,不同预测模型的预测效果存在明显区别,LR、SVM和NB方法预测效果较好。结论:LR方法整体效果最好,研究结果可为临床2型糖尿病预测模型评估和核心算法的选择提供参考。
-
关键词
2型糖尿病
预测模型
性能比较
-
Keywords
Type 2 diabetes mellitus
Prediction model
Performance comparison
-
分类号
Q141
[生物学—生态学]
-