XGBoost算法在糖尿病血糖预测中的应用被引量：9

Application of XGBoost algorithm in diabetic blood glucose prediction

下载PDF

导出

摘要糖尿病已经成为威胁人类健康的慢性病之一.实现对糖尿病的早期预测,有助于辅助医疗决策.针对糖尿病数据普遍存在的维度过高,缺失值较多等特点,为了提高预测精度,从集成学习入手,提出一种基于XGBoost算法的糖尿病预测模型.该模型以CART回归树作为基学习器,利用收集到的真实数据对模型进行训练和测试,并调整XGBoost的主要参数,最终实现了血糖值的回归预测.实验结果表明,该模型平均绝对百分比误差下降到8.57%,比本文对比的基于SVM、随机森林的预测模型精度更高,且运行速度快,稳定性强. Diabetes has become one of the chronic diseases threatening human health.The realization of early prediction of diabetes is helpful to assist medical decision-making.In order to improve the prediction accuracy,where are generally many feature dimensions,more missing values,a new diabetes prediction model based on XGBoost algorithm from ensemble learning is proposed in this paper.The model adopts CART regression tree as the base learner,uses the collected real data to train and test the model,and adjusts the main parameters of XGBoost.Finally,the regression prediction of blood glucose was achieved.Through the experimental results,the MAPE of the XGBoost algorithm drops to 8.57%,which is more accurate than the predicted value based on SVM,Random forest.

作者曲文龙李一漪周磊 QU Wen-long;LI Yi-yi;ZHOU Lei(College of Information Engineering,Hebei GEO University,Shijiazhuang 050031,China;College of Materials and Engineering,Southwest Petroleum University,Chengdu 610500,China)

机构地区河北地质大学信息工程学院西南石油大学材料科学与工程学院

出处《吉林师范大学学报（自然科学版）》 2019年第4期118-125,共8页 Journal of Jilin Normal University:Natural Science Edition

基金河北省自然科学基金项目(F2016403055) 河北省重点研发计划项目-高新技术产业技术开发专项项目(18212005)。

关键词糖尿病预测 XGBoost算法集成学习回归模型 diabetes prediction XGBoost algorithm ensemble learning regression model

分类号 TP399 [自动化与计算机技术—计算机应用技术] R587.1 [医药卫生—内分泌]

引文网络
相关文献

参考文献4

1叶倩怡,饶泓,姬名书.基于Xgboost的商业销售预测[J].南昌大学学报（理科版）,2017,41(3):275-281. 被引量：39
2何正义,曾宪华,曲省卫,吴治龙.基于集成深度学习的时间序列预测模型[J].山东大学学报（工学版）,2016,46(6):40-47. 被引量：11
3李凯,黄厚宽.小规模数据集的神经网络集成算法研究[J].计算机研究与发展,2006,43(7):1161-1166. 被引量：10
4陈松景,罗森林,潘丽敏,张铁梅,韩龙飞,赵海秀.2型糖尿病患病因素对血糖影响的定量分析[J].北京理工大学学报,2014,34(2):201-206. 被引量：5

二级参考文献31

1张玉瑞,陈剑波.基于RBF神经网络的时间序列预测[J].计算机工程与应用,2005,41(11):74-76. 被引量：38
2王恒,罗森林,张铁梅,韩怡文.2型糖尿病发病危险因素及其特征提取技术[J].计算机工程,2007,33(9):103-105. 被引量：6
3Thomas G. Dietterich. Machine learning research: Four current directions[J]. AI Magazine, 1997, 18(4):97-136
4L. Breiman. Bagging predictors [J]. Machine Learning, 1996,24(2) : 123-140
5Lars Kai Hansen, Peter Salamon. Neural network ensembles [J].IEEE Trans. Pattern Analysis and Machine Intelligence, 1990,12(10) : 993-1001
6Anders Krogh, Jesper Vedelsby. Neural network ensembles, cross validation, and active learning [G]. In: G. Tesauro, D. S.Touretzky, T. K. Leen, eds. Advances in Neural Information Processing Systems 7. Cambridge MA: MIT Press, 1995. 231-238
7David W. Opitz, Jude W. Shavlik. Actively searching for an effective neural-network ensemble [J]. Connection Science,1996, 8(3): 337-353
8B. Rosen. Ensemble learning using decorated neural networks[J]. Connection Science, 1996, 8(3): 373-384
9Derek Partridge, W. B. Yates. Engineering multiversion neuralnet systems[J]. Neural Computation, 1996, 8(4) : 869-893
10Zhi-Hua Zhou, Jianxin Wu, Wei Tang. Ensembling neural networks: Many could be better than all [J]. Artificial Intelligence, 2002, 137(1/2): 239-263

共引文献61

1柴晨阳,孙星明,吴志斌,智云生.基于神经网络集成的入侵检测研究[J].计算机应用,2007,27(6):1363-1364. 被引量：3
2陈如清,俞金寿.基于改进神经网络集成算法的软测量建模[J].仪器仪表学报,2008,29(6):1240-1244. 被引量：8
3徐荣武,何琳,章林柯,贲可荣.小样本条件下潜艇机械噪声源的识别[J].机械工程学报,2008,44(7):151-160. 被引量：2
4於时才,陈涓,马宁.一种提高神经网络集成系统泛化能力的方法[J].微电子学与计算机,2009,26(4):105-107. 被引量：2
5李文斌,刘椿年,钟宁.基于两阶段集成学习的分类器集成[J].北京工业大学学报,2010,36(3):410-419. 被引量：4
6朱群雄,赵乃伟,徐圆.一种新的基于误差矢量化的选择性神经网络集成方法及其在高密度聚乙烯串级反应过程中的应用(英文)[J].Chinese Journal of Chemical Engineering,2012,20(6):1142-1147.
7齐甜方,蒋洪迅,石晓文.面向多源数据沈阳市PM2.5浓度预测研究及实证分析[J].系统工程,2018,36(5):104-115. 被引量：7
8陈曦,王建东,陈海燕.基于观察学习的机场噪声监测点关联预测研究[J].计算机工程与科学,2015,37(2):335-341. 被引量：2
9陈云,石松,潘彦,俞立.基于SVM混合集成的信用风险评估模型[J].计算机工程与应用,2016,52(4):115-120. 被引量：27
10蒋晋文,刘伟光.XGBoost算法在制造业质量预测中的应用[J].智能计算机与应用,2017,7(6):58-60. 被引量：28

同被引文献113

1李未,郎波.一种非结构化数据库的四面体数据模型[J].中国科学：信息科学,2010,40(8):1039-1053. 被引量：9
2张德政,庄洪波.基于领域本体网络模型的知识获取技术[J].计算机工程,2007,33(7):190-191. 被引量：16
3黄如花.数字信息资源管理的重要工具——分类法在构建元数据框架体系中的应用调查及建议[J].情报科学,2007,25(11):1601-1608. 被引量：5
4刘润达,彭洁,涂勇.一种多维关键词与分类关联的科学数据资源分类导航平台构建方案[J].现代图书情报技术,2010(9):74-78. 被引量：6
5刘润达,孙九林,廖顺宝.科学数据共享中数据授权问题初探[J].情报杂志,2010,29(12):15-18. 被引量：33
6方文涛,陈文虎.食管癌手术治疗原则和淋巴结清扫[J].中国癌症杂志,2011,21(7):522-527. 被引量：45
7张新星,顾文婧,陈正荣,严永东,王宇清,朱灿红,王美娟,黄莉,朱宏,季伟.2006—2015年苏州地区呼吸道感染住院儿童甲型流感病毒感染流行特征分析[J].中华实验和临床病毒学杂志,2018,32(6):607-610. 被引量：10
8王振飞,陈金磊,郑志蕴,刘冰.面向心血管疾病的自适应模块化神经网络预测模型[J].小型微型计算机系统,2019,40(1):232-235. 被引量：9
9郑荣寿,孙可欣,张思维,曾红梅,邹小农,陈茹,顾秀瑛,魏文强,赫捷.2015年中国恶性肿瘤流行情况分析[J].中华肿瘤杂志,2019,41(1):19-28. 被引量：3276
10秦强,谢正德,申昆玲.美国感染病协会关于季节性流感诊断、治疗、药物预防和机构内流感暴发应对措施2018指南更新儿童相关内容解读[J].中华实用儿科临床杂志,2019,34(2):87-90. 被引量：16

引证文献9

1张蕾,田利远,李芹,李清涛,张曼,王亚坤.儿童甲型流行性感冒并发危重症肺炎的个体化诊断预测模型构建及危险因素分析[J].河北医科大学学报,2021,42(3):314-319. 被引量：6
2叶桦,何黎,胡远樟,温川飙,胡绿慧.基于卷积神经网络的2型糖尿病证候分布演化规律研究[J].时珍国医国药,2021,32(6):1522-1524. 被引量：2
3李波.应用计算机技术实现临床医学信息分析的方法[J].信息技术,2021,45(12):118-123.
4李孟祥,程维刚,陈攀,冯笑山,高社干,齐义军.食管鳞癌淋巴结转移关键基因鉴定及预后分析[J].湖南师范大学自然科学学报,2021,44(6):92-100. 被引量：1
5孙斌,储芳芳,陈小惠.基于贝叶斯优化XGBoost的无创血压预测方法[J].电子测量技术,2022,45(7):68-74. 被引量：14
6王鑫,廖彬,李敏,孙瑞娜.融合LightGBM与SHAP的糖尿病预测及其特征分析方法[J].小型微型计算机系统,2022,43(9):1877-1885. 被引量：11
7黄敏,郎许锋,周作建,李红岩,万泽宇,王锐,程俊,朱金阳,何佳怡,郑永明,胡孔法.基于TPE_XGBoost的冠心病风险评估与致病因素研究[J].软件导刊,2023,22(5):42-49.
8潘凌凌,胡哲畅,李强,韩文娟,胡伟.基于机器学习算法的急诊创伤患者用血预测模型的构建[J].中华急诊医学杂志,2023,32(5):606-611. 被引量：1
9顾子慧,刘桂锋,刘琼.新冠肺炎科学数据集的元数据框架构建及可视化研究——以Re3data.org为例[J].情报科学,2023,41(4):117-126.

二级引证文献35

1胡绿慧,李梓菡,温川飙,廖辛.基于多标签分类的T2DM证候预测模型研究[J].世界科学技术-中医药现代化,2023,25(3):936-943.
2李文杰,王占刚.基于混合策略改进的LightGBM土壤污染预测模型[J].电子测量技术,2023,46(16):10-15.
3杨艳茹.磷酸奥司他韦联合小儿豉翘清热颗粒治疗甲型流行性感冒的临床效果研究[J].中外医疗,2022,41(4):102-105. 被引量：6
4薛姗,唐铎,赵子杰,洪启浩,王谦,刘紫佳,周志祥.长链非编码RNA LINC00885在人食管癌细胞中的作用研究[J].生物技术进展,2022,12(3):419-426. 被引量：2
5王向阳,吕敏.血清肺表面活性蛋白D、肿瘤坏死因子-α表达与甲型流感病毒性肺炎患儿病情及预后的关系[J].中国临床医生杂志,2022,50(7):858-861. 被引量：4
6张科,张春晓.基于深度残差网络的儿科肺炎辅助诊断算法[J].中国医疗设备,2022,37(9):42-46.
7宋亚娣,颜维孝.复合导入治疗仪联合降阶梯法对重症肺炎患儿的预后研究[J].中外女性健康研究,2022(18):46-48.
8梁玉真,张仕海,汝承印,朱冶诚.海上平台电气温度监控系统及预测模型研究[J].电子测量技术,2022,45(22):162-169.
9李佳思.基于机器学习的糖尿病预测及SHAP特征分析[J].智能计算机与应用,2023,13(1):153-157. 被引量：4
10李姝彤,李伟,高尧,杨明,丁健刚.基于机器学习XGBoost的机制砂细粉含量预测[J].计算机系统应用,2023,32(3):256-264.

1冯兴,林丹丹,李爱巧,王涛,王凯.基于指数平滑法对羊布鲁氏菌病的预测分析[J].家畜生态学报,2020,41(3):67-70.
2郎紫汝.控制权配置与企业创新绩效[J].知识经济,2020(3):74-75.
3张好勇,张东亮,赵雨,刘景宇,王正.基于PCA和GA算法优化最小二乘支持向量机的开关柜温度预测[J].电气应用,2020,39(2):59-63. 被引量：2
4史国荣,戴洪德,戴邵武,陈强强.基于长短期记忆网络的时间序列预测研究[J].仪表技术,2020(2):24-26. 被引量：2
5梁荣,王洪涛,吴奎华,孙伟,付春梅,张晓磊.基于神经网络和ARIMA模型的冷热电短期负荷预测[J].电力系统及其自动化学报,2020,32(3):52-58. 被引量：32
6陈碧毅,黄玲,王昌栋,景丽萍.融合显式反馈与隐式反馈的协同过滤推荐算法[J].软件学报,2020,31(3):794-805. 被引量：24
7张立,王腾军,刘帅令,方珂.基于CPSO-BP神经网络的PM2.5浓度预测模型[J].甘肃科学学报,2020,32(2):47-50. 被引量：5
8易灵芝,常峰铭,龙谷宗,梁湘湘,马文斌.基于进化深度学习短期负荷预测的应用研究[J].电力系统及其自动化学报,2020,32(3):1-6. 被引量：17
9宋宣毅,刘月田,马晶,王俊强,孔祥明,任兴南.基于灰狼算法优化的支持向量机产能预测[J].岩性油气藏,2020,32(2):134-140. 被引量：26
10牛鹏飞,周爱红.基于PCA和BP神经网络的中南公路岩质边坡稳定性预测[J].防灾科技学院学报,2020,22(1):10-16. 被引量：5

吉林师范大学学报（自然科学版）

2019年第4期

浏览历史

内容加载中请稍等...

XGBoost算法在糖尿病血糖预测中的应用被引量：9

参考文献4

二级参考文献31

共引文献61

同被引文献113

引证文献9

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

XGBoost算法在糖尿病血糖预测中的应用 被引量：9

参考文献4

二级参考文献31

共引文献61

同被引文献113

引证文献9

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

XGBoost算法在糖尿病血糖预测中的应用被引量：9