期刊文献+

基于迭代随机森林算法的糖尿病预测 被引量:13

Diabetes prediction based on iterative random forest algorithm
下载PDF
导出
摘要 针对印第安皮玛族成年女性糖尿病数据集进行分类。将迭代随机森林与机器学习方法如随机森林、K最近邻、基于不同核函数的支持向量机、人工神经网络、Logistic回归、梯度提升机、决策树分类等作比较。分析了分类识别精度、查准率、查全率、度量、ROC曲线和AUC值等6个指标。通过实验发现,与上述其它7种分类算法相比,针对该数据集,迭代随机森林在这些性能指标上的表现是最优的。 The diabetes data sets from adult female Pima Indians are classified first. The iterative random forest algorithm is compared with some machine learning methods such as random forest, K-nearest neighbor, support vector machine based on different kernel functions, artificial neural network, Logistic regression, gradient boosting machine, and decision tree classification. We analyze six indicators like identification accuracy,check precision, recall, F1 measurement, ROC curve and AUC value. Experiments indicate that for the classification algorithms, the iterative random forest method is optimal.
作者 刘文博 梁盛楠 秦喜文 董小刚 王纯杰 LIU Wenbo;LIANG Shengnan;QIN Xiwen;DONG Xiaogang;WANG Chunjie(School of Mathematics and Statistics,Qiannan Normal Colleage of Nationlaities,Duyun 558000,China;School of Mathematics and Statistics,Changchun University of Technology,Changchun 130012,China)
出处 《长春工业大学学报》 CAS 2019年第6期604-611,共8页 Journal of Changchun University of Technology
基金 贵州省教育厅青年科技人才成长项目(黔教合KY字[2019]200) 黔南师范学院高层次人才专项项目(qnsyrc201809)
关键词 迭代随机森林 糖尿病预测 性能度量 分类 iterative random forest diabetes prediction performance measurement classification
  • 相关文献

参考文献1

二级参考文献4

共引文献2

同被引文献47

引证文献13

二级引证文献71

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部