期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Borderline-SMOTE算法与Stacking集成学习的前列腺肿瘤风险预测研究
1
作者 熊思伟 刘玉琳 《现代肿瘤医学》 CAS 北大核心 2023年第16期3075-3081,共7页
目的:应用数据挖掘方法,建立高准确率的组合模型,对前列腺肿瘤患者的风险进行预测,为前列腺癌(prostate cancer,PCa)的预防和诊断提供参考。方法:选择在临床医学科学数据中心(301医院)进行前列腺穿刺活检的患者682例,运用互信息作为评... 目的:应用数据挖掘方法,建立高准确率的组合模型,对前列腺肿瘤患者的风险进行预测,为前列腺癌(prostate cancer,PCa)的预防和诊断提供参考。方法:选择在临床医学科学数据中心(301医院)进行前列腺穿刺活检的患者682例,运用互信息作为评价标准筛选出与PCa有关的特征属性;针对机器学习的XgBoost、Logistic回归、Adaboost、K近邻和随机森林算法构建单一模型,应用5折交叉验证算法筛选出预测能力较优的3种模型;使用过采样处理,构建基于Borderline-SMOTE的单一模型及构建基于Borderline-SMOTE的Stacking组合模型并探究不同组合方式的影响;最后选择301医院与芜湖弋矶山医院的37例临床病例作为外部验证集对模型进行检验。结果:通过互信息筛选出19个关键特征属性;在单一模型的研究中发现随机森林模型、XgBoost模型以及AdaBoost模型这3种模型表现较优;而基于Borderline-SMOTE的单一模型使得标签属性趋于平衡,AUC值有大幅提升;构建的3种基于Borderline-SMOTE的Stacking组合模型中以XgBoost、随机森林为初级分类器,AdaBoost为次级分类器的组合模型预测能力最好,其准确率为0.9454,召回率为0.9375,精确度为0.9573,F_(1)分数为0.9470,AUC高达0.9823,并且该组合模型在临床验证集上的预测也有较好效果。结论:Borderline-SMOTE过采样处理不平衡数据集十分有效,相较于单一模型的预测,基于多模型融合的Stacking集成学习方式的PCa风险预测方法有着更高的预测精度和良好的推广性能,更有助于PCa的临床诊断。 展开更多
关键词 前列腺肿瘤 互信息 Borderline-SMOTE Stacking集成学习
下载PDF
基于Wasserstein测度的概率犹豫模糊聚类方法
2
作者 张沙沙 刘小弟 张世涛 《模糊系统与数学》 北大核心 2023年第6期41-54,共14页
研究概率犹豫模糊距离测度及其聚类应用。针对现有概率犹豫模糊距离缺陷,如不满足距离的公理化定义、需对元素个数较少的概率犹豫模糊元进行扩充等,提出一种新的距离测度,应用于概率犹豫模糊信息聚类分析中。首先,考虑到Wasserstein距... 研究概率犹豫模糊距离测度及其聚类应用。针对现有概率犹豫模糊距离缺陷,如不满足距离的公理化定义、需对元素个数较少的概率犹豫模糊元进行扩充等,提出一种新的距离测度,应用于概率犹豫模糊信息聚类分析中。首先,考虑到Wasserstein距离可以度量概率分布之间的距离,将其引入到概率犹豫模糊环境下,定义了新的概率犹豫模糊距离及相似度公式。其次,运用新的相似度,提出一种改进的概率犹豫模糊聚类算法——概率犹豫模糊编网法,以解决现有概率犹豫模糊信息聚类结果不够精细的问题。最后,通过对钢铁企业聚类的实例验证所提方法的有效性和可行性。 展开更多
关键词 概率犹豫模糊集 Wasserstein距离 相似度 编网聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部