期刊文献+
共找到157篇文章
< 1 2 8 >
每页显示 20 50 100
基于 SMOTE 算法的老年肌少症患者跌倒风险预测模型的建立
1
作者 孙敏 王娅 +2 位作者 丁佐玲 钱维群 孟雅 《护理管理杂志》 CSCD 2024年第10期899-903,共5页
目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患... 目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患者跌倒的危险因素,应用SMOTE算法构建老年肌少症患者跌倒的预测模型,并对预测模型的预测效能进行分析。结果256例老年肌少症患者中65例发生跌倒,跌倒发生率为25.39%;年龄≥70岁、严重肌少症期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,原始预测模型Logit(P 1)=1.057×年龄+0.808×肌少症临床分期+0.901×睡眠障碍+0.835×糖尿病+0.828×视力障碍+1.221×直立性低血压-2.535,基于SMOTE算法的预测模型Logit(P 2)=1.043×年龄+0.879×肌少症临床分期+0.962×睡眠障碍+0.717×糖尿病+0.810×视力障碍+1.314×直立性低血压-1.445,ROC曲线显示,P 2模型ROC曲线下面积为0.952(95%CI:0.920,0.972),显著高于P 1模型的ROC曲线下面积0.761(95%CI:0.693,0.828),基于SMOTE算法预测模型的校准曲线显示预测值和实际值一致性良好。结论年龄、肌少症临床分期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,基于SMOTE算法的预测模型具有较好的预测效能,有助于临床护理人员识别老年肌少症跌倒高危人群。 展开更多
关键词 老年 肌少症 跌倒 护理 风险 smote算法 预测模型
下载PDF
SMOTE数据预处理算法在砂型铸造复杂铸件缺陷预测中的应用
2
作者 潘徐政 刘迎辉 +5 位作者 李文 计效园 殷亚军 吴来发 解明国 周建新 《铸造》 CAS 2024年第10期1473-1479,共7页
针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预... 针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预处理算法,探究其在砂型铸造复杂铸件缺陷预测中的应用。根据采集到的复杂铸件不平衡数据集的特点,基于SMOTE数据预处理算法,科学扩充了不平衡数据集,创建了可用于训练复杂铸件缺陷预测模型的平衡数据集,数据预处理前后的模型预测准确率从86.50%提高至97.91%。 展开更多
关键词 转向桥铸件 砂型铸造 不平衡数据集 数据预处理 smote算法 缺陷预测
下载PDF
基于SMOTE算法和机器学习模型建立原发性肝癌术后的预后预测模型
3
作者 潘比 余靖华 +2 位作者 黄译贤 伍亚舟 李芳 《陆军军医大学学报》 CAS CSCD 北大核心 2024年第19期2236-2240,共5页
目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End ... 目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库中4297例患者进行回顾性队列研究,通过独热编码和平均值插补法进行数据预处理,利用SMOTE算法解决数据类别不平衡问题,将临床变量纳入机器学习模型,基于决策树(decision tree,DT)、随机森林(random forest,RF)、梯度提升决策树(gradient boosting decision tree,GBDT)、极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)方法构建预后预测模型(SMOTE+DT/RF/GBDT/XGBoost),通过比较多种模型的性能,筛选出最佳的预测模型。结果组合模型SMOTE+RF展示出最优的预测性能,受试者工作特征曲线(receiver operating characteristic curve,ROC)下的面积(area under the curve,AUC)、准确率和精确率均高于其他模型,分别为0.895、0.811、0.806。结论基于SMOTE+RF算法的原发性肝癌的预后预测模型可有效预测原发性肝癌患者的生存结局。 展开更多
关键词 原发性肝癌 少数类过采样技术算法 机器学习 预测模型
下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
4
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
下载PDF
基于SVM-SMOTE算法的一维卷积神经网络电力系统暂态稳定评估模型
5
作者 袁梦薇 何宇 王旭 《智能计算机与应用》 2024年第7期50-56,共7页
为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,... 为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,并采用一维卷积神经网络(1D-CNN)捕捉输入特征的时序信息;考虑数据集样本不平衡带来的预测精度下降问题,采用SVM-SMOTE算法对样本进行均衡化。算例仿真结果表明,本文所提出的模型实现了端到端的时序特征提取和暂态稳定评估,可满足在线评估准确性、快速性和可靠性的要求,且有效解决了不平衡数据集中失稳样本漏判率高的问题。 展开更多
关键词 电力系统 暂态稳定评估 SVM-smote算法 一维卷积神经网络
下载PDF
基于改进SMOTE的不平衡数据分类算法
6
作者 马宝霖 胡茜 《长春工业大学学报》 CAS 2024年第3期259-264,共6页
SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插... SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插值过程中采用LMKNN方法。分别将该算法与SMOTE、KNSMOTE应用至实际数据中,使用SVM分类算法分类并进行性能对比。结果表明,对Abalone、Ecoli等不平衡数据集分类时,文中使用的算法分类效果最佳,验证了该算法的有效性。 展开更多
关键词 不平衡数据 smote算法 SVM算法
下载PDF
基于SMOTE-XGBoost算法的混凝土强度预测
7
作者 薛飞 《混凝土与水泥制品》 2024年第8期32-36,共5页
基于244组混凝土配合比构建了数据库,采用SMOTE-XGBoost算法对混凝土28 d抗压强度进行了预测。首先通过SMOTE算法对划分的训练集进行平衡处理;然后对比了SMOTE算法平衡前后XGBoost与常用混凝土强度预测模型的评估结果;最后进行了SMOTE-X... 基于244组混凝土配合比构建了数据库,采用SMOTE-XGBoost算法对混凝土28 d抗压强度进行了预测。首先通过SMOTE算法对划分的训练集进行平衡处理;然后对比了SMOTE算法平衡前后XGBoost与常用混凝土强度预测模型的评估结果;最后进行了SMOTE-XGBoost算法的实际工程验证。结果表明:SMOTE-XGBoost算法有效解决了数据不平衡问题,提高了预测模型的精度;相较于其他机器学习模型,SMOTE-XGBoost算法的预测结果较好;应用SMOTE-XGBoost算法对无岳高速WYTJ-07标段工程自制花岗岩混凝土的28 d抗压强度进行了预测,预测结果误差较小,该算法在工程混凝土强度预测方面具有广泛的应用前景。 展开更多
关键词 混凝土28 d抗压强度 机器学习 smote-XGBoost算法 预测
下载PDF
基于SMOTE-SSA-CNN的开关柜故障诊断方法
8
作者 张玮 《电气传动》 2024年第10期83-89,共7页
开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对... 开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对原始数据集进行样本扩充,解决原始数据集中正负样本严重失衡的问题;然后引入麻雀搜索算法(SSA)对卷积神经网络(CNN)的卷积核大小与数量、全连接层神经元数量、学习率等超参数进行优化,提高模型故障诊断结果的准确率;最后,通过算例分析对建立的SMOTE-SSA-CNN模型性能进行评估,验证了所提方法对开关柜故障诊断的有效性,且与传统故障诊断方法相比,所提方法的收敛性较好,精度较高。 展开更多
关键词 开关柜 多源监测数据 合成少数类样本过采样技术算法 麻雀搜索算法 卷积神经网络
下载PDF
基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎的风险预警模型
9
作者 郑媛 邓维维 +2 位作者 刘芮菡 邓东玲 龚元 《全科护理》 2024年第16期3010-3014,共5页
目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回... 目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回归分析法筛选独立风险因素,构建预测模型,同时基于SMOTE算法改进数据集,构建改进数据集的预警模型并对比验证模型的预测效能。结果:年龄≥60岁、糖尿病史、CRP≥150 mg/dL、NLR≥15、血糖≥9 mmol/L、术前白蛋白≤32 g/L为肛周脓肿病人发生NF的独立风险因素(P<0.05)。Logistic预警模型P1的受试者工作特征(ROC)曲线下面积为0.825,SMOTE算法预警模型P2的ROC曲线下面积为0.939,两者均具有较高的预测精准度。结论:SMOTE算法预警模型对发生NF的概率计算精准,有利于提前干预,为病人的预后做好充分保障。 展开更多
关键词 肛周脓肿 坏死性筋膜炎 smote算法 LOGISTIC分析 预警模型
下载PDF
基于遗传算法和SMOTE的网络入侵检测模型优化研究
10
作者 戴周浩 《现代计算机》 2024年第7期24-30,共7页
针对网络入侵检测存在数据不平衡和特征冗余的问题,提出一种新的检测模型。该模型结合了遗传算法和SMOTE算法,通过对数据进行采样和特征选择,提高了网络入侵检测的准确性。首先,为了解决数据不平衡的状况,采用了SMOTE算法。这个算法通... 针对网络入侵检测存在数据不平衡和特征冗余的问题,提出一种新的检测模型。该模型结合了遗传算法和SMOTE算法,通过对数据进行采样和特征选择,提高了网络入侵检测的准确性。首先,为了解决数据不平衡的状况,采用了SMOTE算法。这个算法通过在入侵类样本中嵌入随机样本,有效地提高了入侵类样本的数量,使得数据达到平衡。其次,为了缓解特征冗余,引入了基于遗传算法和随机森林方法的包装式特征选择技术,选择有用特征,减少冗余信息,从而提升最终的入侵检测性能。最后,采用随机森林算法对经过上述处理的数据集进行分类,实现对网络入侵样本的有效检测。在NSL⁃KDD数据集上的实验表明,基于遗传算法和SMOTE的网络入侵检测模型从整体上提高了入侵检测的识别率。 展开更多
关键词 特征选择 smote过采样 随机森林 网络入侵检测 遗传算法
下载PDF
基于LOF-SMOTE算法的地下水影响下矿山岩溶塌陷风险预测研究 被引量:1
11
作者 盛建龙 乔宇 +2 位作者 王平 俞栋华 张彦文 《有色金属科学与工程》 CAS 北大核心 2023年第3期372-380,399,共10页
矿山岩溶地表塌陷成因复杂,形式多样,为准确预测矿山岩溶塌陷,结合岩溶发育机理,本研究提出基于LOF和SMOTE算法的BP神经网络预测模型。首先通过LOF算法剔除因非自然原因而产生的异常数据,再通过SMOTE算法对剔除后的数据进行过采样,合成... 矿山岩溶地表塌陷成因复杂,形式多样,为准确预测矿山岩溶塌陷,结合岩溶发育机理,本研究提出基于LOF和SMOTE算法的BP神经网络预测模型。首先通过LOF算法剔除因非自然原因而产生的异常数据,再通过SMOTE算法对剔除后的数据进行过采样,合成新数据,以增加样本数目,最后采用BP神经网络模型对矿山岩溶塌陷进行预测。结果表明,实际工程数据经过预处理后的预测模型,与部分小样本预测模型相比,具有更高的预测精度,可为在其他工程中应用提供参考。 展开更多
关键词 岩溶塌陷 LOF算法 smote算法 神经网络 支持向量机
下载PDF
HSMOTE-AdaBoost:改进混合边界重采样集成分类算法
12
作者 李静 刘姜 +1 位作者 倪枫 李笑语 《智能计算机与应用》 2023年第7期7-14,共8页
处理类不平衡问题时,已有的采样方法存在易受噪声影响和忽略边界样本的问题,尤其是忽略多数类样本的类内差异,位于边界的样本实例非常容易被错分,而这些样本对划分决策边界具有重要作用。将SMOTE过采样和RUS随机欠采样方法结合并进行改... 处理类不平衡问题时,已有的采样方法存在易受噪声影响和忽略边界样本的问题,尤其是忽略多数类样本的类内差异,位于边界的样本实例非常容易被错分,而这些样本对划分决策边界具有重要作用。将SMOTE过采样和RUS随机欠采样方法结合并进行改进,提出混合边界重采样算法(HSMOTE-AdaBoost)。HSMOTE-AdaBoost算法首先对少数类运用SMOTE过采样,提高数据的平衡度;再使用K近邻算法清除噪声和采样方法产生的重叠实例;同时,基于与少数类样本的平均欧氏距离识别并保留边界多数类样本,然后对剩余的数据进行随机欠采样;最后,利用AdaBoost算法的优势,对平衡后的数据集进行多次迭代训练得到最终的分类模型。仿真实验结果表明,与传统的SMOTE-Boost、RUS-Boost、PC-Boost及改进后的算法KSMOTE-AdaBoost相比,该分类模型在不平衡数据集上的所有性能指标F-measure,G-mean,AUC值分别最高提升了22.97%,13.88%和10.03%,具有更优的分类效果。 展开更多
关键词 类不平衡 smote过采样 ADABOOST算法 噪声样本 边界样本
下载PDF
基于SMOTE算法的船体结构极限状态代理模型研究 被引量:1
13
作者 康煜晗 裴志勇 吴卫国 《武汉理工大学学报(交通科学与工程版)》 2023年第6期1089-1094,1101,共7页
建立典型集装箱船舱段结构参数化有限元模型,基于SMOTE过采样算法,增加样本数据中失效面附近样本点的数量,分别采用BP神经网络、径向基神经网络以及支持向量机三种代理模型技术,结合十折交叉验证法调试模型参数以提高模型的泛化能力,完... 建立典型集装箱船舱段结构参数化有限元模型,基于SMOTE过采样算法,增加样本数据中失效面附近样本点的数量,分别采用BP神经网络、径向基神经网络以及支持向量机三种代理模型技术,结合十折交叉验证法调试模型参数以提高模型的泛化能力,完成构建船体舱段结构极限状态代理模型并对其进行测试与分析,获得了效果与泛化能力均较为优良的船体结构极限状态高精度代理模型.结果表明:经SMOTE算法处理的样本数据结合BP神经网络代理模型技术,能够在不增加有限元计算任务量的同时提高船体结构极限状态代理模型的精度. 展开更多
关键词 船体结构可靠性 代理模型技术 smote过采样算法 交叉验证
下载PDF
基于SMOTE-GA-CatBoost算法的全国地表水水质分类评价 被引量:4
14
作者 徐玲 景向楠 +3 位作者 杨英 李卫华 刘怡心 严国兵 《中国环境科学》 EI CAS CSCD 北大核心 2023年第7期3848-3856,共9页
针对地表水分类评价中水污染特征空间的高冲突性以及水质类别的不均衡性等问题,以7项地表水水质指标为水质评价因子,采用SMOTE过采样技术结合遗传算法和CatBoost模型对全国主要江河和重要湖库分别进行水质分类评价,并与其他4种改进集成... 针对地表水分类评价中水污染特征空间的高冲突性以及水质类别的不均衡性等问题,以7项地表水水质指标为水质评价因子,采用SMOTE过采样技术结合遗传算法和CatBoost模型对全国主要江河和重要湖库分别进行水质分类评价,并与其他4种改进集成算法进行对比.结果表明:SMOTE预处理有效改善样本类别的不均衡性,提高CatBoost模型对少数类水质样本分类的准确性;遗传算法调参有效提高CatBoost模型的收敛速度和分类精度,优化了模型的分类性能;SMOTE-GA-CatBoost模型对江河和湖库的水质分类效果均优于其他4种改进集成分类模型,其对江河水水质分类的准确率、精确率、召回率、F1分别为97.7%、97.8%、96.1%、96.9%,对湖库水水质分类的准确率、精确率、召回率、F1分别为96.7%、96.2%、95.4%、95.8%,该模型可以实现不同水域的水质分类评价. 展开更多
关键词 地表水 水质分类评价 CatBoost smote 遗传算法
下载PDF
采用自适应最小化置信下限和SMOTE算法的动态代理模型
15
作者 戚林辉 潘伟锋 罗伟林 《福州大学学报(自然科学版)》 CAS 北大核心 2023年第6期811-818,共8页
利用最优拉丁超立方试验进行初始采样,建立基于自适应最小化置信下限和SMOTE算法的动态径向基函数代理模型.将自适应平衡常数引入到最小化置信下限准则中,通过多岛遗传算法对置信下限进行寻优.根据代理模型精度,在最优解处运用SMOTE算... 利用最优拉丁超立方试验进行初始采样,建立基于自适应最小化置信下限和SMOTE算法的动态径向基函数代理模型.将自适应平衡常数引入到最小化置信下限准则中,通过多岛遗传算法对置信下限进行寻优.根据代理模型精度,在最优解处运用SMOTE算法动态地新增样本点,进而更新代理模型,直至收敛.经过数学算例测试后,将该优化策略应用于深潜器耐压舱的优化中,与其他动态代理模型相比,该策略的优化效率和精度显著提高. 展开更多
关键词 动态代理模型 径向基函数 最小化置信下限 smote算法 深潜器 耐压舱
下载PDF
基于SMOTE算法的急性一氧化碳中毒迟发性脑病风险预警模型的构建
16
作者 谭倩梅 杨静 李秋萍 《护理管理杂志》 CSCD 2023年第9期760-763,780,共5页
目的分析急性一氧化碳中毒迟发性脑病的危险因素,并基于SMOTE算法构建风险预警模型。方法将180例急性一氧化碳中毒患者根据是否发生一氧化碳中毒后迟发性脑病分组,分析患者的临床资料,筛选一氧化碳中毒后迟发性脑病的影响因素,再使用SM... 目的分析急性一氧化碳中毒迟发性脑病的危险因素,并基于SMOTE算法构建风险预警模型。方法将180例急性一氧化碳中毒患者根据是否发生一氧化碳中毒后迟发性脑病分组,分析患者的临床资料,筛选一氧化碳中毒后迟发性脑病的影响因素,再使用SMOTE算法重建影响因素的原始数据集,从而获得其风险预警模型,并验证模型的预测效能。结果180例患者中有32例发生一氧化碳中毒后迟发性脑病,发生率为17.78%;年龄>60岁、头颅MRI异常、未行高压氧治疗、格拉斯哥昏迷指数评分<9分、昏迷时间>24 h以及肌酸激酶>200 U/L是一氧化碳中毒后迟发性脑病发生的危险因素(P<0.05),从而获得原始数据预警模型P_(1)=1.491X_(1)+1.429X_(2)+1.053X_(3)+1.055X_(4)+1.292X_(5)+1.330X_(6)-4.157和基于SMOTE算法的预警模型P_(2)=1.433X_(1)+1.229X_(2)+1.215X_(3)+1.063X_(4)+1.402X_(5)+1.106X_(6)-5.224。原始数据预警模型AUC曲线下面积为0.805,低于基于SMOTE算法的预警模型0.834。结论年龄>60岁、头颅MRI异常、未行高压氧治疗、GCS评分<9分、昏迷时间>24 h以及肌酸激酶>200 U/L是一氧化碳中毒后迟发性脑病发生的危险因素,基于上述危险因素建立的SMOTE模型预测效能比传统Logistic回归模型更优。 展开更多
关键词 smote算法 一氧化碳中毒 危险因素 迟发性脑病 预测
下载PDF
LightGBM混合模型在乳腺癌诊断中的应用 被引量:1
17
作者 邢长征 徐佳玉 《计算机工程与应用》 CSCD 北大核心 2024年第6期330-338,共9页
乳腺癌是最常见的癌症种类之一,且患病率每年仍在上升。在不进行手术活检的情况下,通过分析细胞核的各项指标来预测肿块的良性与否,可以有效地为医生提供辅助诊疗并减少患者的痛苦。为此,提出了一种基于LightGBM算法的乳腺癌诊断模型。... 乳腺癌是最常见的癌症种类之一,且患病率每年仍在上升。在不进行手术活检的情况下,通过分析细胞核的各项指标来预测肿块的良性与否,可以有效地为医生提供辅助诊疗并减少患者的痛苦。为此,提出了一种基于LightGBM算法的乳腺癌诊断模型。使用边界-合成少数类过采样算法(borderline-synthetic minority oversampling technique,Borderline-SMOTE)来改善乳腺癌确诊数据不平衡的问题。在麻雀搜索算法(sparrow search algorithm,SSA)中引入PWLCM混沌映射、全新的惯性权重和纵横交叉算法对其进行改进,再运用改进后的SSA算法对Light-GBM的参数进行自动寻优。由于LightGBM对噪点较为敏感,所以提出了一种OVR-Jacobian正则化方法对LightGBM进行降噪处理。使用改进后的LightGBM混合模型对乳腺癌进行诊断。实验结果表明,提出的混合模型在均方误差、决定系数和交叉验证得分这三个指标上均优于常见的模型,显示出其较好的诊断效果。 展开更多
关键词 乳腺癌预测 LightGBM 麻雀搜索算法 Borderline-smote算法 机器学习 Jacobian正则化
下载PDF
改进SMOTE的非平衡数据集分类算法研究 被引量:27
18
作者 赵清华 张艺豪 +1 位作者 马建芬 段倩倩 《计算机工程与应用》 CSCD 北大核心 2018年第18期168-173,共6页
针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本... 针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域、降低算法复杂度的目的。在6种不平衡数据集上的大量实验表明,改进算法与传统算法相比,算法消耗时间大幅减少,取得更高的G-mean值、F-value值和AUC值。 展开更多
关键词 随机森林 smote算法 不平衡数据集
下载PDF
机器学习在肺癌诊断中的研究和应用 被引量:1
19
作者 朱勇 晏峻峰 《计算机与数字工程》 2024年第3期751-756,共6页
肺癌是一种严重危害人类健康的恶行肿瘤,以其高发病率和高死亡率闻名[1]。如何快速准确地诊断肺癌是肺癌预防和治疗的一大挑战,对人类的生命健康具有重要意义。论文将机器学习方法中的支持向量机(SVM)、随机森林(RF)与XGBoost模型进行... 肺癌是一种严重危害人类健康的恶行肿瘤,以其高发病率和高死亡率闻名[1]。如何快速准确地诊断肺癌是肺癌预防和治疗的一大挑战,对人类的生命健康具有重要意义。论文将机器学习方法中的支持向量机(SVM)、随机森林(RF)与XGBoost模型进行比较分析。通过模型评估指标中的准确率、召回率、f1值、精确度和ROC曲线对比分析,证明了支持向量机在线性核函数下能较好地预测肺癌,准确率可以达到95.18%。同时发现随机森林与XGBoost模型的各项性能评估指标在SMOTE算法均衡化后的数据集上均有较高的提升,其准确率可以达到89.16%和90.36%。在保证准确率的前提下,随机森林和XGBoost较之支持向量机可以更快地得到预测结果,在辅助诊断肺癌中也是很好的模型选择。 展开更多
关键词 肺癌 支持向量机 随机森林 XGBoost算法 smote算法
下载PDF
基于CPD-SMOTE的类不平衡数据分类算法研究 被引量:7
20
作者 彭如香 杨涛 +2 位作者 孔华锋 姜国庆 凡友荣 《计算机应用与软件》 北大核心 2018年第12期259-262,268,共5页
类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Techn... 类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。 展开更多
关键词 smote 类不平衡 分类算法
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部