期刊文献+
共找到487篇文章
< 1 2 25 >
每页显示 20 50 100
基于SMOTE-IKPCA-SeNet深度迁移学习的小批量生产质量预测研究 被引量:1
1
作者 杨剑锋 崔少红 +1 位作者 段家琦 王宁 《工业工程》 2024年第2期98-106,157,共10页
随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利... 随着智能制造技术的发展和客户个性化需求的增加,多品种小批量生产方式逐渐成为制造业的主流。面向大批量生产、以统计过程控制为核心的质量管理方式并不适用于小批量生产。针对复杂生产过程存在参数多、非线性和交互作用的问题,提出利用深度迁移学习的方式将历史生产数据作为源域迁移至小样本目标产品数据进行质量预测。首先,通过合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)和改进的核主成分分析(improved kernel principal component analysis,IKPCA)算法筛选源域和目标域的可迁移特征,这不仅兼顾了特征重要性和可迁移性,还减少了“负迁移”,提高了模型泛化能力;然后,采用结合通道注意力机制的卷积神经网络SeNet构建基于深度迁移学习的质量预测模型。仿真结果表明,随着目标域样本的增加,所提方法的预测准确性明显优于广泛采用的支持向量机建模方法。同时,所提可迁移特征筛选方法显著提高了深度迁移学习的质量预测效果,为复杂的小批量生产过程质量保证提供了新方法。 展开更多
关键词 小批量生产质量预测 深度迁移学习 smote IKPCA SeNet
下载PDF
基于 SMOTE 算法的老年肌少症患者跌倒风险预测模型的建立
2
作者 孙敏 王娅 +2 位作者 丁佐玲 钱维群 孟雅 《护理管理杂志》 CSCD 2024年第10期899-903,共5页
目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患... 目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患者跌倒的危险因素,应用SMOTE算法构建老年肌少症患者跌倒的预测模型,并对预测模型的预测效能进行分析。结果256例老年肌少症患者中65例发生跌倒,跌倒发生率为25.39%;年龄≥70岁、严重肌少症期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,原始预测模型Logit(P 1)=1.057×年龄+0.808×肌少症临床分期+0.901×睡眠障碍+0.835×糖尿病+0.828×视力障碍+1.221×直立性低血压-2.535,基于SMOTE算法的预测模型Logit(P 2)=1.043×年龄+0.879×肌少症临床分期+0.962×睡眠障碍+0.717×糖尿病+0.810×视力障碍+1.314×直立性低血压-1.445,ROC曲线显示,P 2模型ROC曲线下面积为0.952(95%CI:0.920,0.972),显著高于P 1模型的ROC曲线下面积0.761(95%CI:0.693,0.828),基于SMOTE算法预测模型的校准曲线显示预测值和实际值一致性良好。结论年龄、肌少症临床分期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,基于SMOTE算法的预测模型具有较好的预测效能,有助于临床护理人员识别老年肌少症跌倒高危人群。 展开更多
关键词 老年 肌少症 跌倒 护理 风险 smote算法 预测模型
下载PDF
基于混合式SMOTE和RF模型的小额贷款公司客户信用风险研究 被引量:1
3
作者 严晴 徐海燕 《运筹与管理》 CSSCI CSCD 北大核心 2024年第1期191-197,共7页
小额借贷中的个人信用风险问题持续制约着小额贷款行业的健康可持续发展。针对小贷公司在进行信用风险评估时对高违约风险客户识别准确率较低的难题,运用混合式SMOTE、RF算法来同时处理业务数据中高维、非均衡两个问题。本文借助江苏J... 小额借贷中的个人信用风险问题持续制约着小额贷款行业的健康可持续发展。针对小贷公司在进行信用风险评估时对高违约风险客户识别准确率较低的难题,运用混合式SMOTE、RF算法来同时处理业务数据中高维、非均衡两个问题。本文借助江苏J小贷公司的实例数据,依次构建随机森林(Random Forest, RF)模型、SMOTE-RF模型以及Borderline-SMOTE-RF模型并进行模型测试;再选用SVM算法进行对比实验以此衡量模型的信用风险评价精度。随后基于模型对于指标重要性的评分筛选出6项指标作为影响个人信用风险的关键指标。实验证明基于Borderline-SMOTE-RF算法对于小额贷款个人信用风险评价模型的分类性能最佳;在筛选关键指标时,为避免人工合成虚拟样本对指标重要性影响,需要结合三类模型评分进行综合选择。 展开更多
关键词 信用风险 随机森林(RF) smote 分类模型 指标体系
下载PDF
SMOTE数据预处理算法在砂型铸造复杂铸件缺陷预测中的应用
4
作者 潘徐政 刘迎辉 +5 位作者 李文 计效园 殷亚军 吴来发 解明国 周建新 《铸造》 CAS 2024年第10期1473-1479,共7页
针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预... 针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预处理算法,探究其在砂型铸造复杂铸件缺陷预测中的应用。根据采集到的复杂铸件不平衡数据集的特点,基于SMOTE数据预处理算法,科学扩充了不平衡数据集,创建了可用于训练复杂铸件缺陷预测模型的平衡数据集,数据预处理前后的模型预测准确率从86.50%提高至97.91%。 展开更多
关键词 转向桥铸件 砂型铸造 不平衡数据集 数据预处理 smote算法 缺陷预测
下载PDF
基于SMOTETomek过采样方法与领域自适应迁移学习的风电机组故障诊断
5
作者 张伊杰 刘宝良 +2 位作者 王承民 杨镜非 谢宁 《太阳能学报》 EI CAS CSCD 北大核心 2024年第10期635-644,共10页
为在不平衡数据上得到准确分类的故障诊断模型,提出将SMOTETomek过采样方法与领域自适应迁移学习相结合的故障诊断算法框架。首先利用滑动窗口采样技术将数据采样成二维时空窗口数据,然后执行SMOTETomek过采样操作,可保留并丰富完整的... 为在不平衡数据上得到准确分类的故障诊断模型,提出将SMOTETomek过采样方法与领域自适应迁移学习相结合的故障诊断算法框架。首先利用滑动窗口采样技术将数据采样成二维时空窗口数据,然后执行SMOTETomek过采样操作,可保留并丰富完整的时序故障特征。针对过采样算法引入噪声信息的问题,引入领域自适应迁移学习算法在原始数据与过采样后的数据之间提取不变特征,使得过采样算法的引入的噪声信息可被过滤掉。在中国某实际风电场的实验结果显示,所提方法可在高度不平衡的数据上完成模型训练,准确识别各类型故障并精确辨识故障过程对应的时间窗口,诊断性能显著优于基于先前用于应对数据不平衡所普遍使用的过采样方法得到的模型。 展开更多
关键词 风电机组 故障诊断 监督控制和数据采集系统 深度学习 smote过采样方法 领域自适应
下载PDF
SMOTE类算法研究综述 被引量:1
6
作者 王晓霞 李雷孝 林浩 《计算机科学与探索》 CSCD 北大核心 2024年第5期1135-1159,共25页
合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细... 合成少数类过采样技术(SMOTE)因能有效处理少数类样本已成为处理不平衡数据的主流方法之一,而且许多SMOTE改进算法已被提出,但目前已有的调研极少考虑到流行的算法级改进方法。因此对现有SMOTE类算法进行更全面的分析与总结。首先详细阐述了SMOTE方法的基本原理,然后主要从数据级、算法级两个层面系统性地梳理分析SMOTE类算法,并介绍数据级和算法级混合改进的新思路。数据级改进是在预处理时通过不同操作删除或添加数据来平衡数据分布;算法级改进不会改变数据分布,主要通过修改或创建算法来加强对少数类样本的关注度。二者相比,数据级方法应用受限更少,算法级改进的算法鲁棒性普遍更高。为了更全面地提供SMOTE类算法的基础研究材料,最后列出常用数据集、评价指标,给出未来可能尝试进行的研究思路,以更好地应对不平衡数据问题。 展开更多
关键词 不平衡数据 合成少数类过采样技术(smote) 过采样 监督学习
下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
7
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
下载PDF
基于SMOTE的IFOX-1D-CNN变压器故障诊断模型 被引量:1
8
作者 王家军 景诗毅 +2 位作者 姚雨 陈焰 李波 《煤矿机械》 2024年第4期176-180,共5页
为了均衡油浸式变压器样本数据集,提高故障诊断精度,提出了基于合成少数类过采样技术(SMOTE)的改进狐狸(IFOX)算法优化一维卷积神经网络(1D-CNN)变压器故障诊断模型。首先,通过SMOTE均衡变压器样本数据集;其次,针对狐狸(FOX)算法种群初... 为了均衡油浸式变压器样本数据集,提高故障诊断精度,提出了基于合成少数类过采样技术(SMOTE)的改进狐狸(IFOX)算法优化一维卷积神经网络(1D-CNN)变压器故障诊断模型。首先,通过SMOTE均衡变压器样本数据集;其次,针对狐狸(FOX)算法种群初始化非均匀与寻优过程中易陷入局部最优解的缺陷,采用混沌映射、Levy飞行策略对其进行改进,并利用IFOX优化1D-CNN的学习率、卷积核大小、卷积核数量、全连接层神经元数量等超参数,建立IFOX-1D-CNN模型。实验结果表明,该模型在油浸式变压器故障诊断中具有较好的收敛性与较高的诊断精度。 展开更多
关键词 油浸式变压器 故障诊断 smote IFOX 1D-CNN
下载PDF
基于加权复杂度的SMOTE算法及其在软件缺陷预测中的应用
9
作者 魏威 江峰 《计算机与数字工程》 2024年第5期1418-1422,1427,共6页
近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必... 近年来,SMOTE被广泛应用于软件缺陷预测中不平衡数据的处理。然而,现有的SMOTE算法普遍忽视了不同样本的复杂度存在很大差异这一问题。事实上,在缺陷预测时样本的复杂度与其是否具有缺陷之间存在着密切的联系,因此,在进行过采样时,有必要利用样本的复杂度来辅助新样本的合成,从而提高缺陷预测的性能。如何度量样本的复杂度非常重要,论文在计算样本复杂度时充分考虑到每一个条件属性的权重,从而得到一种加权复杂度的概念。基于加权复杂度,提出一种新的SMOTE算法——WCP-SMOTE,并将其应用于软件缺陷预测。WCP-SMOTE算法首先利用粗糙集中的粒度决策熵来计算决策表中每个条件属性的重要性和权重;其次,通过对样本在所有属性上的取值进行加权求和,从而得到该样本的加权复杂度;第三,根据加权复杂度对少数类样本进行升序排序,并从头到尾对相邻的两个少数类样本求平均来不断地合成新的样本,直到获得一个平衡的数据集。在多个缺陷预测数据集上的实验表明,利用WCP-SMOTE算法来处理不平衡数据能够获得更好的软件缺陷预测性能。 展开更多
关键词 软件缺陷预测 不平衡数据 粗糙集 粒度决策熵 加权复杂度 smote
下载PDF
一种分层SMOTE交叉验证法--应对数据泄露与样本不平衡
10
作者 李佳静 林少聪 郑寒秀 《闽江学院学报》 2024年第2期56-68,共13页
在处理不平衡数据时,即使训练集和测试集之间互不重叠,过采样技术仍然可能导致数据泄露。为了解决这一问题,提出了一种分层SMOTE交叉验证法(stratified SMOTE cross-validation),将训练集中各类别样本均匀地划分为K折,在每一折中,独立... 在处理不平衡数据时,即使训练集和测试集之间互不重叠,过采样技术仍然可能导致数据泄露。为了解决这一问题,提出了一种分层SMOTE交叉验证法(stratified SMOTE cross-validation),将训练集中各类别样本均匀地划分为K折,在每一折中,独立地使用SMOTE算法进行数据平衡,使得每一折内的少数类样本特征仅在该折内使用。这样做不仅确保了训练与验证数据之间的完全独立,规避了数据泄露的风险,而且分类器能够充分学习少数类样本的特征。此外,结合了集成学习和参数优化技术,以增强模型的分类和泛化能力。在UCI数据集上的实验结果显示,分层SMOTE交叉验证法在分类性能上并不逊色于现有方法,并且不同的K值导致的数据分布差异会对模型性能产生影响。该方法有效地提升了模型对不平衡数据的处理能力,为不平衡学习问题提供了一定的参考价值。 展开更多
关键词 数据不平衡 数据泄露 分层smote交叉验证
下载PDF
基于SMOTE_GA_XGBoost的葡萄酒质量预测 被引量:1
11
作者 丁海萌 郭小燕 《智能计算机与应用》 2024年第1期147-151,共5页
随着经济发展和消费升级,人们对高品质葡萄酒的需求不断增加,如何利用葡萄酒理化指标进行高效准确的质量评定显得尤为重要。本文基于UCI葡萄酒数据集,建立了SMOTE_GA_XGBoost模型来预测葡萄酒质量。结果表明,SMOTE_GA_XGBoost模型得出... 随着经济发展和消费升级,人们对高品质葡萄酒的需求不断增加,如何利用葡萄酒理化指标进行高效准确的质量评定显得尤为重要。本文基于UCI葡萄酒数据集,建立了SMOTE_GA_XGBoost模型来预测葡萄酒质量。结果表明,SMOTE_GA_XGBoost模型得出的级别判别准确率为89.36%,类别判别准确率为96.46%,均高于其他对比模型,具有更高的预测精度。 展开更多
关键词 葡萄酒质量预测 机器学习 smote GA_XGBoost
下载PDF
Risk assessment of rockburst using SMOTE oversampling and integration algorithms under GBDT framework
12
作者 WANG Jia-chuang DONG Long-jun 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第8期2891-2915,共25页
Rockburst is a common geological disaster in underground engineering,which seriously threatens the safety of personnel,equipment and property.Utilizing machine learning models to evaluate risk of rockburst is graduall... Rockburst is a common geological disaster in underground engineering,which seriously threatens the safety of personnel,equipment and property.Utilizing machine learning models to evaluate risk of rockburst is gradually becoming a trend.In this study,the integrated algorithms under Gradient Boosting Decision Tree(GBDT)framework were used to evaluate and classify rockburst intensity.First,a total of 301 rock burst data samples were obtained from a case database,and the data were preprocessed using synthetic minority over-sampling technique(SMOTE).Then,the rockburst evaluation models including GBDT,eXtreme Gradient Boosting(XGBoost),Light Gradient Boosting Machine(LightGBM),and Categorical Features Gradient Boosting(CatBoost)were established,and the optimal hyperparameters of the models were obtained through random search grid and five-fold cross-validation.Afterwards,use the optimal hyperparameter configuration to fit the evaluation models,and analyze these models using test set.In order to evaluate the performance,metrics including accuracy,precision,recall,and F1-score were selected to analyze and compare with other machine learning models.Finally,the trained models were used to conduct rock burst risk assessment on rock samples from a mine in Shanxi Province,China,and providing theoretical guidance for the mine's safe production work.The models under the GBDT framework perform well in the evaluation of rockburst levels,and the proposed methods can provide a reliable reference for rockburst risk level analysis and safety management. 展开更多
关键词 rockburst evaluation smote oversampling random search grid K-fold cross-validation confusion matrix
下载PDF
基于PCA-Smote-XGBoost的软件缺陷预测研究
13
作者 曾子安 李英梅 《软件工程与应用》 2024年第3期346-357,共12页
随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少... 随着软件系统的复杂性日益增加,软件缺陷预测成为了确保软件质量的重要手段。本研究提出了一种基于PCA-Smote-XGBoost的软件缺陷预测模型,旨在提高缺陷预测的准确性和效率。本文采用主成分分析(PCA)进行数据降维,保留95%的方差,以减少特征数量并提取关键信息;利用Smote过采样方法解决数据不平衡问题;结合XGBoost算法构建预测模型,并通过实验验证模型的有效性。在软件缺陷预测常用数据集的十一个项目中,实验结果表明,该模型在软件缺陷预测方面相较于其他八种基准模型,具有最高的准确率ACC和F1,能够有效地辅助软件开发团队识别潜在的缺陷风险。 展开更多
关键词 软件缺陷预测 PCA smote XGBoost
下载PDF
Improving Prediction of Chronic Kidney Disease Using KNN Imputed SMOTE Features and TrioNet Model
14
作者 Nazik Alturki Abdulaziz Altamimi +5 位作者 Muhammad Umer Oumaima Saidani Amal Alshardan Shtwai Alsubai Marwan Omar Imran Ashraf 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第6期3513-3534,共22页
Chronic kidney disease(CKD)is a major health concern today,requiring early and accurate diagnosis.Machine learning has emerged as a powerful tool for disease detection,and medical professionals are increasingly using ... Chronic kidney disease(CKD)is a major health concern today,requiring early and accurate diagnosis.Machine learning has emerged as a powerful tool for disease detection,and medical professionals are increasingly using ML classifier algorithms to identify CKD early.This study explores the application of advanced machine learning techniques on a CKD dataset obtained from the University of California,UC Irvine Machine Learning repository.The research introduces TrioNet,an ensemble model combining extreme gradient boosting,random forest,and extra tree classifier,which excels in providing highly accurate predictions for CKD.Furthermore,K nearest neighbor(KNN)imputer is utilized to deal withmissing values while synthetic minority oversampling(SMOTE)is used for class-imbalance problems.To ascertain the efficacy of the proposed model,a comprehensive comparative analysis is conducted with various machine learning models.The proposed TrioNet using KNN imputer and SMOTE outperformed other models with 98.97%accuracy for detectingCKD.This in-depth analysis demonstrates the model’s capabilities and underscores its potential as a valuable tool in the diagnosis of CKD. 展开更多
关键词 Precisionmedicine chronic kidney disease detection smote missing values healthcare KNNimputer ensemble learning
下载PDF
不平衡数据集的DC-SMOTE过采样方法
15
作者 冀常鹏 尚佳奇 代巍 《智能系统学报》 CSCD 北大核心 2024年第3期525-533,共9页
针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决... 针对不平衡数据集在分类任务中表现不佳的问题,提出基于局部密度与集中度的过采样算法。针对数据集中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与集中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决类内不平衡问题。根据集中度的不同,区分出少数类样本的边界,有针对性地合成第二类新样本,达到强化边界的作用;同时,通过自适应生成新样本,有效解决大部分过采样算法没有明确过采样量或者盲目追求样本平衡度相等的问题。最后,在公开的12个不平衡数据集上进行了实验,实验结果表明,本算法在低不平衡数据集与高不平衡数据集上的应用均拥有良好的表现。 展开更多
关键词 不平衡数据集 过采样 高斯核函数 局部引力 高不平衡数据 合成少数类过采样 不平衡度 分类
下载PDF
基于SVM-SMOTE算法的一维卷积神经网络电力系统暂态稳定评估模型
16
作者 袁梦薇 何宇 王旭 《智能计算机与应用》 2024年第7期50-56,共7页
为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,... 为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,并采用一维卷积神经网络(1D-CNN)捕捉输入特征的时序信息;考虑数据集样本不平衡带来的预测精度下降问题,采用SVM-SMOTE算法对样本进行均衡化。算例仿真结果表明,本文所提出的模型实现了端到端的时序特征提取和暂态稳定评估,可满足在线评估准确性、快速性和可靠性的要求,且有效解决了不平衡数据集中失稳样本漏判率高的问题。 展开更多
关键词 电力系统 暂态稳定评估 SVM-smote算法 一维卷积神经网络
下载PDF
基于改进SMOTE的不平衡数据分类算法
17
作者 马宝霖 胡茜 《长春工业大学学报》 CAS 2024年第3期259-264,共6页
SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插... SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插值过程中采用LMKNN方法。分别将该算法与SMOTE、KNSMOTE应用至实际数据中,使用SVM分类算法分类并进行性能对比。结果表明,对Abalone、Ecoli等不平衡数据集分类时,文中使用的算法分类效果最佳,验证了该算法的有效性。 展开更多
关键词 不平衡数据 smote算法 SVM算法
下载PDF
基于SMOTE-Tomek和CNN耦合的滑坡易发性评价模型及其应用——以三峡库区秭归—巴东段为例
18
作者 于宪煜 汤礼 《中国地质灾害与防治学报》 CSCD 2024年第3期141-151,共11页
中国是受滑坡灾害影响较为严重的国家,滑坡对受灾害影响地区的人民生命与财产造成了巨大的威胁。滑坡易发性评价作为对滑坡风险预测的重要工具,具有重要的防灾减灾的意义,但是传统的滑坡易发性评价中存在滑坡与非滑坡样本数据不平衡的问... 中国是受滑坡灾害影响较为严重的国家,滑坡对受灾害影响地区的人民生命与财产造成了巨大的威胁。滑坡易发性评价作为对滑坡风险预测的重要工具,具有重要的防灾减灾的意义,但是传统的滑坡易发性评价中存在滑坡与非滑坡样本数据不平衡的问题,使得训练集的建立在本质上是对非滑坡数据进行了欠采样,导致滑坡事件的重要信息特征丢失,进而影响到滑坡易发性评价的可靠性。文章以三峡库区巴东至秭归段为例,选取高程、坡度等14个评价因子作为滑坡易发性评价因子,划分原始训练集与验证集,采用SMOTE-Tomek方法(synthetic minority oversampling technique-Tomek Links,SMOTE-Tomek)处理原始训练数据集,构建输入训练集,输入并训练卷积神经网络模型(convolutional neural networks,CNN),得到SMOTE-Tomek-CNN耦合模型,再通过将SMOTE-Tomek方法与传统的欠采样方法(random undersampling,RUS),分别与CNN模型和支持向量机模型(support vector machine,SVM)交叉组合成SMOTE-Tomek-SVM、RUS-CNN和RUS-SVM三种耦合模型,并与SMOTE-CNN耦合模型进行对比。结果表明,在四种耦合模型中,SMOTE-CNN耦合模型的特定类别精度与ROC曲线下面积较高,结果分别为73.60%和0.965,表明该方法的预测能力优于传统的方法,能为研究区滑坡预测工作提供可靠参考。 展开更多
关键词 滑坡 滑坡易发性评价 smote-Tomek 卷积神经网络 不平衡数据
下载PDF
基于SMOTE-SSA-CNN的煤矿用变压器DGA故障诊断方法
19
作者 张化昭 朱建武 +2 位作者 邱日强 彭明聪 林江 《煤矿机械》 2024年第12期172-176,共5页
为了提高基于油中溶解气体分析(DGA)的煤矿用变压器故障识别精确性,提出了一种基于SMOTE-SSA-CNN的煤矿用变压器DGA故障诊断模型。首先,以煤矿用变压器油中溶解气体为基础数据,采用合成少数类样本过采样(SMOTE)算法对原始数据集进行样... 为了提高基于油中溶解气体分析(DGA)的煤矿用变压器故障识别精确性,提出了一种基于SMOTE-SSA-CNN的煤矿用变压器DGA故障诊断模型。首先,以煤矿用变压器油中溶解气体为基础数据,采用合成少数类样本过采样(SMOTE)算法对原始数据集进行样本扩充,解决原始数据集中正负样本严重失衡的问题;然后引入麻雀搜索算法(SSA)对卷积神经网络(CNN)的卷积核大小与数量、全连接层神经元数量、学习率等超参数进行优化,提高模型故障诊断结果的准确率;最后,通过算例分析对建立的SMOTE-SSA-CNN模型性能进行评估,验证了所提方法对煤矿用变压器故障诊断的有效性,且与传统故障诊断方法相比,所提方法的收敛性较好,精度较高。 展开更多
关键词 煤矿用变压器 DGA smote SSA CNN
下载PDF
基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎的风险预警模型
20
作者 郑媛 邓维维 +2 位作者 刘芮菡 邓东玲 龚元 《全科护理》 2024年第16期3010-3014,共5页
目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回... 目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回归分析法筛选独立风险因素,构建预测模型,同时基于SMOTE算法改进数据集,构建改进数据集的预警模型并对比验证模型的预测效能。结果:年龄≥60岁、糖尿病史、CRP≥150 mg/dL、NLR≥15、血糖≥9 mmol/L、术前白蛋白≤32 g/L为肛周脓肿病人发生NF的独立风险因素(P<0.05)。Logistic预警模型P1的受试者工作特征(ROC)曲线下面积为0.825,SMOTE算法预警模型P2的ROC曲线下面积为0.939,两者均具有较高的预测精准度。结论:SMOTE算法预警模型对发生NF的概率计算精准,有利于提前干预,为病人的预后做好充分保障。 展开更多
关键词 肛周脓肿 坏死性筋膜炎 smote算法 LOGISTIC分析 预警模型
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部