期刊文献+
共找到158篇文章
< 1 2 8 >
每页显示 20 50 100
基于 SMOTE 算法的老年肌少症患者跌倒风险预测模型的建立
1
作者 孙敏 王娅 +2 位作者 丁佐玲 钱维群 孟雅 《护理管理杂志》 CSCD 2024年第10期899-903,共5页
目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患... 目的探讨老年肌少症患者跌倒的危险因素,并基于SMOTE算法构建风险预测模型。方法选取2020年12月至2022年9月某医院收治的256例老年肌少症患者为研究对象,根据跌倒发生情况分为跌倒组和未跌倒组。采用Logistic回归分析筛选老年肌少症患者跌倒的危险因素,应用SMOTE算法构建老年肌少症患者跌倒的预测模型,并对预测模型的预测效能进行分析。结果256例老年肌少症患者中65例发生跌倒,跌倒发生率为25.39%;年龄≥70岁、严重肌少症期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,原始预测模型Logit(P 1)=1.057×年龄+0.808×肌少症临床分期+0.901×睡眠障碍+0.835×糖尿病+0.828×视力障碍+1.221×直立性低血压-2.535,基于SMOTE算法的预测模型Logit(P 2)=1.043×年龄+0.879×肌少症临床分期+0.962×睡眠障碍+0.717×糖尿病+0.810×视力障碍+1.314×直立性低血压-1.445,ROC曲线显示,P 2模型ROC曲线下面积为0.952(95%CI:0.920,0.972),显著高于P 1模型的ROC曲线下面积0.761(95%CI:0.693,0.828),基于SMOTE算法预测模型的校准曲线显示预测值和实际值一致性良好。结论年龄、肌少症临床分期、睡眠障碍、糖尿病、视力障碍及直立性低血压是老年肌少症患者跌倒的危险因素,基于SMOTE算法的预测模型具有较好的预测效能,有助于临床护理人员识别老年肌少症跌倒高危人群。 展开更多
关键词 老年 肌少症 跌倒 护理 风险 smote算法 预测模型
下载PDF
SMOTE数据预处理算法在砂型铸造复杂铸件缺陷预测中的应用
2
作者 潘徐政 刘迎辉 +5 位作者 李文 计效园 殷亚军 吴来发 解明国 周建新 《铸造》 CAS 2024年第10期1473-1479,共7页
针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预... 针对实际生产过程采集的复杂转向桥铸件工艺数据中冷隔、气孔、砂眼、缩孔等缺陷类别的数据量严重不平衡、复杂铸件缺陷预测模型准确率不高的问题,结合砂型铸造实际工况,引入了SMOTE(Synthetic Minority Oversampling Technique)数据预处理算法,探究其在砂型铸造复杂铸件缺陷预测中的应用。根据采集到的复杂铸件不平衡数据集的特点,基于SMOTE数据预处理算法,科学扩充了不平衡数据集,创建了可用于训练复杂铸件缺陷预测模型的平衡数据集,数据预处理前后的模型预测准确率从86.50%提高至97.91%。 展开更多
关键词 转向桥铸件 砂型铸造 不平衡数据集 数据预处理 smote算法 缺陷预测
下载PDF
基于SMOTE算法和机器学习模型建立原发性肝癌术后的预后预测模型
3
作者 潘比 余靖华 +2 位作者 黄译贤 伍亚舟 李芳 《陆军军医大学学报》 CAS CSCD 北大核心 2024年第19期2236-2240,共5页
目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End ... 目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库中4297例患者进行回顾性队列研究,通过独热编码和平均值插补法进行数据预处理,利用SMOTE算法解决数据类别不平衡问题,将临床变量纳入机器学习模型,基于决策树(decision tree,DT)、随机森林(random forest,RF)、梯度提升决策树(gradient boosting decision tree,GBDT)、极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)方法构建预后预测模型(SMOTE+DT/RF/GBDT/XGBoost),通过比较多种模型的性能,筛选出最佳的预测模型。结果组合模型SMOTE+RF展示出最优的预测性能,受试者工作特征曲线(receiver operating characteristic curve,ROC)下的面积(area under the curve,AUC)、准确率和精确率均高于其他模型,分别为0.895、0.811、0.806。结论基于SMOTE+RF算法的原发性肝癌的预后预测模型可有效预测原发性肝癌患者的生存结局。 展开更多
关键词 原发性肝癌 少数类过采样技术算法 机器学习 预测模型
下载PDF
基于SVM-SMOTE算法的一维卷积神经网络电力系统暂态稳定评估模型
4
作者 袁梦薇 何宇 王旭 《智能计算机与应用》 2024年第7期50-56,共7页
为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,... 为了提高电力系统运行稳定性,降低大停电事故发生的概率,本文提出了一种基于SVM-SMOTE算法的一维卷积神经网络暂态稳定评估模型。为了避免人工特征选择引入的主观偏差对模型预测性能的影响,本文选择来自PMU的底层量测数据作为输入特征,并采用一维卷积神经网络(1D-CNN)捕捉输入特征的时序信息;考虑数据集样本不平衡带来的预测精度下降问题,采用SVM-SMOTE算法对样本进行均衡化。算例仿真结果表明,本文所提出的模型实现了端到端的时序特征提取和暂态稳定评估,可满足在线评估准确性、快速性和可靠性的要求,且有效解决了不平衡数据集中失稳样本漏判率高的问题。 展开更多
关键词 电力系统 暂态稳定评估 SVM-smote算法 一维卷积神经网络
下载PDF
基于改进SMOTE的不平衡数据分类算法
5
作者 马宝霖 胡茜 《长春工业大学学报》 CAS 2024年第3期259-264,共6页
SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插... SMOTE算法是处理不平衡数据的一种经典的过采样算法,文中对该算法进行改进。首先采用k-means算法对原始数据进行聚类,利用类判别函数对聚类样本进行筛选,筛选出“安全样本”。然后利用新的过采样率对“安全样本”进行线性插值,并且在插值过程中采用LMKNN方法。分别将该算法与SMOTE、KNSMOTE应用至实际数据中,使用SVM分类算法分类并进行性能对比。结果表明,对Abalone、Ecoli等不平衡数据集分类时,文中使用的算法分类效果最佳,验证了该算法的有效性。 展开更多
关键词 不平衡数据 smote算法 SVM算法
下载PDF
基于SMOTE-SSA-CNN的开关柜故障诊断方法
6
作者 张玮 《电气传动》 2024年第10期83-89,共7页
开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对... 开关柜多源监测数据包含丰富的设备运行状态信息,对其进行分析可实现开关柜故障诊断。提出一种基于SMOTE-SSA-CNN的开关柜故障诊断方法。首先,以开关柜电压、电流和温湿度等监测数据为基础,采用合成少数类样本过采样技术(SMOTE)算法对原始数据集进行样本扩充,解决原始数据集中正负样本严重失衡的问题;然后引入麻雀搜索算法(SSA)对卷积神经网络(CNN)的卷积核大小与数量、全连接层神经元数量、学习率等超参数进行优化,提高模型故障诊断结果的准确率;最后,通过算例分析对建立的SMOTE-SSA-CNN模型性能进行评估,验证了所提方法对开关柜故障诊断的有效性,且与传统故障诊断方法相比,所提方法的收敛性较好,精度较高。 展开更多
关键词 开关柜 多源监测数据 合成少数类样本过采样技术算法 麻雀搜索算法 卷积神经网络
下载PDF
基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎的风险预警模型
7
作者 郑媛 邓维维 +2 位作者 刘芮菡 邓东玲 龚元 《全科护理》 2024年第16期3010-3014,共5页
目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回... 目的:基于SMOTE算法和Logistic回归分析构建肛周脓肿病人发生坏死性筋膜炎(NF)的预警模型。方法:回顾性选取2016年8月—2021年10月医院收治的1 780例肛周脓肿病人,依据病人术后是否合并NF将其分为发生NF组和未发生NF组,采用Logistic回归分析法筛选独立风险因素,构建预测模型,同时基于SMOTE算法改进数据集,构建改进数据集的预警模型并对比验证模型的预测效能。结果:年龄≥60岁、糖尿病史、CRP≥150 mg/dL、NLR≥15、血糖≥9 mmol/L、术前白蛋白≤32 g/L为肛周脓肿病人发生NF的独立风险因素(P<0.05)。Logistic预警模型P1的受试者工作特征(ROC)曲线下面积为0.825,SMOTE算法预警模型P2的ROC曲线下面积为0.939,两者均具有较高的预测精准度。结论:SMOTE算法预警模型对发生NF的概率计算精准,有利于提前干预,为病人的预后做好充分保障。 展开更多
关键词 肛周脓肿 坏死性筋膜炎 smote算法 LOGISTIC分析 预警模型
下载PDF
基于SMOTE-XGBoost算法的混凝土强度预测
8
作者 薛飞 《混凝土与水泥制品》 2024年第8期32-36,共5页
基于244组混凝土配合比构建了数据库,采用SMOTE-XGBoost算法对混凝土28 d抗压强度进行了预测。首先通过SMOTE算法对划分的训练集进行平衡处理;然后对比了SMOTE算法平衡前后XGBoost与常用混凝土强度预测模型的评估结果;最后进行了SMOTE-X... 基于244组混凝土配合比构建了数据库,采用SMOTE-XGBoost算法对混凝土28 d抗压强度进行了预测。首先通过SMOTE算法对划分的训练集进行平衡处理;然后对比了SMOTE算法平衡前后XGBoost与常用混凝土强度预测模型的评估结果;最后进行了SMOTE-XGBoost算法的实际工程验证。结果表明:SMOTE-XGBoost算法有效解决了数据不平衡问题,提高了预测模型的精度;相较于其他机器学习模型,SMOTE-XGBoost算法的预测结果较好;应用SMOTE-XGBoost算法对无岳高速WYTJ-07标段工程自制花岗岩混凝土的28 d抗压强度进行了预测,预测结果误差较小,该算法在工程混凝土强度预测方面具有广泛的应用前景。 展开更多
关键词 混凝土28 d抗压强度 机器学习 smote-XGBoost算法 预测
下载PDF
小样本下基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断
9
作者 葛平淑 王朝阳 +3 位作者 王阳 张涛 薛红涛 夏晨迪 《兵器装备工程学报》 CAS CSCD 北大核心 2024年第8期1-9,共9页
轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据... 轮毂电机复杂多变的运行环境可能导致轴承故障而危及电动车辆行驶安全,为解决传统故障诊断方法在小样本条件下识别精度低的问题,提出一种基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断方法。首先,通过合成少数过采样技术(SMOTE)扩展训练数据集,生成与真实样本分布相似的故障样本,并使用主成分分析(PCA)优化其时域和频域的特征。然后,通过引入非线性收敛因子和Levy飞行策略改进传统的灰狼优化算法(GWO),使用改进的灰狼优化算法(IGWO)优化随机森林(RF)模型的参数。最后,基于SMOTE-IGWO-RF的轮毂电机轴承故障诊断模型实现故障状态的识别,并在轮毂电机试验台架上进行了实验验证。结果表明,所提出的轮毂电机轴承故障诊断方法在7种转速工况下平均准确率均超过96%,具有高精度和稳定性。与遗传算法(GA)、粒子群优化算法(PSO)、GWO优化RF相比,提出的IGWO-RF模型在3种小样本训练集下的诊断准确率均超过90%,且准确率均明显高于其他3个对比算法,能够有效实现小样本条件下的轮毂电机轴承故障诊断。 展开更多
关键词 轮毂电机 轴承 合成少数类过采样技术(smote) 改进灰狼优化算法(IGWO) 随机森林(RF) 故障诊断
下载PDF
基于遗传算法和SMOTE的网络入侵检测模型优化研究
10
作者 戴周浩 《现代计算机》 2024年第7期24-30,共7页
针对网络入侵检测存在数据不平衡和特征冗余的问题,提出一种新的检测模型。该模型结合了遗传算法和SMOTE算法,通过对数据进行采样和特征选择,提高了网络入侵检测的准确性。首先,为了解决数据不平衡的状况,采用了SMOTE算法。这个算法通... 针对网络入侵检测存在数据不平衡和特征冗余的问题,提出一种新的检测模型。该模型结合了遗传算法和SMOTE算法,通过对数据进行采样和特征选择,提高了网络入侵检测的准确性。首先,为了解决数据不平衡的状况,采用了SMOTE算法。这个算法通过在入侵类样本中嵌入随机样本,有效地提高了入侵类样本的数量,使得数据达到平衡。其次,为了缓解特征冗余,引入了基于遗传算法和随机森林方法的包装式特征选择技术,选择有用特征,减少冗余信息,从而提升最终的入侵检测性能。最后,采用随机森林算法对经过上述处理的数据集进行分类,实现对网络入侵样本的有效检测。在NSL⁃KDD数据集上的实验表明,基于遗传算法和SMOTE的网络入侵检测模型从整体上提高了入侵检测的识别率。 展开更多
关键词 特征选择 smote过采样 随机森林 网络入侵检测 遗传算法
下载PDF
改进SMOTE的非平衡数据集分类算法研究 被引量:27
11
作者 赵清华 张艺豪 +1 位作者 马建芬 段倩倩 《计算机工程与应用》 CSCD 北大核心 2018年第18期168-173,共6页
针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本... 针对随机森林和SMOTE组合算法在处理不平衡数据集上存在数据集边缘化分布以及计算复杂度大等问题,提出了基于SMOTE的改进算法TSMOTE(triangle SMOTE)和MDSMOTE(Max Distance SMOTE),其核心思想是将新样本的产生限制在一定区域,使得样本集分布趋于中心化,用更少的正类样本点人为构造样本,从而达到限制样本区域、降低算法复杂度的目的。在6种不平衡数据集上的大量实验表明,改进算法与传统算法相比,算法消耗时间大幅减少,取得更高的G-mean值、F-value值和AUC值。 展开更多
关键词 随机森林 smote算法 不平衡数据集
下载PDF
基于SMOTE算法的颅脑损伤患者继发精神障碍预警模型 被引量:8
12
作者 孙秀彬 辛涛 +1 位作者 薛付忠 庞琦 《中国卫生统计》 CSCD 北大核心 2013年第6期790-793,共4页
目的分析颅脑损伤患者继发精神障碍的影响因素,同时考虑病例和非病例间数量不平衡的特点,构建基于SMOTE算法的logistic预警模型。方法根据2008年山东省18家医院的颅脑损伤患者继发精神障碍的数据,利用logistic回归分析筛选影响因素并建... 目的分析颅脑损伤患者继发精神障碍的影响因素,同时考虑病例和非病例间数量不平衡的特点,构建基于SMOTE算法的logistic预警模型。方法根据2008年山东省18家医院的颅脑损伤患者继发精神障碍的数据,利用logistic回归分析筛选影响因素并建立基于原始数据的预警模型;在此基础上,采用SMOTE过抽样算法改进数据集,并构建基于改进数据集的精神障碍预警模型。结果额叶脑挫伤、弥漫性轴索损伤、并发颅内感染、颞叶硬膜下血肿、颅盖骨线性骨折、颅内积气、患者性别和颅脑损伤严重程度(GCS评分)均为颅脑损伤患者发生精神障碍的危险因素;而基于SMOTE过抽样算法所构建预警模型的预测效果明显优于利用原始数据所建模型的效果。结论基于SMOTE过抽样算法所构建的预警模型能更准确预测颅脑损伤患者继发的精神障碍。 展开更多
关键词 smote算法 过抽样 颅脑损伤精神障碍
下载PDF
基于KM-SMOTE和随机森林的不平衡数据分类 被引量:22
13
作者 陈斌 苏一丹 黄山 《计算机技术与发展》 2015年第9期17-21,共5页
基于SMOTE算法的随机森林能够很好地处理不平衡数据集的分类,是一种通过对数据进行改造以达到良好分类要求的分类器。但SMOTE算法在处理不平衡数据后,可能会导致不平衡数据集分布的整体变化以及模糊正负类边界。这两个缺陷极易导致平衡... 基于SMOTE算法的随机森林能够很好地处理不平衡数据集的分类,是一种通过对数据进行改造以达到良好分类要求的分类器。但SMOTE算法在处理不平衡数据后,可能会导致不平衡数据集分布的整体变化以及模糊正负类边界。这两个缺陷极易导致平衡后的数据与原始数据集有很大差异,从而使分类结果有提高但仍旧不够理想。K-means算法能够有效地聚类,并达到对数据分布的描述。在此基础上,结合K-means算法与SMOTE算法,利用两者优点,文中提出了一种基于K-means的KM-SMOTE算法,有效地解决了上述两个问题。并用于随机森林分类器进行实验,结果表明,改进后的算法分类效果更加明显。 展开更多
关键词 smote算法 随机森林 不平衡数据集
下载PDF
基于SMOTE算法的化疗肿瘤患者下呼吸道感染预警模型构建 被引量:6
14
作者 王梅英 杨敏 +1 位作者 刘佳微 张慧琳 《中国感染控制杂志》 CAS CSCD 北大核心 2021年第12期1094-1101,共8页
目的构建基于少数类样本合成过抽样技术(synthetic minority over-sampling technique,SMOTE)算法的化学治疗(化疗)肿瘤患者下呼吸道感染预警模型。方法共纳入西宁市4所三级医院2019年1月—2021年6月收治的2384例接受化疗的肿瘤患者为... 目的构建基于少数类样本合成过抽样技术(synthetic minority over-sampling technique,SMOTE)算法的化学治疗(化疗)肿瘤患者下呼吸道感染预警模型。方法共纳入西宁市4所三级医院2019年1月—2021年6月收治的2384例接受化疗的肿瘤患者为研究对象,将所收集病例按照7∶3的比例随机分为建模组1668例和验证组716例,建模组数据用来建立模型,验证组数据对所建立的模型进行验证,利用单因素比较和logistic回归分析筛选下呼吸道感染影响因素,基于SMOTE算法建立化疗肿瘤患者下呼吸道感染预警模型。结果logistic回归分析可得,年龄(x_(1))、身体质量指数(BMI)值是否正常(x_(2))、恶性肿瘤分期(x_(3))、吸烟史(x_(4))、合并糖尿病(x_(5))、合并肺部疾病(x_(6))均是化疗肿瘤患者下呼吸道感染的危险因素(均P<0.01),获得原始数据预警模型:Logit(P)=0.055x_(1)+0.967x_(2)-0.195x_(3)+1.383x_(4)+0.968x_(5)+0.939x_(6)-14.073和基于SMOTE算法的预警模型:Logit(P)=0.090x_(1)+1.092x_(2)-0.249x_(3)+1.724x_(4)+1.136x_(5)+1.344x_(6)-14.859。基于SMOTE算法预警模型AUC为0.949(95%CI:0.937~0.961),高于原始数据预警模型AUC 0.780(95%CI:0.734~0.846)。结论基于SMOTE算法所构建的预警模型能更准确预警化疗肿瘤患者下呼吸道感染,有效解决感染与非感染患者样本数据不平衡所导致的预测误差,基于预测模型可选择相应的对策进行应对。 展开更多
关键词 smote算法 化疗 肿瘤 下呼吸道感染 预警模型
下载PDF
基于SMOTE算法和条件生成对抗网络的到港航班延误分类预测 被引量:7
15
作者 刘博 卢婷婷 +1 位作者 张兆宁 张健斌 《科学技术与工程》 北大核心 2021年第34期14843-14852,共10页
由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(condi... 由于航班延误数据集类别分布不均,传统分类器的性能受到一定程度的制约。为了能够对到港航班延误情况进行精准预测,提出了一种基于合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)算法和条件生成对抗网络(conditional generative adversarial nets,CGAN)的航班延误预测模型。首先,利用SMOTE算法对原始数据集进行上采样,并融合经过训练的CGAN生成指定样本数据集,缓解原始数据集中某些类别样本量少和数据非平衡等问题;再次,采用XGBoost模型在4种模式训练集上进行训练和超参数寻优;最后,以K近邻、支持向量机和随机森林为基准模型进行性能对比分析。经试验分析,通过分类器在融合样本集的训练,整体上可以在一定程度上提高模型的泛化性,尤其在轻度延误和中度延误类别中提升较为明显,与不采用融合方法比较,宏平均下的Precision、Recall、F_(1)-score值分别提升了0.16、0.29、0.24个百分点。实验结果表明,该方法能够有效地对航班延误非平衡数据进行建模,在保持模型整体性能较高的前提下,能够显著地提升少数类的预测能力,可以为空管、航空公司和机场等提供决策依据。 展开更多
关键词 航班延误 非平衡数据集 合成少数类过采样技术(smote)算法 条件生成对抗网络 XGBoost模型 分类问题
下载PDF
SMOTE过采样及其改进算法研究综述 被引量:60
16
作者 石洪波 陈雨文 陈鑫 《智能系统学报》 CSCD 北大核心 2019年第6期1073-1083,共11页
近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了... 近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了其4种扩展方法和3种应用的相关研究,最后分析了SMOTE应用于大数据、流数据、少量标签数据以及其他类型数据的现有研究和面临的问题,旨在为SMOTE的研究和应用提供有价值的借鉴和参考。 展开更多
关键词 不平衡数据分类 smote 算法 K-NN 过采样 欠采样 高维数据 分类型数据
下载PDF
基于SMOTE和决策树算法的电力变压器状态评估知识获取方法 被引量:40
17
作者 谢桦 陈俊星 +2 位作者 赵宇明 丁庆 张沛 《电力自动化设备》 EI CSCD 北大核心 2020年第2期137-142,共6页
提出基于合成少数过采样技术(SMOTE)算法和决策树算法的电力变压器状态评估知识获取方法,首先针对变压器非正常状态样本数量较少的情况,采用SMOTE算法补充非正常状态样本数量,解决了变压器样本集类别不平衡问题。然后将变压器状态评估... 提出基于合成少数过采样技术(SMOTE)算法和决策树算法的电力变压器状态评估知识获取方法,首先针对变压器非正常状态样本数量较少的情况,采用SMOTE算法补充非正常状态样本数量,解决了变压器样本集类别不平衡问题。然后将变压器状态评估过程视为分类过程,利用决策树模型为白箱模型的特点,将变压器状态评估知识获取问题转化为构建决策树的问题。最后采用C4.5决策树算法构建决策树,从中提取变压器状态评估知识,得到关键变压器状态量和评估规则。以某地市级供电公司110 kV电压等级油浸式变压器实际数据开展实例分析,结果表明所提出的方法能实现状态评估知识的自动化获取,可以为该地区110 kV油浸式变压器的状态评估工作提供决策支持。 展开更多
关键词 电力变压器 知识获取 决策树算法 smote 数据挖掘
下载PDF
基于CPD-SMOTE的类不平衡数据分类算法研究 被引量:7
18
作者 彭如香 杨涛 +2 位作者 孔华锋 姜国庆 凡友荣 《计算机应用与软件》 北大核心 2018年第12期259-262,268,共5页
类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Techn... 类不平衡现象普遍存在于不同应用领域中,如金融欺诈、网络入侵、垃圾邮件过滤、医学检测,直接采用传统的学习分类算法,分类准确率较低。针对类不平衡情况对分类器的影响,基于传统过采样算法SMOTE(Synthetic Minority Oversampling Technique)算法处理类不平衡的有效性,致力进一步提升SMOTE算法性能,提出一种面向类不平衡数据集分类的改进型SMOTE算法——CPD-SMOTE算法。通过考虑训练集小样本的特征、位置及其周围样本分布,来确定小样本的强相关邻居集,以此作为SMOTE最近邻居集,产生新的小样本。实验结果表明,CPD-SMOTE算法在处理不平衡数据集上相比SMOTE、Borderline-SMOTE、ADASYN、LN-SMOTE等算法有所提高。 展开更多
关键词 smote 类不平衡 分类算法
下载PDF
融合最大相异系数密度的SMOTE算法的入侵检测方法 被引量:3
19
作者 陈虹 肖越 +1 位作者 肖成龙 陈建虎 《信息网络安全》 CSCD 北大核心 2019年第3期61-71,共11页
基于机器学习的入侵检测方法应用于非平衡入侵数据集时,大多专注于提升整体检测率与降低整体漏报率,但少数类的检测率较低,在实际应用中良好的少数类分类性能同样具有重要意义。因此,文章提出一种基于最大相异系数密度的SMOTE(Synthetic... 基于机器学习的入侵检测方法应用于非平衡入侵数据集时,大多专注于提升整体检测率与降低整体漏报率,但少数类的检测率较低,在实际应用中良好的少数类分类性能同样具有重要意义。因此,文章提出一种基于最大相异系数密度的SMOTE(Synthetic Minority Oversampling Technique)算法与深度信念网络(DBN)和梯度提升决策树(GBDT)的入侵检测方法。其核心思想为:在数据预处理阶段,应用基于最大相异系数密度的SMOTE算法进行数据过采样及深度信念网络进行特征提取,提高少数类样本数量同时降低样本维数;在生成的平衡数据集上,训练梯度提升决策树分类器,并利用NSLKDD数据集进行了实验验证。实验结果表明,所提方法在保持较高的整体检测率的同时,少数类检测效果提升明显,提升了入侵检测方法对于少数类攻击的检测能力。 展开更多
关键词 入侵检测 最大相异系数 密度 smote算法 DBN GBDT
下载PDF
非平衡数据集的改进SMOTE再抽样算法 被引量:22
20
作者 薛薇 《统计研究》 CSSCI 北大核心 2012年第6期95-98,共4页
非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本。实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获... 非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本。实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获得较理想的分类效果。 展开更多
关键词 smote算法 再抽样 非平衡数据集
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部