期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
ADASYN与类别逆比例加权法在阿尔茨海默病不平衡数据中的应用
1
作者 杨慧 易付良 +7 位作者 陈杜荣 秦瑶 韩红娟 崔靖 白文琳 马艺菲 张荣 余红梅 《中国卫生统计》 CSCD 北大核心 2024年第2期175-180,共6页
目的利用自适应合成抽样(adaptive synthetic sampling,ADASYN)与类别逆比例加权法处理类别不平衡数据,结合分类器构建模型对阿尔茨海默病(alzheimer′s disease,AD)患者疾病进程进行分类预测。方法数据源自阿尔茨海默病神经影像学计划(... 目的利用自适应合成抽样(adaptive synthetic sampling,ADASYN)与类别逆比例加权法处理类别不平衡数据,结合分类器构建模型对阿尔茨海默病(alzheimer′s disease,AD)患者疾病进程进行分类预测。方法数据源自阿尔茨海默病神经影像学计划(Alzheimer′s disease neuroimaging initiative,ADNI),经随机森林填补缺失值,弹性网络筛选特征子集后,利用ADASYN与类别逆比例加权法处理类别不平衡数据。分别结合随机森林(random forest,RF)、支持向量机(support vector machine,SVM)构建四种模型:ADASYN-RF、ADASYN-SVM、加权随机森林(weighted random forest,WRF)、加权支持向量机(weighted support vector machine,WSVM),与RF、SVM比较分类性能。模型评价指标为宏观平均精确率(macro-average of precision,macro-P)、宏观平均召回率(macro-average of recall,macro-R)、宏观平均F1值(macro-average of F1-score,macro-F1)、准确率(accuracy,ACC)、Kappa值和AUC(area under the ROC curve)。结果ADASYN-RF的分类性能最优(Kappa值为0.938,AUC为0.980),ADASYN-SVM次之。利用ADASYN-RF预测得到的重要分类特征分别为CDRSB、LDELTOTAL、MMSE,在临床上均可得到证实。结论ADASYN与类别逆比例加权法都能辅助提升分类器性能,但ADASYN算法更优。 展开更多
关键词 类别不平衡 adasyn 加权法 阿尔茨海默病 分类
下载PDF
基于ADASYN-XGBoost算法的光伏出力预测研究
2
作者 凌煦 周晓刚 +2 位作者 陈文哲 符向前 黄社华 《中国农村水利水电》 北大核心 2024年第6期266-270,共5页
随着光伏发电大规模并入电网,由此产生的源端可供电量不确定性问题日益突出,精准预测光伏出力,对电网资源优化配置、提升光伏消纳能力起着关键的支撑作用。通过研究影响光伏出力的关键要素,以历史气象特征数据为输入构建光伏出力预测模... 随着光伏发电大规模并入电网,由此产生的源端可供电量不确定性问题日益突出,精准预测光伏出力,对电网资源优化配置、提升光伏消纳能力起着关键的支撑作用。通过研究影响光伏出力的关键要素,以历史气象特征数据为输入构建光伏出力预测模型,在实践过程中,对存在的主客观问题,从算法层面进行了模型优化。(1)针对光伏电站历史运行样本量小、气象特征变化多,导致诸多稀疏特征样本的问题,引入了ADASYN自适应采用算法,进行数据集重平衡;(2)通过XGBoost算法搭建了基于气象特征的光伏出力模型,并与传统的BP神经网络进行比较。通过某光伏电站的实际历史数据预测结果比较,结合ADASYN过采样和XGBoost算法,能有效提升模型的准确性;较BP神经网络相比,ADASYN-XGBoost算法的MAE、RMSE、MAPE和R2分别提高了66.7%、68.9%、58.0%和1.6%,评估指标明显优化。 展开更多
关键词 光伏 adasyn 出力预测 XGBoost算法
下载PDF
基于ADASYN-GS-XGBOOST混合模型的火山岩测井岩性识别
3
作者 宋梓豪 巩红雨 +2 位作者 冉爱华 杨鹏辉 刘迪仁 《海相油气地质》 CSCD 北大核心 2024年第2期188-196,共9页
火山岩的形成环境复杂,有些地区的火山岩可能只发育两三种岩石类型,这会导致不同岩性取心资料的代表性严重失衡。针对现有的测井岩性识别方法在处理类间不均衡样本时出现效果较差的问题,提出基于ADASYNGS-XGBOOST混合模型的火山岩岩性... 火山岩的形成环境复杂,有些地区的火山岩可能只发育两三种岩石类型,这会导致不同岩性取心资料的代表性严重失衡。针对现有的测井岩性识别方法在处理类间不均衡样本时出现效果较差的问题,提出基于ADASYNGS-XGBOOST混合模型的火山岩岩性识别方法。首先通过ADASYN过采样算法对不均衡样本进行处理得到新的样本集,再以XGBOOST算法作为基分类器对样本进行分类,并利用网格搜索法(GS)对模型进行参数优化,以此建立ADASYN-GS-XGBOOST混合岩性识别模型。将该混合模型训练后的结果与K近邻、朴素贝叶斯、随机森林、XGBOOST及SMOTE-GS-XGBOOST等算法的岩性识别结果进行对比,表明基于ADASYN-GS-XGBOOST算法建立的模型识别效果最好。该方法克服了已有岩性识别方法无法有效解决不均衡样本的问题,极大地提升了火山岩岩性识别的准确率。 展开更多
关键词 adasyn算法 XGBOOST算法 混合模型 火山岩 测井 岩性识别
下载PDF
基于ADASYN数据平衡化的PSO-BPNN变压器套管故障诊断
4
作者 杨昊 胡文秀 +3 位作者 张璐 陈晋鹏 周思佳 赵思瑞 《电力工程技术》 北大核心 2024年第2期170-178,共9页
变压器套管作为设备重要的绝缘部件,其绝缘性能直接影响着设备的安全运行。为诊断变压器套管绝缘状态,改善变压器套管油中溶解气体的小样本不平衡数据对变压器套管故障诊断结果的影响,使用粒子群优化结合反向传播神经网络(particle swar... 变压器套管作为设备重要的绝缘部件,其绝缘性能直接影响着设备的安全运行。为诊断变压器套管绝缘状态,改善变压器套管油中溶解气体的小样本不平衡数据对变压器套管故障诊断结果的影响,使用粒子群优化结合反向传播神经网络(particle swarm optimization combined with back propagation neural network,PSO-BPNN)和自适应综合过采样(adaptive synthetic sampling,ADASYN)算法对变压器套管进行故障诊断。首先收集变压器套管的历史故障数据,建立具有明确故障类别的变压器套管油中溶解气体样本集,并通过ADASYN算法对原始数据中的少数类样本进行合成,得到平衡后的故障数据,然后将平衡后的油中溶解气体作为模型输入,故障状态作为标签输出,通过PSO-BPNN模型对变压器套管进行诊断,最后在原始样本集下使用反向传播神经网络(back propagation neural network,BPNN)、遗传结合反向传播神经网络(genetic combined with back propagation neural network,G-BPNN)算法、布谷鸟搜索结合反向传播神经网络(cuckoo search combined with back propagation neural network,CS-BPNN)算法以及PSO-BPNN模型对套管进行诊断。结果表明,针对变压器油纸套管绝缘状态进行故障诊断的多个模型中,基于ADASYN平衡数据后的PSO-BPNN模型和其他模型相比准确度最高,能有效减小小样本不平衡数据对诊断结果的影响,为判断变压器油纸套管绝缘性能提供了有效方法。 展开更多
关键词 变压器套管 故障诊断 油中溶解气体 反向传播神经网络(BPNN) 不平衡数据 自适应综合过采样(adasyn)
下载PDF
基于ADASYN和Stacking集成的南太平洋黄鳍金枪鱼渔场预报模型研究 被引量:1
5
作者 张聪 周为峰 樊伟 《海洋渔业》 CSCD 北大核心 2023年第5期544-558,共15页
为提供更为准确的南太平洋黄鳍金枪鱼(Thunnus albacores)渔场预报信息,针对传统渔场分类问题中渔场和非渔场样本数据分布不均衡的问题,提出了一种基于自适应综合过采样(ADASYN)和Stacking集成的渔场分类模型——A-Stacking模型。利用2... 为提供更为准确的南太平洋黄鳍金枪鱼(Thunnus albacores)渔场预报信息,针对传统渔场分类问题中渔场和非渔场样本数据分布不均衡的问题,提出了一种基于自适应综合过采样(ADASYN)和Stacking集成的渔场分类模型——A-Stacking模型。利用2008—2019年南太平洋黄鳍金枪鱼的渔业数据,结合时空因子、海洋环境因子共32个特征要素(月份、经纬度、海平面异常、涡动能、叶绿素a浓度、叶绿素梯度、叶绿素距平、海表温度梯度、海表温度距平以及0~500 m水层的垂直温度和盐度)建立了南太平洋黄鳍金枪鱼渔场预报模型。为了验证模型的可靠性,将CART、Adaboost、GBDT、XGBoost、KNN、RF和Stacking模型对照。结果显示,A-Stacking模型具有更高的准确率、召回率、F1-score、G-mean和AUC值,且模型的ROC曲线和PR曲线能较好地包含其他模型,表明模型的分类效果更好。研究表明,A-Stacking集成模型对南太平洋黄鳍金枪鱼渔场的预报效果较好,能有效处理不均衡数据的渔场分类问题,可为今后的渔场预报方法提供参考。 展开更多
关键词 渔场预报 adasyn STACKING 分类 黄鳍金枪鱼 南太平洋
下载PDF
基于ADASYN的跨境电商小微企业信用风险模型优化研究 被引量:2
6
作者 李志强 余炫朴 《江西师范大学学报(哲学社会科学版)》 北大核心 2023年第2期118-127,共10页
随着数字经济在我国的不断发展,数字经济技术为地方企业带来新的机遇与挑战。聚焦跨境电商小微企业信用风险管理,并以江西为例建立符合江西跨境电商实际发展境况的企业信用风险评价指标。随后分别使用BP神经网络、K近邻及支持向量机机... 随着数字经济在我国的不断发展,数字经济技术为地方企业带来新的机遇与挑战。聚焦跨境电商小微企业信用风险管理,并以江西为例建立符合江西跨境电商实际发展境况的企业信用风险评价指标。随后分别使用BP神经网络、K近邻及支持向量机机器学习分类模型,对江西跨境电商小微企业进行信贷违约预测。实证结果显示:三种深度学习分类模型均具有良好的准确性。为进一步优化江西跨境电商小微企业信用风险模型,特引入ADASYN算法,研究结果显示:ADASYN算法优化了三种模型的预测准确度。将模型的计算效率用于衡量模型的优秀程度,发现ADASYN—KNN综合时效性最佳。 展开更多
关键词 机器学习 adasyn 跨境电商小微企业 信用风险
下载PDF
基于非均衡数据的ADASYN-CatBoost测井岩性智能识别——以胶西北招贤金矿床为例
7
作者 许方颖 邹艳红 +2 位作者 易卓炜 杨福强 毛先成 《黄金科学技术》 CSCD 2023年第5期721-735,共15页
快速准确地识别覆盖区下伏地层与岩体,对于金属矿山地质找矿工作具有重要意义。针对矿床地层与岩体中复杂岩性分布的多样性和非均衡性,考虑测井响应特征与岩性之间的强非线性关系,提出了一种基于ADASYN非均衡数据处理和CatBoost机器学... 快速准确地识别覆盖区下伏地层与岩体,对于金属矿山地质找矿工作具有重要意义。针对矿床地层与岩体中复杂岩性分布的多样性和非均衡性,考虑测井响应特征与岩性之间的强非线性关系,提出了一种基于ADASYN非均衡数据处理和CatBoost机器学习的测井岩性智能识别方法。首先,利用ADASYN算法处理非均衡测井样本数据,根据小类样本加权分布生成合成样本;然后,采用CatBoost算法结合网格搜索以及十折交叉验证建立最优岩性识别模型;最后,通过模型输出的特征重要性及部分依赖图对岩性分类结果进行解译。以胶西北招贤金矿床实例测井数据为基础,针对10类岩性进行识别和解译分析,模型评价结果表明:测试集上的精确率、召回率和F1分数分别达到98.21%、98.20%和98.20%。将CatBoost岩性分类与GBDT、LightGBM算法进行对比,结果表明CatBoost分类效果最优,且均优于样本数据未均衡化处理的岩性识别效果。通过与实例录井剖面岩芯岩性进行对比,验证了模型分类结果的有效性。 展开更多
关键词 岩性识别 adasyn-CatBoost 测井 非均衡数据 机器学习 招贤金矿床
下载PDF
基于ADASYN-随机森林的智能家电内部电路故障诊断
8
作者 舒一飞 樊博 +2 位作者 康洁滢 郭汶昇 曾来 《兵工自动化》 2023年第1期51-56,共6页
针对智能家电内部电路故障诊断中存在的数据不平衡和分类器诊断精度低的问题,提出一种基于ADASYN算法过采样和随机森林(random forest,RF)的故障诊断方法。将电流信号进行小波包分解,提取最后一层各节点能量作为特征向量;使用ADASYN算... 针对智能家电内部电路故障诊断中存在的数据不平衡和分类器诊断精度低的问题,提出一种基于ADASYN算法过采样和随机森林(random forest,RF)的故障诊断方法。将电流信号进行小波包分解,提取最后一层各节点能量作为特征向量;使用ADASYN算法扩充训练数据集,得到随机森林故障诊断模型并进行测试。实验结果表明:ADASYN-随机森林故障诊断模型对智能家电内部电路故障具有较高的诊断精度,对故障诊断有一定的实用价值和指导意义。 展开更多
关键词 故障诊断 特征提取 小波包分解 adasyn算法 随机森林
下载PDF
基于ADASYN和Swin Transformer的滚动轴承故障诊断研究
9
作者 杜康宁 宁少慧 《机床与液压》 北大核心 2023年第15期209-215,共7页
针对实际工况下,正常样本丰富、故障样本稀缺的类别不平衡情形,导致基于深度学习的故障诊断模型诊断能力较差这一问题,提出一种基于自适应综合采样方法(ADASYN)和Swin Transformer的故障诊断模型。使用自适应综合采样方法,改善数据分布... 针对实际工况下,正常样本丰富、故障样本稀缺的类别不平衡情形,导致基于深度学习的故障诊断模型诊断能力较差这一问题,提出一种基于自适应综合采样方法(ADASYN)和Swin Transformer的故障诊断模型。使用自适应综合采样方法,改善数据分布,解决实际工况中故障样本与正常样本类别不平衡问题;使用Swin Transformer网络模型代替CNN网络,并使用深度迁移学习方法,使Swin Transformer网络模型掌握判别滚动轴承故障所需的浅层权重,深层权重通过反向传播方法训练获得;之后,将模型用于轴承故障测试,并对其进行调试;最后,将模型用于轴承故障实测,检验其实际工况下的诊断能力。实验结果表明:所提模型具有97%的诊断准确率,能够很好地适用于类别不平衡情形下的滚动轴承故障诊断。 展开更多
关键词 自适应综合采样 Swin Transformer模型 轴承故障诊断
下载PDF
基于ODR-ADASYN-SVM的极端金融风险预警研究 被引量:29
10
作者 林宇 黄迅 +1 位作者 淳伟德 黄登仕 《管理科学学报》 CSSCI 北大核心 2016年第5期87-101,共15页
针对合成少数类过采样(synthetic minority over-sampling technique,SMOTE)方法在提升支持向量机(support vector machine,SVM)的非均衡样本学习能力中出现的过拟合(over fitting),引入自适应合成抽样方法(adaptive synthetic sampling... 针对合成少数类过采样(synthetic minority over-sampling technique,SMOTE)方法在提升支持向量机(support vector machine,SVM)的非均衡样本学习能力中出现的过拟合(over fitting),引入自适应合成抽样方法(adaptive synthetic sampling approach,ADASYN)和逐级优化递减欠采样方法(optimization of decreasing reduction,ODR)分别克服SMOTE在生成新样本中的盲目性和在处理对象上的局限性,进而与SVM相结合,构造出改进SVM,即ODR-ADASYNSVM模型来预测中国极端金融风险;最后运用T检验对各模型预测精度的差异性进行显著性检验以及对各模型的预测稳定性进行评价.实证结果表明,ODR-ADASYN-SVM模型不仅能够显著地提升SVM的非均衡样本学习能力,同时也能够有效地克服SMOTE的过拟合,从而展示出优越的极端金融风险预测性能. 展开更多
关键词 ODR adasyn 支持向量机 极端金融风险 预警模型
下载PDF
基于ADASYN与AdaBoostSVM相结合的不平衡分类算法 被引量:10
11
作者 柳培忠 洪铭 +2 位作者 黄德天 骆炎民 王守觉 《北京工业大学学报》 CAS CSCD 北大核心 2017年第3期368-375,共8页
对于平衡数据集支持向量机(support vector machine,SVM)通常具有很好的分类性能和泛化能力,然而对于不平衡数据集,SVM只能得到次优结果,针对该问题提出了一种基于SVM的AS-Ada Boost SVM分类算法.首先,通过使用ADASYN采样,提高少类样本... 对于平衡数据集支持向量机(support vector machine,SVM)通常具有很好的分类性能和泛化能力,然而对于不平衡数据集,SVM只能得到次优结果,针对该问题提出了一种基于SVM的AS-Ada Boost SVM分类算法.首先,通过使用ADASYN采样,提高少类样本在边界区域的密度;然后,使用基于径向基核支持向量机(radial basis function kernel mapping support vector machine,RBFSVM)模型弱分类器的Ada Boost SVM算法训练得到决策分类器.通过将该算法在各种不平衡数据集上的测试结果与单纯运用ADASYN技术、Ada Boost SVM、SMOTEBoost等其他分类器进行比较,验证了该算法的有效性和鲁棒性. 展开更多
关键词 机器学习 不平衡数据 数据分类 adasyn AdaBoostSVM
下载PDF
ENN-ADASYN-SVM算法检测P2P僵尸网络的研究 被引量:7
12
作者 康松林 樊晓平 +2 位作者 刘乐 李宏 李明娟 《小型微型计算机系统》 CSCD 北大核心 2016年第2期216-220,共5页
由于对组织或个人采取针对性的攻击,僵尸网络对因特网构成越来越严重的威胁.并且不同的加密方法以及隐蔽的通信信道使得p2p僵尸网络越来越难以检测.之前有很多基于分类检测算法的文献都有很高的整体正确率,但是单独类并没有很高的正确率... 由于对组织或个人采取针对性的攻击,僵尸网络对因特网构成越来越严重的威胁.并且不同的加密方法以及隐蔽的通信信道使得p2p僵尸网络越来越难以检测.之前有很多基于分类检测算法的文献都有很高的整体正确率,但是单独类并没有很高的正确率.同时,之前的文献并没有考虑到正常的网络流量和僵尸网络流量严重不平衡的问题.为了解决以上两个问题,提出一种基于最近邻规则欠抽样方法(ENN)和ADASYN(Adaptive Synthetic Sampling)结合的不均衡数据SVM分类算法应用于P2P僵尸网络检测.实验结果表明,无论是僵尸网络还是正常的流量,该方法都具有很高的正确率,并能在短时间内达到很好的分类效果;较之其他算法,它更适合处理大规模网络实时环境中大量的原始数据,对统计数据依赖性小,对不均衡数据分类具有较好的鲁棒性.因此,基于不均衡数据ENN-ADASYN-SVM分类算法更适应于复杂多变的网络环境下的P2P僵尸网络检测. 展开更多
关键词 P2P僵尸网络检测 SVM 不均衡数据分类 最近邻规则欠抽样方法(ENN) adasyn
下载PDF
改进ADASYN-SDA的入侵检测模型研究 被引量:7
13
作者 陈虹 赵建智 +2 位作者 肖成龙 陈建虎 肖越 《计算机工程与应用》 CSCD 北大核心 2020年第2期97-105,共9页
针对传统入侵检测模型在高维数据且数据不均衡环境下检测性能较差的问题,提出了一种自适应过采样算法(ADASYN)与改进堆叠式降噪自编码器(SDA)结合的入侵检测模型。使用ADASYN算法进行数据过采样处理。使用Adam优化算法,以及Dropout正则... 针对传统入侵检测模型在高维数据且数据不均衡环境下检测性能较差的问题,提出了一种自适应过采样算法(ADASYN)与改进堆叠式降噪自编码器(SDA)结合的入侵检测模型。使用ADASYN算法进行数据过采样处理。使用Adam优化算法,以及Dropout正则化对SDA深度学习模型进行改进,提取出低维数、高鲁棒性的集成特征。在softmax分类器中进行入侵检测识别。实验结果表明,ADASYN-SDA模型相较于SDA、AE-DNN和MSVM模型,在平均准确率、检测率和误判率上均有一定程度的提高。 展开更多
关键词 堆叠式降噪自编码器(SDA) 自适应过采样算法(adasyn) 深度学习 入侵检测
下载PDF
我国系统性金融风险预警研究——基于时变CRITIC赋权法和ADASYN-SVM方法 被引量:3
14
作者 覃小兵 罗美娟 +1 位作者 黄迅 何姣 《金融监管研究》 CSSCI 北大核心 2022年第9期93-114,共22页
为加强金融监管和维护金融稳定,系统性金融风险有效预警已成为金融监管部门风险防范的首要工作。本文选取了能够表征我国金融体系5个系统的16个特征指标,基于2005年1月—2021年6月的周频数据,运用改进的时变CRITIC赋权法合成了我国金融... 为加强金融监管和维护金融稳定,系统性金融风险有效预警已成为金融监管部门风险防范的首要工作。本文选取了能够表征我国金融体系5个系统的16个特征指标,基于2005年1月—2021年6月的周频数据,运用改进的时变CRITIC赋权法合成了我国金融市场压力指数,据此对系统性金融风险进行识别,并回溯分析了风险成因。在此基础上,又运用自适应合成采样方法(ADASYN)对预警时所采用的非平衡样本进行处理,构建了基于四类不同核函数的ADASYN-SVM预警模型,来对我国系统性金融风险进行预警。实证结果表明:时变CRITIC赋权法能够充分反映各金融子系统之间的动态风险机制,既可避免在低压力期高估压力状态,又可实现在高压力期对压力状态的充分反映;债券市场压力往往是引起我国系统性金融压力的主要因素;需警惕外汇市场压力及外部冲击的影响;ADASYN-SVM预警模型具有很好的预警性能,不仅优于普通SVM模型,还优于基于BP神经网络和Logit的预警模型,是金融监管部门对系统性金融风险预警的有力工具。 展开更多
关键词 系统性金融风险 风险预警 时变CRITIC赋权法 adasyn-SVM模型
下载PDF
基于ADASYN-AdaBoost-CNN的信用风险评估模型 被引量:3
15
作者 徐文倩 《现代计算机》 2021年第28期39-44,共6页
数据失衡对信用风险评估模型的性能构成挑战,为了提高金融机构的风险控制能力,针对信用风险数据的不平衡现象,提出了一种基于ADASYN-AdaBoost-CNN的集成模型。首先采用ADASYN技术平衡数据集,减轻不平衡现象对信用风险评估的影响。其次... 数据失衡对信用风险评估模型的性能构成挑战,为了提高金融机构的风险控制能力,针对信用风险数据的不平衡现象,提出了一种基于ADASYN-AdaBoost-CNN的集成模型。首先采用ADASYN技术平衡数据集,减轻不平衡现象对信用风险评估的影响。其次构建基于卷积神经网络的集成学习算法,确保信用风险评估模型的准确性与鲁棒性。最后在lendingclub借贷数据集上开展实验,使用F1-measure、G-mean和AUC三个评价指标检验模型性能。结果表明,ADASYN-AdaBoost-CNN模型能够有效解决不平衡信用风险评估问题。 展开更多
关键词 adasyn 卷积神经网络 ADABOOST 不平衡 信用风险评估
下载PDF
基于ADASYN-SFS-RF的欺诈检测模型泛化性能提升及可解释性研究
16
作者 汪万敏 智路平 《计算机应用研究》 CSCD 北大核心 2022年第12期3605-3613,共9页
针对行业欺诈行为形式多样、操作隐蔽,且数据分布极端不平衡等问题,研究采用ADASYN(adaptive synthetic sampling approach for imbalanced learning)算法将分类决策边界向困难的实例进行自适应移动实现数据扩增,以解决不平衡数据造成... 针对行业欺诈行为形式多样、操作隐蔽,且数据分布极端不平衡等问题,研究采用ADASYN(adaptive synthetic sampling approach for imbalanced learning)算法将分类决策边界向困难的实例进行自适应移动实现数据扩增,以解决不平衡数据造成的过拟合问题。采用基于随机森林的序列向前搜索策略算法筛选出最优特征子集对欺诈进行检测,降低ADASYN算法添加噪声数据对分类边界确定的影响,构建欺诈检测模型,并使用LIME对模型检测结果作出局部解释,提高模型的使用价值。实验表明,该模型可以较好地克服传统欺诈检测模型对多数类样本误分类的缺陷,有助于提高行业对交易欺诈行为识别的效率。同时,通过LIME对模型检测出的随机样本进行有效解析,便于决策者对算法模型的检测结果作出实证分析,起到明显的预警及决策参考价值。 展开更多
关键词 欺诈检测 随机森林 adasyn LIME 特征选择
下载PDF
基于ODR-ADASYN-SVM模型的高新技术企业财务危机预警研究 被引量:1
17
作者 谭秋言 谭潇寒 《农村经济与科技》 2020年第1期141-145,共5页
高新技术企业对于我国经济发展的推动作用不言而喻,但同时其也具有高风险的特征,因此对高新技术企业进行财务危机预警研究,有着十分重大的意义。通过在我国A股市场中选择了42家被ST的高新技术企业和420家非ST的高新技术企业作为研究样本... 高新技术企业对于我国经济发展的推动作用不言而喻,但同时其也具有高风险的特征,因此对高新技术企业进行财务危机预警研究,有着十分重大的意义。通过在我国A股市场中选择了42家被ST的高新技术企业和420家非ST的高新技术企业作为研究样本,引入不平衡处理技术中的ODR(逐级优化递减欠采样)和ADASYN(自适应合成抽样方法)与传统SVM(支持向量机)相结合,构建了ODR-ADASYN-SVM模型,对高新技术企业财务危机预警进行研究。再将实证结果进行横向比较,与单一SVM模型、BAYES模型、KNN模型、DISTANCE模型等进行对比分析。实证结果表明:引入ODR-ADASYN数据处理方法有效地增强了SVM学习非均衡样本的能力,提高了模型的整体预测性能,能够有效地对高新技术企业进行财务危机预警。 展开更多
关键词 高新技术企业 财务危机预警 SVM ODR adasyn
下载PDF
基于ADASYN和WGAN的混合不平衡数据处理方法
18
作者 周万珍 盛媛媛 +1 位作者 张永强 马金龙 《河北工业科技》 CAS 2024年第4期291-298,共8页
为了解决不平衡数据集中少数类样本分类精度较低的问题,提出了一种处理不平衡数据集的ADASYN-WGAN方法。首先,采用ADASYN(adaptive synthetic sampling)算法生成少数类样本,用这些生成样本代替WGAN(wasserstein generative adversarial ... 为了解决不平衡数据集中少数类样本分类精度较低的问题,提出了一种处理不平衡数据集的ADASYN-WGAN方法。首先,采用ADASYN(adaptive synthetic sampling)算法生成少数类样本,用这些生成样本代替WGAN(wasserstein generative adversarial networks)中的随机噪声;其次,利用WGAN算法生成符合原始数据集分布规律的少数类样本,构建平衡数据集;然后,在6个公开数据集上,采用随机森林分类器对所提方法和4种过采样算法得出的处理结果分别与原始数据集进行对比;最后,通过F1-Score,G-mean和AUC等分类评估指标的表现验证所提方法的有效性。结果表明:在对比实验中,经过ADASYN-WGAN方法得到的平衡数据集在随机森林分类器的十折交叉验证中,4个公开数据集中的各项分类评估指标值均达到最优,虽然另2个公开数据集中的AUC值略低,但其F1-Score和G-mean取得了最高值。所提出的ADASYN-WGAN方法可生成高质量的数据样本,并可为解决不平衡数据集中少数类样本的预测偏差问题提供参考。 展开更多
关键词 数据处理 不平衡数据 WGAN adasyn 过采样方法 随机森林
下载PDF
基于人群特征的阿尔兹海默症分类方法
19
作者 胡建举 张晓龙 +1 位作者 曾燕 胡斐斐 《计算机与数字工程》 2024年第2期321-326,331,共7页
在阿尔兹海默症(Alzheimer’s disease,AD)分类研究中,图像、生物标志物等数据集包含的样本少,获取成本高。为应对这一问题,论文提出一种基于人群特征进行建模的方法,并在CMDS数据集上进行了实验。首先,使用PAR方法分析特征与AD之间的... 在阿尔兹海默症(Alzheimer’s disease,AD)分类研究中,图像、生物标志物等数据集包含的样本少,获取成本高。为应对这一问题,论文提出一种基于人群特征进行建模的方法,并在CMDS数据集上进行了实验。首先,使用PAR方法分析特征与AD之间的相关性,根据分析结果进行特征选择;然后,使用ADASYN算法解决训练集样本不平衡问题;最后,使用XGBoost算法进行训练,得到最终模型。该模型的准确率和召回率达到了79.5%和77.6%,AUC达到了0.83。实验结果证明了该方法的有效性。 展开更多
关键词 阿尔兹海默症 人群特征 adasyn PAR 机器学习
下载PDF
基于DBO-SVM的学生成绩三分类预测模型
20
作者 张广海 祖璇 王杨 《兰州文理学院学报(自然科学版)》 2024年第2期56-61,共6页
为提高学生学习效率和教师教学管理水平,提出基于DBO-SVM的学生成绩三分类预测模型.首先根据皮尔逊相关系数筛选特征属性;然后针对数据不均衡问题,经对比实验选用ADASYN技术;之后由螳螂优化算法通过迭代寻优支持向量机的参数;最后由支... 为提高学生学习效率和教师教学管理水平,提出基于DBO-SVM的学生成绩三分类预测模型.首先根据皮尔逊相关系数筛选特征属性;然后针对数据不均衡问题,经对比实验选用ADASYN技术;之后由螳螂优化算法通过迭代寻优支持向量机的参数;最后由支持向量机建立学生成绩三分类预测模型.在学生成绩数据集上进行测试,实验结果表明:本文方法预测准确率比SSA-SVM提高了2.09%,达到了91.67%;F1分数的加权平均值为0.92,证明了模型的稳定性. 展开更多
关键词 螳螂优化算法 支持向量机 adasyn技术 学生成绩预测
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部