期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
处理多类不平衡数据的SVM分类算法 被引量:7
1
作者 李珍香 王文剑 郭虎升 《计算机工程与设计》 CSCD 北大核心 2014年第7期2499-2503,共5页
针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其... 针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其处理数据时减少小区块的影响;降低数据不平衡度以优化分类器组;在扩展的数据集上训练SVM分类器。标准数据集上的实验结果表明,与几种经典的算法相比,SS-SVM在多类不平衡数据分类上可获得令人满意的分类结果,对少类数据分类精度要求较高的问题尤为有效。 展开更多
关键词 多类不平衡数据 支持向量机 空间扩展 小区快 上采样 SS-SVM算法
下载PDF
一种面向多类不平衡协议流量的改进AdaBoost.M2算法 被引量:3
2
作者 张仁斌 张杰 吴佩 《计算机应用研究》 CSCD 北大核心 2019年第6期1863-1867,共5页
针对AdaBoost.M2算法在解决多类不平衡协议流量的分类问题时存在不足,提出一种适用于因特网协议流量多类不平衡分类的集成学习算法RBWS-ADAM2,本算法在AdaBoost.M2每次迭代过程中设计了基于权重的随机平衡重采样策略对训练数据进行预处... 针对AdaBoost.M2算法在解决多类不平衡协议流量的分类问题时存在不足,提出一种适用于因特网协议流量多类不平衡分类的集成学习算法RBWS-ADAM2,本算法在AdaBoost.M2每次迭代过程中设计了基于权重的随机平衡重采样策略对训练数据进行预处理,该策略利用随机设置采样平衡点的重采样方式来更改多数类和少数类的样本数目占比,以构建多个具有差异性的训练集,并将样本权重作为样本筛选的依据,尽可能保留高权重样本,以加强对此类样本的学习。在国际公开的协议流量数据集上将RBWS-ADAM2算法与其他类似算法进行实验比较表明,相比于其他算法,该算法不仅对部分少数类的F-measure有较大提升,更有效提高了集成分类器的总体G-mean和总体平均F-measure,明显增强了集成分类器的整体性能。 展开更多
关键词 流量分 集成学习算法 多类不平衡 泛化性能
下载PDF
多类不平衡数据上的分类器性能比较研究 被引量:5
3
作者 倪黄晶 王蔚 《计算机工程》 CAS CSCD 北大核心 2011年第10期160-161,164,共3页
不同的基分类器对不同分布类型的多类别不平衡数据的适应性存在较大差异。为此,针对分类器的选用问题,在分析比较准确率(ACC)及曲线下面积(AUC)的评价标准基础上,选择基于AUC的分类器评价方法,将支持向量机、决策树和贝叶斯分类器应用... 不同的基分类器对不同分布类型的多类别不平衡数据的适应性存在较大差异。为此,针对分类器的选用问题,在分析比较准确率(ACC)及曲线下面积(AUC)的评价标准基础上,选择基于AUC的分类器评价方法,将支持向量机、决策树和贝叶斯分类器应用于标准数据集中,并采用AUC来评价结果,得出相关结论:在多类不平衡数据上,贝叶斯是最好的基分类器,且SVM分类器存在一定改进空间。 展开更多
关键词 多类不平衡数据 基分 ROC曲线下面积 准确率
下载PDF
多类不平衡数据分类方法综述 被引量:4
4
作者 李昂 韩萌 +2 位作者 穆栋梁 高智慧 刘淑娟 《计算机应用研究》 CSCD 北大核心 2022年第12期3534-3545,共12页
现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平... 现实中许多领域产生的数据通常具有多个类别并且是不平衡的。在多类不平衡分类中,类重叠、噪声和多个少数类等问题降低了分类器的能力,而有效解决多类不平衡问题已经成为机器学习与数据挖掘领域中重要的研究课题。根据近年来的多类不平衡分类方法的文献,从数据预处理和算法级分类方法两方面进行了分析与总结,并从优缺点和数据集等方面对所有算法进行了详细分析。在数据预处理方法中,介绍了过采样、欠采样、混合采样和特征选择方法,对使用相同数据集算法的性能进行了比较。从基分类器优化、集成学习和多类分解技术三个方面对算法级分类方法展开介绍和分析。最后对多类不平衡数据分类研究领域的未来发展方向进行总结归纳。 展开更多
关键词 多类不平衡数据 数据预处理方法 算法级分方法
下载PDF
基于多类不平衡分类的改进AdaBoost算法研究
5
作者 吴萌 侯凌燕 杨大利 《北京信息科技大学学报(自然科学版)》 2018年第1期76-81,共6页
对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用... 对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用结合阈值的方法对Ada Boost分类器进行了改进;针对下采样造成的数据信息丢失问题,在平衡训练集上利用集成的思想,将多个子分类器学习成强分类器。实验结果表明,在公开的几种UCI数据集上,该算法相对其他几种经典算法,在小类的F-score值和整体数据集的G-mean值上取得了理想的效果。 展开更多
关键词 多类不平衡 均值分布 阈值 ADABOOST 集成
下载PDF
非平衡概念漂移数据流主动学习方法
6
作者 李艳红 王甜甜 +1 位作者 王素格 李德玉 《自动化学报》 EI CAS CSCD 北大核心 2024年第3期589-606,共18页
数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真... 数据流分类研究在开放、动态环境中如何提供更可靠的数据驱动预测模型,关键在于从实时到达且不断变化的数据流中检测并适应概念漂移.目前,为检测概念漂移和更新分类模型,数据流分类方法通常假设所有样本的标签都是已知的,这一假设在真实场景下是不现实的.此外,真实数据流可能表现出较高且不断变化的类不平衡比率,会进一步增加数据流分类任务的复杂性.为此,提出一种非平衡概念漂移数据流主动学习方法 (Active learning method for imbalanced concept drift data stream, ALM-ICDDS).定义基于多预测概率的样本预测确定性度量,提出边缘阈值矩阵的自适应调整方法,使得标签查询策略适用于类别数较多的非平衡数据流;提出基于记忆强度的样本替换策略,将难区分、少数类样本和代表当前数据分布的样本保存在记忆窗口中,提升新基分类器的分类性能;定义基于分类精度的基分类器重要性评价及更新方法,实现漂移后的集成分类器更新.在7个合成数据流和3个真实数据流上的对比实验表明,提出的非平衡概念漂移数据流主动学习方法的分类性能优于6种概念漂移数据流学习方法. 展开更多
关键词 数据流分 主动学习 概念漂移 多类不平衡
下载PDF
一种适用于多类不平衡数据集的模糊关联分类方法 被引量:7
7
作者 霍纬纲 高小霞 《控制与决策》 EI CSCD 北大核心 2012年第12期1833-1838,共6页
提出一种适用于多类不平衡分布情形下的模糊关联分类方法,该方法以最小化AdaBoost.M1W集成学习迭代过程中训练样本的加权分类错误率和子分类器中模糊关联分类规则数目及规则中所含模糊项的数目为遗传优化目标,实现了AdaBoost.M1W和模糊... 提出一种适用于多类不平衡分布情形下的模糊关联分类方法,该方法以最小化AdaBoost.M1W集成学习迭代过程中训练样本的加权分类错误率和子分类器中模糊关联分类规则数目及规则中所含模糊项的数目为遗传优化目标,实现了AdaBoost.M1W和模糊关联分类建模过程的较好融合.通过5个多类不平衡UCI标准数据集和现有的针对不平衡分类问题的数据预处理方法实验对比结果,表明了所提出的方法能显著提高多类不平衡情形下的模糊关联分类模型的分类性能. 展开更多
关键词 模糊关联分 多类不平衡 遗传算法 集成学习 数据挖掘
原文传递
一种基于改进BTS的多类非平衡分类的集成学习方法
8
作者 汤志亚 赵亮 +2 位作者 杨玲 甄小琼 杨志鹏 《商丘师范学院学报》 CAS 2015年第6期30-34,共5页
提出一种适用于多类不平衡数据的集成学习方法,以解决多类样本分布不均衡问题.首先,利用合成少类样本的过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)得到一组类别平衡的训练集.然后,对每个训练集采用二叉树支持向量机... 提出一种适用于多类不平衡数据的集成学习方法,以解决多类样本分布不均衡问题.首先,利用合成少类样本的过采样技术(Synthetic Minority Over-sampling Technique,SMOTE)得到一组类别平衡的训练集.然后,对每个训练集采用二叉树支持向量机(SVM of Binary Tree,BTS)进行训练,最后,采用Bagging进行集成.通过5组UCI测试数据表明该算法在Gmean参数上比SMOTEBagging算法提高2.55%. 展开更多
关键词 多类不平衡 集成方法 二叉树支持向量机 SMOTE算法
下载PDF
面对类别不平衡的增量在线序列极限学习机 被引量:1
9
作者 左鹏玉 周洁 王士同 《智能系统学报》 CSCD 北大核心 2020年第3期520-527,共8页
针对在线序列极限学习机对于类别不平衡数据的学习效率低、分类准确率差的问题,提出了面对类别不平衡的增量在线序列极限学习机(IOS-ELM)。该算法根据类别不平衡比例调整平衡因子,利用分块矩阵的广义逆矩阵对隐含层节点数进行寻优,提高... 针对在线序列极限学习机对于类别不平衡数据的学习效率低、分类准确率差的问题,提出了面对类别不平衡的增量在线序列极限学习机(IOS-ELM)。该算法根据类别不平衡比例调整平衡因子,利用分块矩阵的广义逆矩阵对隐含层节点数进行寻优,提高了模型对类别不平衡数据的在线处理能力,最后通过14个二类和多类不平衡数据集对该算法有效性和可行性进行验证。实验结果表明:该算法与同类其他算法相比具有更好的泛化性和准确率,适用于类别不平衡场景下的在线学习。 展开更多
关键词 不平衡学习 增量 无逆矩阵 在线学习 极限学习机 多类不平衡 神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部