针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其...针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其处理数据时减少小区块的影响;降低数据不平衡度以优化分类器组;在扩展的数据集上训练SVM分类器。标准数据集上的实验结果表明,与几种经典的算法相比,SS-SVM在多类不平衡数据分类上可获得令人满意的分类结果,对少类数据分类精度要求较高的问题尤为有效。展开更多
对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用...对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用结合阈值的方法对Ada Boost分类器进行了改进;针对下采样造成的数据信息丢失问题,在平衡训练集上利用集成的思想,将多个子分类器学习成强分类器。实验结果表明,在公开的几种UCI数据集上,该算法相对其他几种经典算法,在小类的F-score值和整体数据集的G-mean值上取得了理想的效果。展开更多
文摘针对多类不平衡数据分类准确率低的问题,提出一种基于空间扩展的支持向量机学习算法(support vector machine algorithm based on space spreading,SS-SVM)。根据空间扩展原理,在多维欧式空间中通过空间扩展对少类数据进行上采样,使其处理数据时减少小区块的影响;降低数据不平衡度以优化分类器组;在扩展的数据集上训练SVM分类器。标准数据集上的实验结果表明,与几种经典的算法相比,SS-SVM在多类不平衡数据分类上可获得令人满意的分类结果,对少类数据分类精度要求较高的问题尤为有效。
文摘对于类别不平衡问题,提出了一种多类类别不平衡数据分类的算法——基于改进的Ada Boost的组合算法(Ensemble Ada Boost.M)。为了避免随机欠采样对数据分布的改变,采用基于样本均值分布的方法进行采样;为解决上采样产生的噪音数据,利用结合阈值的方法对Ada Boost分类器进行了改进;针对下采样造成的数据信息丢失问题,在平衡训练集上利用集成的思想,将多个子分类器学习成强分类器。实验结果表明,在公开的几种UCI数据集上,该算法相对其他几种经典算法,在小类的F-score值和整体数据集的G-mean值上取得了理想的效果。