摘要
支持向量机算法是一个传统且成熟的机器学习模型,该算法在分类场景下广泛应用,而核函数选择是影响支持向量机分类效果的核心因素之一。本文通过控制变量方法,选取多种多分类数据进行实验,探究样本数据的数据特征维度、训练样本数量、数据分类数量对于线性核函数、多项式核函数、高斯核函数、Sigmoid核函数四种传统主要核函数分类正确率效果的影响。实验中发现数据集的特征维度大小、训练集数量与支持向量机算法最后的识别正确率呈正相关,数据集的分类数和识别正确率呈负相关;使用高斯核函数的支持向量机算法识别效果优于其他三种核函数的识别效果;线性核函数适合于训练集数量较少的情况,在训练集数量较多时可以选择高斯核函数,高斯核函数对于数据集特征维度大小并不敏感,都较优于其他三个核函数的效果。
基金
2022年北华航天工业学院硕士研究生创新资助项目(YKY-2022-42)。