期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向不平衡数据集分类模型的优化研究 被引量:13
1
作者 温雪岩 陈家男 +1 位作者 景维鹏 徐克生 《计算机工程》 CAS CSCD 北大核心 2018年第4期268-273,293,共7页
为提高不平衡数据集的分类效率,建立一种分类模型,从样本采样和分类算法两方面进行优化。对决策边界的少类样本进行循环过采样生成新样本集,并与决策边界外合成的少类样本集合并,提高样本的重要度。针对传统ε-支持向量机(ε-SVM)在对... 为提高不平衡数据集的分类效率,建立一种分类模型,从样本采样和分类算法两方面进行优化。对决策边界的少类样本进行循环过采样生成新样本集,并与决策边界外合成的少类样本集合并,提高样本的重要度。针对传统ε-支持向量机(ε-SVM)在对不平衡数据集分类时超平面偏移的问题,引入正负惩罚系数和混合核函数,并利用客观的熵值法选取惩罚系数,提高分类算法的性能。实验结果表明,与标准的SVM算法相比,该分类模型在不平衡数据集分类上F-measure值平均提高18.1%,具有较好的分类效果。 展开更多
关键词 文本分类 不均衡数据集 数据挖掘 样本重采样 熵值法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部