-
题名用双层减样法优化大规模SVM垃圾标签检测模型
被引量:5
- 1
-
-
作者
覃希
苏一丹
-
机构
广西工学院计算机工程系
广西大学计算机与电子信息学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第6期2095-2098,共4页
-
基金
广西工学院自然科学基金资助项目(院科自1074011)
-
文摘
针对支持向量机在训练大规模数据集时出现的速度瓶颈问题,提出一种新的减样方法,称为双层减样法。数据减样时,双层减样法从粗、细粒度两个层次削减样本。粗粒度约减时,利用核空间距离聚类法,以簇为单位削减冗余子集;细粒度约减时,以点为单位挑选剩余点集中的支持向量。实验表明,双层减样法能有效地压缩样本数据,同时还能放大数据集的分类特征,提高分类器的分类精度。将此法应用于大规模SVM垃圾标签检测模型的训练集优化上,能明显提高检测模型的训练速度。双层减样法将粒度和层次的概念引入减样法中,在约减时适时改变约减幅度,这比传统减样法更具有优势。
-
关键词
FOLKSONOMY
垃圾标签
支持向量机
双层减样法
约减
-
Keywords
Folksonomy
social spam
SVM
double-layer reduction method
reduce
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-