-
题名基于SVM期望间隔的多标签分类的主动学习
被引量:7
- 1
-
-
作者
刘端阳
邱卫杰
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《计算机科学》
CSCD
北大核心
2011年第4期230-232,266,共4页
-
文摘
分类是数据挖掘领域研究中的核心技术之一。得到一个性能良好的分类器需要大量的训练样本,而对样本进行标记是一个十分消耗资源的过程,对多标签样本进行标记就更加困难。为了尽可能降低标记样本的成本,需要找出最能代表类别信息的样本。在基于SVM的分类方法中,分类器间隔越大,分类的精度就会越差。提出了一种基于期望间隔的主动学习方法,即依据当前分类器,选择最快缩小分类间隔的样本。通过实验证明,基于期望间隔的学习策略比基于决策值以及基于后验概率的策略有着更好的学习效果。
-
关键词
多标签
后验概率
期望间隔
主动学习
支持向量机
-
Keywords
Multi-label
Posterior probability
Expect margin
Active learning
SVM
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于加权SVM主动学习的多标签分类
被引量:7
- 2
-
-
作者
刘端阳
邱卫杰
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第8期181-182,185,共3页
-
文摘
样本标记是一个重要但又比较耗时的过程。得到一个多标签分类器需要大量的训练样本,而手工为每个样本创建多个标签会存在一定困难。为尽可能降低标记样本的工作量,提出一种加权决策函数的主动学习方法,该方法同时考虑训练样本的数量和未知样本的置信度,使得分类器能在最小的成本下最快地达到比较满意的分类精度。
-
关键词
主动学习
多标签
支持向量机
训练样本
-
Keywords
active learning; multi-label; Support Vector Machine(SVM); training samples;
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于平均期望间隔的多标签分类主动学习方法
被引量:1
- 3
-
-
作者
刘端阳
邱卫杰
-
机构
浙江工业大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第15期168-170,共3页
-
文摘
针对多标签主动学习速度较慢的问题,提出一种基于平均期望间隔的多标签分类的主动学习方法。计算支持向量机分类器中的期望间隔,并将其作为样本选择标准。实验结果表明,该方法在分类精度、Hamming Loss、Coverage等评价标准上优于基于决策值和后验概率等主动学习策略,能更好地评价未标记样本,有效提高分类精度和速度。
-
关键词
多标签
后验概率
期望间隔
主动学习
支持向量机
-
Keywords
multi-label
posterior probability
expectation margin
active learning
Support Vector Machine(SVM)
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-