-
题名利用未标记数据提高SVM分类器性能的研究
被引量:2
- 1
-
-
作者
祝宇
聂峰光
郭力
-
机构
中国科学院过程工程研究所多相反应实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第27期166-167,170,共3页
-
基金
国家自然科学基金资助项目(编号:20273076)
-
文摘
监督学习算法的一个主要困难在于需要大量标记过的训练集数据,采用人工的方法不够现实。文章提出了SVM分类器在少量标记训练样本情况下,采用Rocchio法和KNN方法从大量的未标记数据中,挑选相似度较高、区别度较大的数据加入到训练集中,弥补训练样本的不足。实验表明该算法有效地利用了丰富的未标记数据,减少了人工标记量,较好地提高了SVM分类器的性能。
-
关键词
文本分类
未标记
rocchio法
K近邻法
支持向量机
-
Keywords
text categorization,unlabeled,rocchio's algorithm,K Nearest Neighbor,Support Vector Machine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-