摘要
提出了一种改进的K-NN (K Nearest Neighbor)与SVM (Support Vector Machine)相融合的文本分类算法.该算法利用文本聚类描述K-NN算法中文本类别的内部结构,用sigmoid函数对SVM输出结果进行概率转换,同时引入CLA(Classifier's Local Accuracy)技术进行分类可信度分析以实现两种算法的融合.实验表明该算法综合了K-NN与SVM在分类问题中的优势,既有效地降低了分类候选的数目,又相应地提高了文本分类的精度,具有较好的性能.
出处
《高技术通讯》
CAS
CSCD
北大核心
2005年第5期19-24,共6页
Chinese High Technology Letters
基金
国家自然科学基金,国家高技术研究发展计划(863计划)