期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于样本重要性原理的KNN文本分类算法 被引量:6
1
作者 万韩永 左家莉 +1 位作者 万剑怡 王明文 《江西师范大学学报(自然科学版)》 CAS 北大核心 2015年第3期297-303,314,共8页
KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点... KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高. 展开更多
关键词 文本分类 KNN 样本重要性原理 SI-KNN
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部