期刊文献+

基于位置的文本分类样本剪裁及加权方法 被引量:2

Sample cutting and weighting method in text classification based on position
下载PDF
导出
摘要 k近邻方法是文本分类中广泛应用的方法,对其性能的优化具有现实需求。使用一种改进的聚类算法进行样本剪裁以提高训练样本的类别表示能力;根据样本的空间位置先后实现了基于类内和类间分布的样本加权;改善了k近邻算法中的大类别、高密度训练样本占优现象。实验结果表明,提出的改进文本加权方法提高了分类器的分类效率。 K nearest neighbor method is widely used in text classification method. There is the real need of improving the algorithm performance. It uses an improved clustering algorithm for sample cut to improve training sample category representation capability. According to the spatial location of the sample, it realizes the sample weighting based on class inner and class between. It improves the phenomenon that categories, high density of training samples have the advantage in k nearest neighbor algorithm. The experimental result shows that the improved text weighted method improves the classification efficiency.
出处 《计算机工程与应用》 CSCD 北大核心 2015年第2期131-135,共5页 Computer Engineering and Applications
基金 国家自然科学基金(No.71071161) 江苏省自然科学基金(No.BK2012511)
关键词 样本剪裁 样本加权 文本聚类 K近邻 文本分类 sample cutting sample weighting text clustering k-nearest neighbor text categorization
  • 相关文献

参考文献17

二级参考文献106

共引文献712

同被引文献6

引证文献2

二级引证文献12

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部