期刊文献+

基于粗糙集理论的文本分类算法研究 被引量:7

Text Classification Algorithm Study Based on Rough Set Theory
下载PDF
导出
摘要 文本分类是中文信息处理的重要研究领域。给文本分配一个或多个不同的类别,可提高文本检索和存储的处理效率。粗糙集是一种不需要任何先验信息的分类方法,通过对文本分词、过滤掉停用词之后把剩余的词语作为特征项,然后把文本用向量空间模型表示出来,将文本集转化成不带决策属性的信息系统,用粗糙集理论中核心内容属性约简实现对文本的分类。实验表明,该方法的查准率和查全率都有所提高。 Text dataset is transformed to information system without attribute of decision making and the core content of attribute reduction has been applied to text classification.Experiment shows that the precision rate and recall rate are enhanced in this method;furthermore,it does not require any a priori information.
出处 《计算机科学》 CSCD 北大核心 2011年第11期239-240,263,共3页 Computer Science
基金 国家自然科学基金(60803106)资助
关键词 文本分类 粗糙集 约简 Text classification Rough set Reduction
  • 相关文献

参考文献11

二级参考文献31

共引文献207

同被引文献48

引证文献7

二级引证文献27

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部