期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Rough集约简算法的中文文本自动分类系统 被引量:8
1
作者 盛晓炜 江铭虎 《电子与信息学报》 EI CSCD 北大核心 2005年第7期1047-1052,共6页
现有的文本自动分类离不开文档向量的构造,向量的分量与文档中的特征项相对应。这种向量通常高达几千维甚至数万维,计算量相当大,因此需要对向量进行约简。而传统的基于频率的阈值过滤法往往会导致有效信息的丢失,影响分类的准确度。该... 现有的文本自动分类离不开文档向量的构造,向量的分量与文档中的特征项相对应。这种向量通常高达几千维甚至数万维,计算量相当大,因此需要对向量进行约简。而传统的基于频率的阈值过滤法往往会导致有效信息的丢失,影响分类的准确度。该文将Rough集理论引入自动分类,并提出了一种新的文档向量约简算法。实验证明该算法不仅能有效缩减文档向量的规模,而且相比传统的阈值法信息损失小、准确率更高。 展开更多
关键词 自动分类 ROUGH集 决策表 约简算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部