期刊文献+

基于Weka的文本分类算法性能分析 被引量:1

Performance Analysis of Text Classification Algorithm Based on Weka
下载PDF
导出
摘要 针对文本分类算法的选择问题,使用二十新闻组数据集在开源的数据挖掘软件Weka上进行了仿真实验。通过实验结果综合评价了朴素贝叶斯算法、IB1算法和ZeroR算法的性能。实验结果表明在三种算法中朴素贝叶斯算法的准确率最高,ZeroR算法的运算速度最快。研究表明文本分类的效率受所选算法的影响较大,合适的算法可以显著地提高文本分类的准确率。 According to text classification algorithm selection, we use 20 newsgroups data set to carry out simulation experiments on open source data mining software Weka. We evaluate the performance of Naive Bayes algorithms, IB1 algorithm and ZeroR algorithm comprehensively. Experimental results show that the Na?ve Bayes algorithm has the highest accuracy and the ZeroR algorithm is the fastest among the three algorithms. The study has shown that the efficiency of text classification is greatly influenced by selection algorithm and the appropriate algorithm can significantly improve the accuracy of text classification.
作者 刘娅
出处 《铜仁学院学报》 2014年第4期92-95,共4页 Journal of Tongren University
关键词 文本分类 算法 二十新闻组 text classification algorithm twenty news groups
  • 相关文献

参考文献9

二级参考文献92

共引文献67

同被引文献30

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部