摘要
文中设计并实现了一种舆情分析中的文本分类方法。使用改进的隐马尔可夫分词方法对文本分词,结合Boosting算法生成动态停用词词库的贝叶斯文本分类方法对测试数据集分类。实验数据表明,该分类方法能取得较好的文本分类结果。
This paper designed and implemented a text classification method in public opinion analysis. An improved hidden Markov model is used to implement Chinese word segmentation. Naive Bayes text classifier combined with the Boosting method, which generate dynamically stop words, classifies the training data set. The experimental results show that this classifier can calssify Chinese text effectively.
出处
《信息技术》
2013年第3期9-13,共5页
Information Technology
基金
国家自然科学基金项目(60971088)