摘要
在信息数据爆炸式增长的今天,各类信息如潮水般呈现在人们面前,利用文本分类技术可以高效、准确地找到人们需要的有关分类信息,为进一步开展数据挖掘和分析奠定基础。文章的标题、摘要是内容的高度概括,针对这些短文本进行分类则成为自动文本分类的研究方向。基于互联网信息平台各类信息数据,文章分别采用Bow和TF-IDF等技术方法进行文本向量化,构建多项式朴素贝叶斯模型对训练集数据进行训练,并对比研究测试集预测结果,实现短文本自动文本分类,为实现快速获取某类信息热点提供参考。
出处
《电脑知识与技术》
2022年第27期61-63,共3页
Computer Knowledge and Technology
基金
海南自然科学基金项目(618MS078)
海南省基础与应用基础研究计划(省自然科学基金)高层次人才项目(No.2019RC253)。