期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Hadoop的维吾尔文文本分类 被引量:1
1
作者 艾比布拉.阿不拉 马振 +1 位作者 哈力旦.阿布都热依木 吴冰冰 《计算机工程与设计》 北大核心 2018年第8期2500-2504,共5页
针对维吾尔文组词算法在文本分类中的分类性能不高,以及处理海量数据困难等问题,提出一种改进维吾尔文组词算法(DM),并设计一种基于Hadoop和改进维吾尔文组词算法的文本分类模型。对文本进行分段式处理,对每段分别采用DM组词算法,利用Ma... 针对维吾尔文组词算法在文本分类中的分类性能不高,以及处理海量数据困难等问题,提出一种改进维吾尔文组词算法(DM),并设计一种基于Hadoop和改进维吾尔文组词算法的文本分类模型。对文本进行分段式处理,对每段分别采用DM组词算法,利用MapReduce编程模型实现该算法的并行化设计,结合Mahout贝叶斯分类算法进行文本分类,实验结果表明,该模型具有较好的分类结果。 展开更多
关键词 Hadoop分布式系统 文本分类 维吾尔文 dm组词算法 Mahout分布式项目 贝叶斯分类算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部