期刊文献+

基于MapReduce技术的海量文本数据统计方法研究

Research by Massive Text Data Statistics Method Based on MapReduce
原文传递
导出
摘要 为了实现海量文本数据的有效发掘和统计,从文本分类与大数据并行处理两个方面着手,研究在海量文本数据挖掘的相关理论知识和MapReduce编程模型的相关技术支撑下的海量文本数据挖掘统计方法。在并行运算模型的开源实现Hadoop平台上,提出了一种简单、有效的文本分类方法——基于MapReduce的平均朴素贝叶斯文本分类算法。 In order to realize the effective exploration of massive text data and statistics, from two aspects of the text classification and data parallel processing, this paper explores relevant theoretical knowledge of massive text data related technology research and MapReduce programming model for mining statistical method in mining. On the Hadoop open source implementation platform of parallel computing model, a simple and effective text classification method is provided based on MapReduce of average naive Bayes text classification algorithm.
作者 宗峰
出处 《山东英才学院学报》 2017年第4期52-55,61,共5页 Journal of Shandong Yingcai University
基金 山东省重点研发项目“基于移动与可穿戴计算的心血管智能远程监护系统的研制”(2015GGX101048) 山东省高等学校科技计划项目“大数据框架下基于多源信息融合的交通自组织分区协同控制策略研究”(J17KB181)
关键词 大数据 文本数据 MAPREDUCE 朴素贝叶斯算法 data text data MapReduce naive bayes
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部