基于MapReduce技术的海量文本数据统计方法研究

Research by Massive Text Data Statistics Method Based on MapReduce

导出

摘要为了实现海量文本数据的有效发掘和统计,从文本分类与大数据并行处理两个方面着手,研究在海量文本数据挖掘的相关理论知识和MapReduce编程模型的相关技术支撑下的海量文本数据挖掘统计方法。在并行运算模型的开源实现Hadoop平台上,提出了一种简单、有效的文本分类方法——基于MapReduce的平均朴素贝叶斯文本分类算法。 In order to realize the effective exploration of massive text data and statistics, from two aspects of the text classification and data parallel processing, this paper explores relevant theoretical knowledge of massive text data related technology research and MapReduce programming model for mining statistical method in mining. On the Hadoop open source implementation platform of parallel computing model, a simple and effective text classification method is provided based on MapReduce of average naive Bayes text classification algorithm.

作者宗峰

机构地区山东英才学院信息工程学院

出处《山东英才学院学报》 2017年第4期52-55,61,共5页 Journal of Shandong Yingcai University

基金山东省重点研发项目“基于移动与可穿戴计算的心血管智能远程监护系统的研制”(2015GGX101048) 山东省高等学校科技计划项目“大数据框架下基于多源信息融合的交通自组织分区协同控制策略研究”(J17KB181)

关键词大数据文本数据 MAPREDUCE 朴素贝叶斯算法 data text data MapReduce naive bayes

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1何波,章宏远,裴剑辉.基于大数据的高校图书馆个性化服务研究[J].新世纪图书馆,2017(10):59-61. 被引量：19
2谌志华.基于大数据的网络舆情分析系统[J].现代电子技术,2017,40(24):15-17. 被引量：9
3范超宇.云计算环境下气象大数据服务的应用[J].农业与技术,2017,37(16):231-231.
4罗士钧.基于Adaboost算法在葡萄酒酒品分类中的实际应用[J].科学中国人,2017(6Z):134-135.
5郭英杰,千博.基于LDA的主题分类系统研究[J].无线互联科技,2018,15(3):61-62.
6马睿.基于互信息量的加权朴素贝叶斯算法[J].无线互联科技,2018,15(3):106-107.
7池云仙,赵书良,罗燕,高琳,赵骏鹏,李超.基于词频统计规律的文本数据预处理方法[J].计算机科学,2017,44(10):276-282. 被引量：11
8杨振顺,张明珠.浅议计算机数据移植[J].一重技术,2001,0(2):126-127.
9朱卫星,徐伟光,何红悦,李雯.文本数据主题挖掘与关联搜索研究[J].计算机科学,2017,44(B11):411-413. 被引量：6
10王雪丽,宋启祥.基于BP神经网络的文本分类算法研究与设计[J].通化师范学院学报,2018,39(2):70-73. 被引量：5

山东英才学院学报

2017年第4期

浏览历史

内容加载中请稍等...

基于MapReduce技术的海量文本数据统计方法研究

相关作者

相关机构

相关主题

浏览历史