基于MapReduce的大数据流程处理方法被引量：1

MapReduce-based method for large data flow processing

下载PDF

导出

摘要处理效率是数据流程处理的重要指标,简单的单服务器结构已经难以适应海量数据的处理任务。为了能够完成海量数据的流程处理任务,简要介绍了Google的MapReduce的结构,Fegaras等剔除的MapReduce查询语言(MRQL),并基于MapReduce编程模型和MRQL提出了一种分布式数据汇聚方法。该方法借助MapReduce完成数据处理流程的执行,借助MRQL控制MapReduce。在XBus数据汇聚平台基础上,结合MapReduce和MRQL实现了MRXBus分布式数据汇聚平台,验证了该方法的可行性。实验表明,该方法可以减少大数据量的处理时间,提高处理效率。 Processing efficiency is an important indicator of the data flow process. It is hard to accomplish large data processing tasks by the simple single-server structure. In order to accomplish the process of massive data processing tasks, first introduced the structure of MapReduee proposed by Google and MRQL （ MapReduce Query Language） proposed by Fegaras, and then proposed a distributed data flow processing method based on MapReduce programming model and MRQL. This method used MapReduee to carry out the data flow processing and MRQL to control MapReduce. Based on XBus data aggregation platform, MRXBus （ MapReduce XBus） was designed and implemented to verify the feasibility of the method. Experimental results show that this method can reduce the time of massive data processing and improve the efficiency of data aggregation.

作者王东雷孙忠林

机构地区山东科技大学信息科学与工程学院

出处《计算机应用》 CSCD 北大核心 2013年第A02期57-59,127,共4页 journal of Computer Applications

基金山东省自然科学基金资助项目(ZR2011FQ028) 山东省统计科研重点课题一般项目(KT12067)

关键词数据流程处理数据汇聚 MAPREDUCE HADOOP MapReduce查询语言 data flow processing data aggregation MapReduce Hadoop MapReduce Query Language （MRQL）

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1FEGARAS L, LI C, GUPTA U. An optimization framework for map-re-duce queries[ C] // Proceedings of the 15th International Conference onExtending Database Technology. New York: ACM, 2012: 26 - 37.
2DEAN J, GHEMAWAT S. MapReduce: simplified data processing onlai^e clustersfj]. Communications of the ACM, 2(X^, 51 (1): 107 -113.
3Xadoop[ EB/OL]. [2013 -04 -25]. http://www.xadoop.ory.
4KHATCHADOURIAN S, CONSENS M,SIMEON J. ChuQL: pro-cessing XML with XQuery using Hadoop[ C] // Proceedings of the2011Conference of the Center for Advanced Studies on CollaborativeResearch. Riverton: IBM Corp. 2011: 74 - 83.
5OLSTON C, REED B, SRIVASTAVA U,etal. Pig Latin: a not-so-foreign language for data processing[ C] // Proceedings of the 2008ACM SIGMOD International Conference on Management of Data.New York: ACM, 2008: 1099-1110.
6THUSOO A,SARMA J S, JAIN N,et al. Hive: a warehousing so-lution over a map-reduce frameworfc [ J]. Proceedings of the VLDBEndowment, 2009,2(2): 1626 - 1629.
7FEGARAS L, LI C, GUPTA U, et al. XML query optimization in map-reduce[ C] // WebDB 2011: Proceedings of the Fourteenth Int^nationalWoricshop on the Web and Databases. Athens, Greece: [s. n. ],2011.
8BORTHAKUR D. The Hadoop distributed file system: architectureand design[ EB/OL]. [ 2013 - 06 - 01 ] . http: //hadoop. apache.org/docs/iO. IS. 0/hdfs_design. pdf.
9WHITE T. Hadoop权威指南[M].周敏,曾大聃,周傲英,译.北京:淸华大学出版社,2010.
10Hadoop[ EB/OL], [2013 - 03 - 21]. http://hadoop. apache, oig/.

同被引文献9

1余楚礼,肖迎元,尹波.一种基于Hadoop的并行关联规则算法[J].天津理工大学学报,2011,27(1):25-28. 被引量：13
2王雪蓉,万年红.云模式用户行为关联聚类的协同过滤推荐算法[J].计算机应用,2011,31(9):2421-2425. 被引量：9
3黄立勤,柳燕煌.基于MapReduce并行的Apriori算法改进研究[J].福州大学学报（自然科学版）,2011,39(5):680-685. 被引量：19
4戎翔,李玲娟.基于MapReduce的频繁项集挖掘方法[J].西安邮电学院学报,2011,16(4):37-39. 被引量：24
5李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量：187
6郑志娴.基于云计算的Apriori算法设计[J].莆田学院学报,2014,21(5):61-64. 被引量：2
7王淑芬,高军礼,邹普,宋海涛.基于Hadoop的广域网分布式主题爬虫系统框架[J].计算机工程与科学,2015,37(4):670-675. 被引量：5
8郑祥云,陈志刚,黄瑞,李博.基于主题模型的个性化图书推荐算法[J].计算机应用,2015,35(9):2569-2573. 被引量：36
9杜江,张铮,张杰鑫,邰铭.MapReduce并行编程模型研究综述[J].计算机科学,2015,42(S1):537-541 564. 被引量：24

引证文献1

1南磊.基于Hadoop的图书推荐系统研究与设计[J].计算机与数字工程,2016(6):1057-1063. 被引量：4

二级引证文献4

1李欣.强关联规则挖掘在智慧图书馆个性化推送服务中的应用研究[J].情报科学,2018,36(4):95-99. 被引量：33
2李依潼,王骥,任肖丽.基于Scrapy的电商数据分析系统设计与实现[J].电子技术与软件工程,2020(2):178-181. 被引量：1
3胡谦锋,陈沁磊.基于支持向量机的图书分类管理研究[J].计算机与数字工程,2021,49(1):202-207. 被引量：1
4花维.基于Hadoop框架与用户行为特征感知的智能图书推荐系统设计[J].电子设计工程,2022,30(24):24-27. 被引量：1

1郭江鸿,陈德礼,刘志宏.无线传感器网络簇内数据汇聚方法[J].微电子学与计算机,2013,30(9):13-16. 被引量：2
2刘天池.基于HOG特征及稀疏外观模型的目标跟踪[J].软件导刊,2016,15(6):13-16.
3胡伏湘,肖玉朝,张为.基于大数据平台的网络信息安全框架设计[J].长沙民政职业技术学院学报,2015,22(3):130-133.
4衣晓,邓露,刘瑜.基于基站划分网格的无线传感器网络分簇算法[J].控制理论与应用,2012,29(2):145-150. 被引量：12
5李霞,谢康林,白英彩.基于速率限制的源端网络DDoS防御[J].计算机工程与应用,2005,41(35):149-152. 被引量：1
6丁小勇,罗永健,丁广东.一种新的无线传感器网络数据汇聚方法[J].兵工自动化,2010,29(10):35-37.
7罗永健,史德阳,侯银涛,侯申.基于相似度的无线传感器网络数据复原汇聚方法[J].计算机应用研究,2012,29(9):3405-3407. 被引量：2
8孔贵琴,李智.基于卡方拟合度的无线传感器网络数据复原汇聚方法[J].传感器与微系统,2015,34(4):130-133. 被引量：1
9罗永健,丁小勇,罗相根,丁广东.一种有效的无线传感器网络数据复原汇聚方法[J].数据采集与处理,2011,26(1):90-94. 被引量：5
10庄继晖,谢辉,朱仲文.基于模型的电控柴油机自动标定平台的开发[J].汽车工程,2013,35(7):624-628. 被引量：3

计算机应用

2013年第A02期

浏览历史

内容加载中请稍等...

基于MapReduce的大数据流程处理方法被引量：1

参考文献12

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的大数据流程处理方法 被引量：1

参考文献12

同被引文献9

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于MapReduce的大数据流程处理方法被引量：1