大数据环境下Hadoop分布式系统的研究与设计
被引量:10
摘要
随着互联网应用的飞速发展和信息的社会化数据呈爆发式的增长,传统的关系数据库在处理分析如此海量的数据时出现性能和可扩展性的瓶颈,通过介绍目前大数据时代面临的挑战,分析了大数据对IT系统的挑战以及针对大数据业务特点的应对策略。目前大数据技术目前还没形成统一标准,但业界已经广泛使用Hadoop分布式系统作为其大数据处理平台,对大数据环境下Hadoop分布式系统进行了详尽的研究与设计,包括分布式文件系统、并行计算模型、分布式数据库、分布式锁服务等各个功能模块,大数据环境下的Hadoop分布式系统将更有效支撑未来电信运营商业务的发展。
出处
《广东通信技术》
2013年第10期22-27,共6页
Guangdong Communication Technology
参考文献12
-
1卓安.基于P2P可伸缩架构的大数据分析平台研究与实现[J].清华大学.2012.
-
2陈如明.大数据时代的挑战、价值与应对策略[J].移动通信,2012(17):14-15. 被引量:167
-
3成静静,喻朝新.基于云计算的大数据统一分析平台研究与设计[J].广东通信技术,2013,33(1):6-10. 被引量:36
-
4赵春雷,乔治.纳汉.“大数据”时代的计算机信息处理技术[J].世界科学,2012(2):30-31. 被引量:97
-
5李政,李继兵,丁伟.基于大数据的电信运营商业务模式研究[J].移动通信,2013,37(5):64-67. 被引量:28
-
6成静静.基于Hadoop的分布式云计算/云存储方案的研究与设计[J].数据通信,2012(5):14-18. 被引量:28
-
7顾芳,刘旭峰,左超.大数据背景下运营商移动互联网发展策略研究[J].邮电设计技术,2012(8):21-24. 被引量:41
-
8刘炜,夏翠娟,张春景.大数据与关联数据:正在到来的数据技术革命[J].现代图书情报技术,2013(4):2-9. 被引量:72
-
9覃雄派,王会举,杜小勇,王珊.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45. 被引量:386
-
10童晓渝,张云勇,房秉毅,雷磊.大数据时代电信运营商的机遇[J].信息通信技术,2013,7(1):5-9. 被引量:53
二级参考文献128
-
1童晓渝,张云勇,房秉毅,李素粉.电信运营商实施云计算的策略建议[J].信息通信技术,2012,6(1):34-38. 被引量:11
-
2Zhou MQ, Zhang R, Zeng DD, Qian WN, Zhou AY. Join optimization in the MapReduce environment for column-wise data store. In: Fang YF, Huang ZX, eds. Proc. of the SKG. Ningbo: IEEE Computer Society, 2010.97-104. [doi: 10.1109/SKG.2010.18].
-
3Afrati FN, Ullman JD. Optimizing joins in a Map-Reduce environment. In: Manolescu I, Spaecapietra S, Teubner J, Kitsuregawa M, Leger A, Naumann F, Ailamaki A, Ozcan F, eds. Proc. of the EDBT. Lausanne: ACM Press, 2010. 99-110. [doi: 10.1145/ 1739041.1739056].
-
4Sandholm T, Lai K. MapReduce optimization using regulated dynamic prioritization. In: Douceur JR, Greenberg AG, Bonald T, Nieh J, eds. Proc. of the SIGMETRICS. Seattle: ACM Press, 2009. 299-310. [doi: 10.1145/1555349.1555384].
-
5Hoefler T, Lumsdaine A, Dongarra J. Towards; efficient MapReduce using MPI. In: Oster P, ed. Proc. of the EuroPVM/MPI. Berlin: Springer-Verlag, 2009. 240-249. [doi: 10.100'7/978-3-642-03770-2_30].
-
6Nykiel T, Potamias M, Mishra C, Kollios G, Koudas N. MRShare: Sharing across multiple queries in MapReduce. PVLDB, 2010, 3(1-2):494-505.
-
7Kambatla K, Rapolu N, Jagannathan S, Grama A. Asynchronous algorithms in MapReduce. In: Moreira JE, Matsuoka S, Pakin S, Cortes T, eds. Proc. of the CLUSTER. Crete: IEEE Press, 2010. 245-254. [doi: 10.1109/CLUSTER.2010.30].
-
8Polo J, Carrera D, Becerra Y, Torres J, Ayguad6 E, Steinder M, Whalley I. Performance-Driven task co-scheduling for MapReduce environments. In: Tonouchi T, Kim MS, eds. Proc. of the 1EEE Network Operations and Management Symp. (NOMS). Osaka: IEEE Press, 2010. 373-380. [doi: 10.1109/NOMS.2010.5488494].
-
9Zaharia M, Konwinski A, Joseph AD, Katz R, Stoica I. Improving MapReduce performance in heterogeneous environments. In: Draves R, van Renesse R, eds. Proc. of the ODSI. Berkeley: USENIX Association, 2008.29-42.
-
10Xie J, Yin S, Ruan XJ, Ding ZY, Tian Y, Majors J, Manzanares A, Qin X. Improving MapReduce performance through data placement in heterogeneous Hadoop clusters. In: Taufer M, Rfinger G, Du ZH, eds. Proc. of the Workshop on Heterogeneity in Computing (IPDPS 2010). Atlanta: IEEE Press, 2010. 1-9. [doi: 10.1109/IPDPSW.2010.5470880].
共引文献899
-
1支少婷.浅谈我国移动通信产业生态系统发展历程[J].中外企业家,2019,0(36):229-231. 被引量:3
-
2叶思斯,林志达,郭献彬,曹小明.基于MongoDB的配置管理平台应用研究[J].系统仿真技术,2021,17(4):253-258. 被引量:5
-
3何荣贵.大数据应用的现状与展望[J].武汉电力职业技术学院学报,2020(1):49-52.
-
4黄茹萍.大数据时代下个人信息安全保护研究[J].法制与社会(旬刊),2020,0(8):245-246. 被引量:2
-
5黄珊珊.大数据技术在高校图书馆知识服务中的应用[J].电子技术(上海),2021,50(12):40-42. 被引量:1
-
6黄炳文.基于数据分析平台的展会信息创新模式展望[J].电子技术(上海),2021,50(7):89-91.
-
7孙建军.大数据的认知[J].大众标准化,2019,0(14):94-95.
-
8郑智泉,杨楠.智能革命下数据驱动的智慧图书馆建设分析[J].智能计算机与应用,2020(8):183-185.
-
9谢月锋,董现垒,陈卉,王燕,刘志成.利用网络痕迹信息即时预测儿童腹泻流行趋势[J].医学信息(医学与计算机应用),2016,29(29):1-4.
-
10王鹏.'大数据'时代背景下计算机信息处理技术分析[J].包装世界,2018,0(7):129-129.
同被引文献49
-
1曾理,王以群.Hadoop集群和单机数据处理的耗时对比实验[J].硅谷,2009,2(19):55-56. 被引量:9
-
2陈启斗,蔡鸿明,姜丽红.面向多租户的业务模型版本管理[J].华中科技大学学报(自然科学版),2012,40(S1):128-131. 被引量:1
-
3LI Yong,FENG Dan,SHI Zhan,et al.A probability based load balancing algorithm for parallel file systems[J].Journal of the Chinese Institute of Engineers,2015,38(6):811-820.
-
4AHN T,SANDU A,WATSON L,et al.A framework to analyze the performance of load balancing schemes for Ensembles of stochastic simulations[J].International Journal of Parallel Programming,2015,43(4):597-630.
-
5SKEIRIK S,BOBBA RB,MESEGUER J.Formal analysis of fault-tolerant group key management using zookeeper[C]//Proceedings of the 13th IEEE/ACM International Symposium on Cluster,Cloud and Grid Computing(CCGrid).Delft,Nederland:IEEE,2013:636-641.
-
6CANINO W,POWELL D.Formal behavioral evaluation of enrichment programs on a zookeepers schedule:a case study with a polar bear(Ursus Maritimus)at the Bronx Zoo[J].Zoo Biology,2010,29(4):503-508.
-
7何华.基于云计算平台的电信经营分析系统中元数据管理的研究与实现[J].北京邮电大学,2011.
-
8姜锋.基于Hado叩平台的海量数据处理研究及应用[J].北京邮电大学,2013.
-
9唐真.基于hado叩的推荐系统设计与实现[D].电子科技大学.(2013).
-
10陈娜.基于Hadoop平台的海量数据处理应用[D].吉林大学.(2012).
引证文献10
-
1潘毅,成静静.Hadoop在电信运营商经营分析系统中应用的研究[J].数据通信,2014(6):25-28. 被引量:3
-
2任乐乐,何灵敏.一种改进的主从节点选举算法用于实现集群负载均衡[J].中国计量学院学报,2015,26(3):341-346.
-
3李伟,金国庆.基于大数据的舰船装备维修保障信息分析系统设计[J].舰船电子工程,2016,36(2):96-99. 被引量:5
-
4成静静.多租户管理技术在大数据平台中的应用研究[J].数据通信,2016(6):12-14. 被引量:3
-
5刘瑾,郑玉清.基于Hadoop集群的多租户管理方案探讨[J].数码世界,2017,0(12):596-597.
-
6周岳,陈庆奎.面向大规模数据接入系统的负载平衡机制[J].计算机应用,2018,38(1):50-55. 被引量:5
-
7李麒,管和鹏.基于微服务架构的智慧路灯管理平台的设计与实现[J].自动化技术与应用,2018,37(11):59-63. 被引量:5
-
8赵继新.基于Hadoop的交通物流数据仓库构建技术研究[J].西部交通科技,2019,0(10):162-165. 被引量:5
-
9陈玉昆,陈健,徐军,徐博奥.装备维修保障辅助决策系统建设方法[J].兵工自动化,2021,40(4):20-22. 被引量:2
-
10张圣杰.分布式大数据管理系统的设计与实现研究[J].信息通信,2019,32(2):217-218. 被引量:8
二级引证文献36
-
1高峰.基于全流程管理的“掌上医院”智慧平台设计与实现[J].名医,2020(13):192-193. 被引量:1
-
2王美华.“新物流”背景下同城配送云平台构建分析[J].智能计算机与应用,2022,12(1):180-182. 被引量:1
-
3曾毛林,周铁夫.长沙市造纸印刷包装行业“十五”规划思路[J].湖南包装,2000,15(1):11-12.
-
4易心.CIS的意义与作用[J].湖南包装,2000,15(1):41-43.
-
5谢翠琴,吴春.基于Hadoop和OGG技术的运营商装维数据传输方案[J].电脑与电信,2016(6):71-73. 被引量:1
-
6曹鲁.大数据业务在电信运营中的应用分析[J].中国新通信,2016,18(16):115-116. 被引量:3
-
7杨光付,邢焕革,裘达夫.基于共享平台的舰船装备腐蚀与防护信息分类方法研究[J].装备环境工程,2017,14(5):86-92. 被引量:2
-
8曹江辉,齐燕海.基于大数据技术的广电经营分析系统建设实践[J].中国有线电视,2017(9):1033-1037. 被引量:1
-
9谢重阳,艾迪.基于异构混搭架构的大数据平台[J].广播电视信息,2017,24(10):69-74.
-
10吴永欢,张雨.基于Docker容器技术的电网私有云化大数据平台架构研究[J].通信电源技术,2018,35(3):227-229. 被引量:4
-
1赵鑫.基于NoSQL数据库的大数据处理分析[J].电脑知识与技术(过刊),2015,21(4X):26-27.
-
2刘源.基于NoSQL数据库的大数据查询技术的研究与应用[J].电子技术与软件工程,2015(18):193-193. 被引量:1
-
3陈阳,江彤彤,李芳.基于NOSQL的大数据存储安全性分析[J].电子世界,2016,0(19):150-151. 被引量:1
-
4俞宁.一种并行数据的串行采集方案[J].电子测量技术,1989,12(4):6-10. 被引量:1
-
5曹晓辉.云计算平台研究与应用[J].中国科技博览,2015,0(23):349-349.
-
6赵卫.大数据环境下NoSQL的数据存储技术及应用[J].电脑知识与技术,2016,0(7):11-13.
-
7李巍巍.大数据技术应用研究[J].自动化与仪器仪表,2016(7):195-196. 被引量:3
-
8李伟.大数据下的NoSQL数据库技术分析[J].信息通信,2014,27(7):72-73. 被引量:13
-
9元素.毁人剧场:“机”犬不宁[J].计算机应用文摘,2006(6):112-112.
-
10查晓强.在当前计算机软件开发技术的应用研究[J].电子制作,2014,22(21):71-72.