Impala:新一代开源大数据分析引擎
被引量:4
摘要
大数据处理是云计算中非常重要的领域,自Google公司提出MapReduce分布式处理框架以来,以Hadoop为代表的开源软件受到越来越多公司的重视和青睐。以Hadoop为基础,之后的HBase、Hive、Pig等系统如雨后春笋般地加入了Hadoop的生态系统中。本文将讲述Hadoop系统中的一个新成员:Impala。
出处
《程序员》
2013年第8期95-97,共3页
Programmer
同被引文献42
-
1大数据时代来临何为大数据?[EB/OL].2012-05-12.ht.tp://datacenter.ctocio.com.cn/464/12331964.shtml.
-
2计算机行业-大数据(BigData)专题报告[R].上每:光大证券有限公司研究所.2011.
-
3GRAHAM-ROWE D,GOLDSTON D,DOCTOROW C,et al.Big data:science in the pete byte era[J].Nature,2008,455(7209):8-9.
-
4JIChang-qing,LIYu,QIUWen-ming,etal.Bigdata processing in cloud computing environments[C]//Proc of the 12th International Symposium on Pervasive Systems,Algorithms and Networks.2012:17-23.
-
5BARWICK H.The"four Vs"of big data[EB/OL].(2011-08-05)[2012-10-02].http://www.comput erworld.com.au/article/396198/iii3_four_vs big_data/.
-
6IBM.What is big data?[EB/OL].[2012-10-02].http://www-01.ibm.com/software /data/bigdata/what_is_ big_ data.html.
-
7SHUTE J,OANCEA M,ELLNER S.F1:the fault-tolerant distributed RDBMS supporting Google's Ad business[C]//Proc ofACM SIGMOD.2012.
-
8CHAIKEN R,JENKINS B,LARSON P,et al.SCOPE:easy and efficient parallel processing of massive data sets[J].Proceedings of the VLDB Endowment,2008,1 (2):1265-1276.
-
9BEAVER D,KUMAR S,LI H C,et al.Finding a needle in Haystack:Faeebook's photo storage[C]//Proc of the 9th USENIX Conference on Operation Systems Design and Implementation Berkeley:USENIX Association.2010:47-60.
-
10BORTHAKUR D,SARMA J S,GRAY J,et al.Apache Hadoop goes realtime at Facebook[C]//Proc of ACM SIGMOD Conference on Management of Data.New York:ACM Press,2011:1071-1080.
引证文献4
-
1方昕.大数据时代下计算机专业教学的探索[J].微型电脑应用,2014,30(11):32-34. 被引量:28
-
2方艾,徐雄,梁冰,张玉忠,杨翊平.主流大数据处理开源架构的分析及对比评测[J].电信科学,2015,31(7):152-157. 被引量:4
-
3方昕.大数据下的智能交通数据共享与处理模型[J].信息技术,2015,39(12):94-97. 被引量:11
-
4谭晶,仇红剑,徐明生,党倩,杨泉伟.电力企业大数据平台数据权限控制机制研究与应用[J].电力信息与通信技术,2017,15(5):49-53. 被引量:1
二级引证文献44
-
1王兆华.大数据背景下的高职计算机专业教育改革研究[J].电脑知识与技术,2015,0(7):119-120. 被引量:19
-
2潘少伟,张威威,周鹏辉.大数据时代计算机类学生创新能力培养探析[J].科技视界,2015(34):59-60. 被引量:2
-
3张淳.大数据时代下高职计算机专业教育的探索[J].信息通信,2015,28(12):263-264. 被引量:16
-
4刘金金,徐天贺,贾美超.大数据助力高校计算机基础课程改革[J].教育教学论坛,2016(3):82-83. 被引量:13
-
5王先财.大数据时代下高职计算机专业教育的探索[J].电子世界,2016,0(9):16-16. 被引量:10
-
6冯登超,袁晓辉.低空安全走廊及应急管理可视化研究进展[J].电子测量与仪器学报,2016,30(4):493-505. 被引量:19
-
7胡蓉.大数据时代计算机专业教育的探索[J].通讯世界(下半月),2016(7):238-239. 被引量:2
-
8李玮.Apache Spark技术研究与应用前景分析[J].电信技术,2016(9):67-68. 被引量:3
-
9陈洁,张文翔.大数据视角下计算机科学与技术专业建设探究[J].软件导刊,2016,15(10):185-187. 被引量:14
-
10吕浩涵,李泽峣.交通数据的开放与应用[J].数字技术与应用,2016,34(11):113-113.
-
1雷华明,阙沛文."Smart" ultrasonic pig design and its signal processing research[J].Journal of Harbin Institute of Technology(New Series),2008,15(1):65-70.
-
2陈雨婕.基于PKI的办公自动化网络信息安全研究[J].赤峰学院学报(自然科学版),2009,25(9):47-48. 被引量:1
-
3蔡国.和包AR游戏掀互联网热浪 开创新之路[J].计算机与网络,2017,43(2):35-35.
-
4董西成.Tez:运行在YARN上的DAG计算框架[J].程序员,2013(8):98-102. 被引量:1
-
5宋伟.基于Hadoop平台的数据挖掘技术研究[J].电子制作,2014,22(12X):76-77. 被引量:6
-
6王敬昌.基于Hadoop分布式计算架构的海量数据分析[J].数字技术与应用,2010,28(7):6-7. 被引量:6
-
7丁文晖.永宏PLC在恒压供水项目上的应用[J].可编程控制器与工厂自动化(PLC FA),2014(1):68-70.
-
8黄铭,陈明.Hadoop平台数据挖掘技术研究[J].信息系统工程,2015,0(1):103-103.
-
9新书上架[J].程序员,2011(10):126-127.
-
10赵保学,李战怀,陈群,潘巍,姜涛,金健.基于共享的MapReduce多查询优化技术[J].计算机应用研究,2013,30(5):1405-1409. 被引量:7