-
题名一种正交分解大数据处理系统设计方法及实现
被引量:12
- 1
-
-
作者
向小佳
赵晓芳
刘洋
龚关俊
张晗
-
机构
中国科学院计算技术研究所
北方工业大学计算机学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第5期1097-1108,共12页
-
基金
国家自然科学基金项目(61202061
61202413)
中国科学院计算技术研究所创新课题项目(20146080)~~
-
文摘
MapReduce等计算框架的出现开启了大数据处理新纪元,以Hadoop,Spark为代表的大数据处理系统具有大吞吐率、跨平台、高可扩展的优势,并得到广泛应用.然而,为避免与具体的操作系统、硬件平台绑定,这些系统的设计与优化集中在计算模型、调度算法等方面,无法充分利用底层平台的优势.提出了一种基于正交分解的大数据处理系统设计与优化方法,将系统分解为松耦合的多个功能正交的模块,使存储、处理功能分离出来,交给能够利用底层平台操作系统甚至硬件资源的存储、执行引擎,原大数据系统退化为调度平台;进而,提出基于锁无关机制的存储底层优化策略和基于指令超级优化的执行引擎底层优化策略.以此为指导,以Hadoop作为兼容和改进的对象,实现了原型大数据处理系统Arion.Arion既能保持Hadoop的跨平台、高可扩展的优势,又能消除任务执行的瓶颈,其本地化的设计与优化手段对非Hadoop平台同样有效.通过在原型系统上的实验证明,Arion能够提升大数据处理任务的执行效率,最高达7.7%.
-
关键词
大数据处理系统
计算框架
本地化
锁无关
超级优化
执行引擎
-
Keywords
big data processing system
computing framework
localization
lock free
super optimization
excecution engine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-