摘要
云计算环境下面向流程的数据密集型应用已被广泛应用于多个领域.面对多数据中心的云计算环境,这类应用在数据布局方面遇到了新的挑战,主要表现在如何减少跨数据中心的数据传输、如何保持数据间的依赖性以及如何在提高效率的同时兼顾全局的负载均衡等.针对这些挑战,文中提出一种三阶段数据布局策略,分别针对跨数据中心数据传输、数据依赖关系和全局负载均衡三个目标对数据布局方案进行求解和优化.实验显示,文中提出的数据布局策略具有良好的综合性能,特别是在降低流程执行过程中由跨数据中心数据传输所导致的时间开销方面,效果尤为明显.
With the development of information technology,data-intensive applications in cloud have been used in more and more fields.Because of the decentralized data centers in cloud,these applications now are facing some new challenges in data placement which mainly include how to reduce the time cost of data movements between data centers,how to deal with the data dependencies,and how to keep a relative load balancing of data centers.This paper proposes a data placement strategy,the three stages of which address the three challenges above respectively.Simulation shows that the strategy can effectively reduce the time cost of data movements across data centers during the application's execution.
出处
《计算机学报》
EI
CSCD
北大核心
2010年第8期1472-1480,共9页
Chinese Journal of Computers
基金
国家自然科学基金(90818001)
山东省科技攻关计划(2008GG30001005
2009GG10001002)
高等学校博士学科点专项科研基金(200804221031)
山东大学自主创新基金(2009TS030)资助~~
关键词
云计算
流程
数据密集
数据布局
数据依赖
cloud computing
process
data-intensive
data placement
data dependency