期刊文献+

基于释放和重构的科学工作流数据布局策略 被引量:3

A Data Placement Strategy Based on Relaxation and Reconstruction for Scientific Workflow Applications
下载PDF
导出
摘要 科学工作流是典型的大数据应用,每个任务涉及的数据体量大,分布式环境下移动的网络代价高,良好的数据布局策略对于降低跨数据中心的传输代价、提高科学工作流运行效率至关重要.随着大数据时代来临,科学工作流计算任务涉及到的数据集和数据存储节点增多,使得求解数据布局最优方案变得更加困难.使用传统数据布局策略往往只能得到局部最优方案.为此,提出一种基于释放和重构的数据布局策略,使得在超大规模的解空间中尽快找到更加接近全局最优的数据布局方案.策略首先基于前期研究成果产生初始解,然后通过解的局部释放和重构,对解空间的不同邻域进行搜索,不断提高解的质量.通过实验验证并与传统方法比较,结果显示该数据布局方案数据传输代价更小,性能更好. Scientific Workflow is the typical big data application.By defining the computing tasks and steps,it completes the massive data processing tasks for scientific computing.As the large data and the high cost of mobile networks in scientific workflow,it is essential to apply suitable data placement strategy.With the increase of the number of data centers and data sets,solving the optimal data placement strategy becomes more difficult.Traditional data placement strategies often only get local optimal solution.To solve this challenge,it presents a relaxation and reconstruction data placement strategy to quickly find the data placement scheme closer to the global optimal.Firstly,the strategy is mainly based on preliminary research results to generate the initial solution,and by the local relaxation and reconstruction,constantly improves the quality of the solution. Verified by experiments,compared with the traditional methods,the results show that the data transfer cost of our strategy is smaller.
出处 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期71-76,共6页 Journal of Computer Research and Development
基金 国家自然科学基金项目(61003253) 山东省自然科学基金项目(ZR2010FQ010 ZR2010FM031)
关键词 科学工作流 全局最优 数据布局 局部释放 重构 scientific workflow global optimum data placement local relaxation reconstruction
  • 相关文献

参考文献9

二级参考文献63

共引文献217

同被引文献22

引证文献3

二级引证文献11

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部