期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于区域平均执行时间和数据依赖信息的可能并行区域识别 被引量:1
1
作者 张超 王蕾 +1 位作者 向晓娅 冯晓兵 《计算机学报》 EI CSCD 北大核心 2008年第10期1745-1753,共9页
随着多核处理器逐渐成为处理器发展的新趋势,为了持续提高程序性能,必须并行执行应用程序.传统的自动并行技术能够很好地并行科学计算应用中的规则循环,但对于含有大量函数调用和指针引用的不规则程序,目前还不能有效地对其实施并行.针... 随着多核处理器逐渐成为处理器发展的新趋势,为了持续提高程序性能,必须并行执行应用程序.传统的自动并行技术能够很好地并行科学计算应用中的规则循环,但对于含有大量函数调用和指针引用的不规则程序,目前还不能有效地对其实施并行.针对这一现状,文中提出了基于区域平均执行时间和数据依赖信息的可能并行区域识别方法来对一些不规则程序实施高效并行,主要贡献如下:(1)自动识别程序中的多种并行性,不仅包括传统并行性分析中的循环迭代间的细粒度并行性,而且也包括传统并行性分析尚不能有效处理的循环体和函数调用点间的粗粒度并行性.对于程序中蕴含的众多并行性,文中基于区域平均执行时间实施收益分析来选择合适的并行区域实施并行;(2)自动识别可能并行区域间数据依赖关系的数量、类型以及导致数据依赖关系的程序变量.基于文中的分析结果,作者使用面向行为的投机并行系统(behavior oriented parallelism)对SPEC2006中的4个测试用例实现了并行化.并行化后的程序在Intel和AMD多核处理器上分别得到了300%和260%的平均性能加速. 展开更多
关键词 可能并行区域 区域平均执行时间 数据依赖信息 投机并行
下载PDF
Performance Metrics and Models for Shared Cache
2
作者 丁晨 向晓娅 +3 位作者 包斌 罗昊 罗英伟 汪小林 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第4期692-712,共21页
Performance metrics and models are prerequisites for scientific understanding and optimization. This paper introduces a new footprint-based theory and reviews the research in the past four decades leading to the new t... Performance metrics and models are prerequisites for scientific understanding and optimization. This paper introduces a new footprint-based theory and reviews the research in the past four decades leading to the new theory. The review groups the past work into metrics and their models in particular those of the reuse distance, metrics conversion, models of shared cache, performance and optimization, and other related techniques. 展开更多
关键词 memory performance metric cache sharing reuse distance
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部