摘要
在针对分布内存体系结构的并行识别技术中,如何对计算和数据进行合理分解,以增加数据引用的本地化、减少处理器间的通信是提高并行程序性能的关键。本文通过对Anderson-lam分解算法完整性的补充,给出了一种可实现无通信的计算划分和数据分布算法,并阐述了对该算法在工程实践中的一些优化考虑。
Increasing the locality of data references and minimizing communication of processors by computation and data decomposition are the key optimization for achieving high performance on large-scale parallel machines. A compiler algorithm that automatically finding computation and data decomposition with no communication based on Andersonlain algorithm is described, and some improvement on engineering implement is also mentioned in this paper.
出处
《计算机科学》
CSCD
北大核心
2007年第1期278-280,293,共4页
Computer Science
基金
国防重点科研项目资助
河南省杰出人才创新基金(0521000200)
关键词
并行编译
计算划分
数据分布
Parallel compilation , Data distribution, Computation partition