为解决并行应用程序使用FFTW(Fastest Fourier Transform in the West)并行软件包所面临的计算规模难以扩展、数据结构变动大、实现不同数据结构间通信难度大、接口不确定等问题,在JASMIN框架内设计实现FFT并行解法器.该解法器封装了数...为解决并行应用程序使用FFTW(Fastest Fourier Transform in the West)并行软件包所面临的计算规模难以扩展、数据结构变动大、实现不同数据结构间通信难度大、接口不确定等问题,在JASMIN框架内设计实现FFT并行解法器.该解法器封装了数据分布存储、数据通信等并行计算细节,通过重新分布存储数据,调用一维FFT变换实现高维FFT的并行计算,并提供规范接口,支撑用户简便地实现FFT的并行计算.数值测试表明,该解法器具有很好的并行性能.该解法器已应用于激光等离子体成丝不稳定性的数值模拟并行程序,它在2048个处理器上的并行效率可达80%以上.展开更多
线性带状方程组并行解法器往往基于两层迭代的区域分解方法,采用M P I(m essage pass ing in terface)实现,因此导致的总迭代次数太多或者进程通信开销太大都会使解法器效率低下。该文通过研究减少迭代次数和降低进程通信开销的方法,设...线性带状方程组并行解法器往往基于两层迭代的区域分解方法,采用M P I(m essage pass ing in terface)实现,因此导致的总迭代次数太多或者进程通信开销太大都会使解法器效率低下。该文通过研究减少迭代次数和降低进程通信开销的方法,设计了一种适合区域分解和M P I系统的高效的归并迭代并行解法器。这种解法器通过引入全局加速收敛算法,把两层迭代归并为一层迭代,有效减少了迭代求解的总次数,并且采用分块并行技术降低M P I系统上加速收敛算法的进程通信开销。实验证明归并迭代并行解法器能够保证和串行解法器大致相当的总迭代次数,分块并行加速收敛技术能够降低接近1/2的全局进程通信时间。展开更多
文摘为解决并行应用程序使用FFTW(Fastest Fourier Transform in the West)并行软件包所面临的计算规模难以扩展、数据结构变动大、实现不同数据结构间通信难度大、接口不确定等问题,在JASMIN框架内设计实现FFT并行解法器.该解法器封装了数据分布存储、数据通信等并行计算细节,通过重新分布存储数据,调用一维FFT变换实现高维FFT的并行计算,并提供规范接口,支撑用户简便地实现FFT的并行计算.数值测试表明,该解法器具有很好的并行性能.该解法器已应用于激光等离子体成丝不稳定性的数值模拟并行程序,它在2048个处理器上的并行效率可达80%以上.
文摘线性带状方程组并行解法器往往基于两层迭代的区域分解方法,采用M P I(m essage pass ing in terface)实现,因此导致的总迭代次数太多或者进程通信开销太大都会使解法器效率低下。该文通过研究减少迭代次数和降低进程通信开销的方法,设计了一种适合区域分解和M P I系统的高效的归并迭代并行解法器。这种解法器通过引入全局加速收敛算法,把两层迭代归并为一层迭代,有效减少了迭代求解的总次数,并且采用分块并行技术降低M P I系统上加速收敛算法的进程通信开销。实验证明归并迭代并行解法器能够保证和串行解法器大致相当的总迭代次数,分块并行加速收敛技术能够降低接近1/2的全局进程通信时间。