期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
面向GPU平台的并行结构化稀疏三角方程组求解器
1
作者 陈道琨 杨超 +1 位作者 刘芳芳 马文静 《软件学报》 EI CSCD 北大核心 2023年第11期4941-4951,共11页
稀疏三角线性方程组求解(SpTRSV)是预条件子部分的重要操作,其中结构化SpTRSV问题,在以迭代方法求解偏微分方程组的科学计算程序中,是一种较为常见的问题类型,而且通常是科学计算程序的需要解决的一个性能瓶颈.针对GPU平台,目前以CUSPA... 稀疏三角线性方程组求解(SpTRSV)是预条件子部分的重要操作,其中结构化SpTRSV问题,在以迭代方法求解偏微分方程组的科学计算程序中,是一种较为常见的问题类型,而且通常是科学计算程序的需要解决的一个性能瓶颈.针对GPU平台,目前以CUSPARSE为代表的商用GPU数学库,采用分层调度(level-scheduling)方法并行化SpTRSV操作.该方法不仅预处理耗时较长,而且在处理结构化SpTRSV问题时会出现较为严重GPU线程闲置问题.针对结构化SpTRSV问题,提出一种面向结构化SpTRSV问题的并行算法.该算法利用结构化SpTRSV问题的特殊非零元分布规律进行任务划分,避免对输入问题的非零元结构进行预处理分析.并对现有分层调度方法的逐元素处理策略进行改进,在有效缓解GPU线程闲置问题的基础上,还隐藏了部分矩阵非零元素的访存延迟.还根据算法的任务划分特点,采用状态变量压缩技术,显著提高算法状态变量操作的缓存命中率.在此基础上,还结合谓词执行等GPU硬件特性,对算法实现进行全面的优化.所提算法在NVIDIA V100 GPU上的实测性能,相比CUSPARSE平均有2.71倍的加速效果,有效访存带宽最高可达225.2 GB/s.改进后的逐元素处理策略,配合针对GPU硬件的一系列调优手段,优化效果显著,将算法的有效访存带宽提高了约1.15倍. 展开更多
关键词 稀疏三角线性方程组求解(SpTRSV) 模板计算 结构化网格 GPU 异构并行算法
下载PDF
三角形方程组的一种分布式并行算法 被引量:7
2
作者 骆志刚 李晓梅 胡庆丰 《计算机工程与设计》 CSCD 北大核心 2000年第6期54-59,共6页
提出了分布式环境下求解三角形方程组的一种新的并行算法,该算法基于将系数矩阵和右端项分块,并将其以块行卷帘方式分布存储在各处理器的局部存储器,利用通信与计算重叠的技术,取得了比块列扫描算法好的效果,当方程组具有多重右端... 提出了分布式环境下求解三角形方程组的一种新的并行算法,该算法基于将系数矩阵和右端项分块,并将其以块行卷帘方式分布存储在各处理器的局部存储器,利用通信与计算重叠的技术,取得了比块列扫描算法好的效果,当方程组具有多重右端项时,效果尤为突出。文中给出了在 YH3M 计算机上该算法的数值试验结果及其与块列扫描算法的数值比较结果。 展开更多
关键词 分布式存储 三角形方程组 并行算法 矩阵块
下载PDF
基于服务器并行求解三角形方程组的设计与实现
3
作者 刘青昆 邢芳 《计算机工程与设计》 CSCD 北大核心 2010年第18期4005-4008,共4页
针对在实际应用中超出内存容量的大规模矩阵不可调入的问题,设计并实现了一种面向A矩阵连续划分的、子文件大小可调节的求解三角形方程组的并行方案。理论上只要在不超过硬盘容量的前提下,该算法可以在小规模内存条件下求解任意规模的... 针对在实际应用中超出内存容量的大规模矩阵不可调入的问题,设计并实现了一种面向A矩阵连续划分的、子文件大小可调节的求解三角形方程组的并行方案。理论上只要在不超过硬盘容量的前提下,该算法可以在小规模内存条件下求解任意规模的矩阵。最后给出在Altix3700服务器上基于ABEEM模型的数值实验,实验结果表明了该算法的有效性。 展开更多
关键词 ABEEM模型 分布式存储 三角形方程组 并行算法 MPI 矩阵划分
下载PDF
PC机上并行计算线性方程组 被引量:4
4
作者 唐俭 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第1期38-44,共7页
:作者从微机内存有限这一实际情况出发 ,采取内存与硬盘交换数据的方法 ,利用网络技术及可移植消息传递界面MPI,给出了在微机簇上实现求解较大规模线性方程组的并行算法。同时 ,此算法也适用于在单个微机上串行求解线性方程组。并编制... :作者从微机内存有限这一实际情况出发 ,采取内存与硬盘交换数据的方法 ,利用网络技术及可移植消息传递界面MPI,给出了在微机簇上实现求解较大规模线性方程组的并行算法。同时 ,此算法也适用于在单个微机上串行求解线性方程组。并编制程序在微机簇上进行了数值试验 。 展开更多
关键词 并行矩阵分解 并行高斯消元法 网络并行计算MPI 线性方程组 并行算法 PC机 数据交换
下载PDF
SW26010处理器上的并行结构化稀疏三角方程组求解器 被引量:1
5
作者 陈道琨 刘芳芳 杨超 《软件学报》 EI CSCD 北大核心 2022年第12期4452-4463,共12页
稀疏三角线性方程组求解(Sp TRSV)在科学与工程计算领域是比较重要的核心计算函数,其中基于结构化网格构造的线性方程组是Sp TRSV求解器经常遇到的一类问题.在国产神威?太湖之光超级计算机所配备的SW26010处理器上,Sp TRSV求解器通常需... 稀疏三角线性方程组求解(Sp TRSV)在科学与工程计算领域是比较重要的核心计算函数,其中基于结构化网格构造的线性方程组是Sp TRSV求解器经常遇到的一类问题.在国产神威?太湖之光超级计算机所配备的SW26010处理器上,Sp TRSV求解器通常需要结合该平台的架构特点,通过搭建一定的数据路由体系来满足各工作线程对未知量数据的需求.面向与结构化网格相关的稀疏三角方程组问题,提出一套适用于SW26010处理器的并行求解器.该求解器在任务划分阶段将各线程的数据依赖模式限制在相对可控的范围之内,并在无数据路由的条件下解决线程的通信问题,不仅消除了数据路由带来的额外通信开销,而且适用的问题范围也不再受数据路由规则的制约.经测试,针对多种不同类型的结构化网格问题,提出的求解器框架的平均访存带宽利用率达88.2%,部分问题的访存带宽可达平台峰值带宽的94.5%(24.5 GB/s),整体性能相比现有工作有较为明显的提高. 展开更多
关键词 稀疏三角线性方程求解(Sp TRSV) 结构化网格 SW26010处理器 异构计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部