期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于异构系统的多级并行稀疏张量向量乘算法
1
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 cpu-gpu 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:5
2
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
下载PDF
电力系统全纯嵌入潮流的并行计算
3
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 cpu-gpu异构运算平台 预处理器
下载PDF
基于XML的数学模型管理平台
4
作者 朱宏涛 郭贵锁 《电脑开发与应用》 2005年第3期29-30,33,共3页
为解决多数管理平台存在的诸如模型信息交流不畅、异构数据处理不便、模型输出不易重用等问题 ,提出了基于 XML的数学模型管理平台构建方法 ,该方法充分利用了最新的 XML技术。使数学模型可以方便地发布、组合、查询和调用 ,为建立实用... 为解决多数管理平台存在的诸如模型信息交流不畅、异构数据处理不便、模型输出不易重用等问题 ,提出了基于 XML的数学模型管理平台构建方法 ,该方法充分利用了最新的 XML技术。使数学模型可以方便地发布、组合、查询和调用 ,为建立实用的数学模型管理平台提供了一种可行的方法。实践证明该平台可以广泛应用在数据输入格式化的数学模型运算软件系统中。 展开更多
关键词 XML 调用 重用 异构数据 格式化 软件系统 查询 管理平台 证明 运算
下载PDF
基于不完全LU分解预处理迭代法的电力系统潮流算法 被引量:17
5
作者 唐坤杰 董树锋 宋永华 《中国电机工程学报》 EI CSCD 北大核心 2017年第S1期55-62,共8页
随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运... 随着电力系统规模日益增大,对潮流计算速度与实时性的要求相应提高。为了适应大规模电力系统潮流计算需求,根据Krylov子空间思想,提出了一种基于迭代法求解线性方程组的潮流算法,该算法利用不完全LU分解作为预处理,并采用CPU-GPU异构运算架构,根据CPU和GPU的不同特点,将潮流算法分为CPU处理部分和GPU处理部分,其中GPU用于并行处理计算量最为密集的线性方程组求解步骤,CPU用于处理潮流算法的其他步骤,实现快速求解。算例表明,所提算法收敛性能稳定、收敛速度快、算法效率高,在系统规模较大时,与传统基于LU分解的潮流算法相比具有明显优势,能够满足大规模电网在线潮流计算的需求,具有工程应用价值。 展开更多
关键词 KRYLOV子空间 不完全LU分解 大规模稀疏线性方程组 潮流计算 cpu-gpu异构运算架构
下载PDF
基于预处理BICGSTAB法的电力系统潮流并行计算方法 被引量:4
6
作者 宋晓喆 魏国 +3 位作者 李雪 王长江 孙福寿 李振元 《电力系统保护与控制》 EI CSCD 北大核心 2020年第20期18-28,共11页
为实现大规模电力系统潮流的准确、快速求解,以非精确牛顿法为基础,提出一种基于CPU-GPU异构平台的电力系统潮流并行计算方法。修正方程组的求解是牛拉法潮流计算中最为耗时的部分,提升修正方程组的求解效率可有效提升潮流计算效率。为... 为实现大规模电力系统潮流的准确、快速求解,以非精确牛顿法为基础,提出一种基于CPU-GPU异构平台的电力系统潮流并行计算方法。修正方程组的求解是牛拉法潮流计算中最为耗时的部分,提升修正方程组的求解效率可有效提升潮流计算效率。为此,根据雅可比矩阵的不对称不定性,采用稳定双正交共轭梯度(bi-conjugate gradient stabilized,BICGSTAB)法进行修正方程组的求解。进一步,为改善BICGSTAB法的收敛性,根据雅可比矩阵的稀疏性和类对角占优性,提出一种改进PPAT(Preconditioner with sparsity Pattern of AT,PPAT)预处理器和改进Jacobi预处理器相结合的两阶段预处理方法,并对雅可比矩阵进行预处理,提升BICGSTAB法的收敛性能。然后,将上述潮流算法移植到CPU-GPU异构平台,实现电力系统潮流的并行求解。最后,通过不同测试系统算例对所提方法进行验证、分析。结果表明,所提潮流并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 潮流计算 非精确牛顿法 雅可比矩阵 BICGSTAB法 预处理器 cpu-gpu异构平台
下载PDF
基于GPU的杆系离散元并行算法在大型工程结构中的应用 被引量:3
7
作者 叶继红 王佳 《工程力学》 EI CSCD 北大核心 2021年第2期1-7,共7页
杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-... 杆系DEM(离散元,discrete element method)是求解结构强非线性问题的有效方法,但随着结构数值计算规模的扩大,杆系DEM所需要的计算时间也随之急剧膨胀。为了提高杆系DEM的计算效率,该研究提出单元级并行、节点级并行的计算方法,基于CPU-GPU异构平台,建构了杆系DEM并行计算框架,编制了相应的几何非线性计算程序,实现了杆系DEM的GPU多线程并行计算。对杆系DEM并行算法的设计主要包括数据存储方式、GPU线程计算模式、节点物理量集成方式以及数据传输优化。最后采用大型三维框架、球壳结构模型分别验证了杆系DEM并行算法的计算精度,并对杆系DEM并行算法进行了计算性能测试,测试结果表明杆系DEM并行算法加速比最高可达12.7倍。 展开更多
关键词 离散单元法 杆系结构 几何非线性 GPU并行计算 cpu-gpu异构平台
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部