期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
非结构网格下稀疏下三角方程求解器众核优化技术研究 被引量:3
1
作者 倪鸿 刘鑫 《计算机科学》 CSCD 北大核心 2019年第B06期518-522,共5页
稀疏下三角方程求解器(SpTRSV)作为基础线性代数库中一个重要的算法,在大规模科学计算中有着广泛应用。在非结构网格中,由于非结构网格具有数据存储无序性、数据强相关性以及频繁地离散访存等特点,该算法在众核架构上难以实现有效的并... 稀疏下三角方程求解器(SpTRSV)作为基础线性代数库中一个重要的算法,在大规模科学计算中有着广泛应用。在非结构网格中,由于非结构网格具有数据存储无序性、数据强相关性以及频繁地离散访存等特点,该算法在众核架构上难以实现有效的并行。文中基于国产异构众核处理器SW26010体系结构的特点,针对非结构网格计算,提出了一种基于流水线串行-局部并行思想的通用众核优化方法。该方法能够有效减少非结构网格计算中的随机访存,提高计算效率,并且具有很好的扩展性。基于该算法对多个实际应用算例进行众核优化,实验结果表明:该方法能够实现单核组3倍以上的加速,显著降低了运行时间。 展开更多
关键词 稀疏下三角方程求解器 非结构网格 SW26010 异构众核优化 并行算法
下载PDF
基于GPU的高性能稀疏矩阵向量乘及CG求解器优化 被引量:7
2
作者 王迎瑞 任江勇 田荣 《计算机科学》 CSCD 北大核心 2013年第3期46-49,共4页
以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了... 以有限元/有限差分等为代表的一类数值方法,其总体矩阵常常具有"带状"、稀疏的特点。针对"带状"稀疏矩阵,提出和实现了一种高效的矩阵向量乘存储格式和算法"bDIA"。基于nVidia的GTX280系列GPU对其进行了测试,结果显示:与CUSP支持的5种常见稀疏矩阵存储格式和算法相比较,所提出的bDIA格式以及相应的spMV算法的单双精度浮点效率均可以提高1倍以上,并突破了该系列GPU在spMV计算时4%的单精度浮点效率上限和22.2%的双精度浮点效率上限;应用于共轭梯度(CG)与稳定双共轭梯度(BiCGStab)求解器,相对于DIA格式均有1.5倍左右的加速。 展开更多
关键词 带状稀疏矩阵向量乘 bDIA 广义有限元 GPU CG求解优化
下载PDF
KLU稀疏直接求解器在状态估计中的应用 被引量:4
3
作者 罗玉春 王毅 +1 位作者 闪鑫 邹德虎 《中国电力》 CSCD 北大核心 2019年第2期111-118,共8页
稀疏矩阵及稀疏线性方程组求解已成为大规模电网状态估计计算效率的瓶颈,阐释了基于BTF和Gilbert-Peierls算法的稀疏矩阵直接求解器KLU(Clark Kent LU),并将其嵌入到智能调度技术支持系统中生产运行的状态估计程序功能。首先在计算得到... 稀疏矩阵及稀疏线性方程组求解已成为大规模电网状态估计计算效率的瓶颈,阐释了基于BTF和Gilbert-Peierls算法的稀疏矩阵直接求解器KLU(Clark Kent LU),并将其嵌入到智能调度技术支持系统中生产运行的状态估计程序功能。首先在计算得到雅可比矩阵的基础上基于OpenMP并行化技术快速求解信息矩阵;然后使用KLU求解器进行信息矩阵的因子表符号分析和数值分解;最后在状态估计计算过程中使用KLU求解器求解线性方程组,从而提高大规模电网状态估计的计算效率。通过省中心、分中心、模型数据中心D5000的状态估计实际应用,证明了该方法的有效性和实用性。 展开更多
关键词 电力系统 状态估计 稀疏矩阵 向左看LU分解 多线程 KLU求解
下载PDF
有限元求解器Calculix预处理并行优化方法 被引量:1
4
作者 林欣达 林穗 +2 位作者 姜文超 李东明 王多强 《广东工业大学学报》 CAS 2015年第4期138-144,154,共8页
针对船舶疲劳强度分析中大规模数值计算分析的效率问题,在广州超算中心先导系统环境下对开源有限元求解器Calculix中求解线性方程组迭代法的预处理方法进行并行优化,提出基于列主元的多行双门槛的不完全LU分解预处理方法,证明该方法下... 针对船舶疲劳强度分析中大规模数值计算分析的效率问题,在广州超算中心先导系统环境下对开源有限元求解器Calculix中求解线性方程组迭代法的预处理方法进行并行优化,提出基于列主元的多行双门槛的不完全LU分解预处理方法,证明该方法下的不完全LU分解可以进行下去,并在广州超算中心先导系统环境下开发原型系统,运用实际测试算例验证了该方法在相同的条件下,有效缩短了船舶疲劳强度分析中数值分析部分的计算时间. 展开更多
关键词 有限元求解 稀疏线性方程 不完全预条件方法 船舶疲劳强度分析 超级计算机
下载PDF
塔机有限元分析求解器的快速求解技术
5
作者 李建新 高创宽 高崇仁 《机械管理开发》 2006年第4期29-31,共3页
塔式起重机结构有限元分析中,静力方程求解器是分析程序的核心。随着塔机求解规模的增大及对求解速度的高要求,传统的直接求解器愈显不足,成为有限元分析中的瓶颈。目前较好的塔机有限元程序是用稀疏直接求解器,其中引入循环展开(loop-u... 塔式起重机结构有限元分析中,静力方程求解器是分析程序的核心。随着塔机求解规模的增大及对求解速度的高要求,传统的直接求解器愈显不足,成为有限元分析中的瓶颈。目前较好的塔机有限元程序是用稀疏直接求解器,其中引入循环展开(loop-unrolling)技术改进工作性能,实践证明,它对内存或硬盘空间的需求量明显减少,求解速度得到显著提高。 展开更多
关键词 静力方程求解 塔机有限元分析程序 稀疏直接求解 循环展开
下载PDF
有限元分析快速直接求解技术进展 被引量:4
6
作者 周洪伟 吴舒 陈璞 《力学进展》 EI CSCD 北大核心 2007年第2期175-188,共14页
现代的有限元分析往往产生大规模的线性方程组,它的求解效率是有限元分析中最关键的一环.自20世纪90年代中期,有限元的求解技术发生了巨大的变化,传统的变带宽解法与波前法被稀疏解法所替代.这一替代为有限元分析带来了求解速度的突破... 现代的有限元分析往往产生大规模的线性方程组,它的求解效率是有限元分析中最关键的一环.自20世纪90年代中期,有限元的求解技术发生了巨大的变化,传统的变带宽解法与波前法被稀疏解法所替代.这一替代为有限元分析带来了求解速度的突破,它使得1万到10万个节点的实用三维有限元分析在微机上即时求解成为现实.本文回顾非并行有限元快速直接求解技术在过去20年的发展,着重讨论了填充元优化与浮点加速运算方法,期望能引起同行的注意. 展开更多
关键词 有限元分析 直接求解 稀疏矩阵 高效能计算
下载PDF
基于稀疏存储的有限元结构分析高效缩聚并行计算方法 被引量:1
7
作者 苗新强 金先龙 丁峻宏 《农业机械学报》 EI CAS CSCD 北大核心 2015年第4期338-343,共6页
基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素... 基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素的存储和运算,从而大幅度节省内存空间和有效减少计算量。最后通过发动机曲轴的有限元数值仿真实验对算法的有效性进行了验证。结果表明:相对传统变带宽格式缩聚并行计算方法,稀疏存储格式缩聚并行计算方法能够大幅度节省内存空间和有效提高计算效率;各子区域规模越大,该方法对内存空间的节省和计算效率的提高效果就越明显。 展开更多
关键词 高性能计算 有限元分析 稀疏存储技术 直接稀疏求解 缩聚
下载PDF
基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术 被引量:1
8
作者 苗俊田 刘冬冬 +2 位作者 李卓军 赵博 鹿德台 《现代电子技术》 2023年第21期55-58,共4页
针对输油管道焊接缺陷漏磁信号量大,无法精准检测漏磁信号磁场强度,影响识别效果的问题,提出基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术。应用双正交样条小波技术分解信号,采用稀疏矩阵求解器分解磁感应强度。计算连续小波... 针对输油管道焊接缺陷漏磁信号量大,无法精准检测漏磁信号磁场强度,影响识别效果的问题,提出基于双正交样条小波的输油管道焊接缺陷漏磁信号识别技术。应用双正交样条小波技术分解信号,采用稀疏矩阵求解器分解磁感应强度。计算连续小波变换系数和缺陷内漏磁场场磁导率,明确不同介质磁感应强度和场磁导率关系,识别凹、凸缺陷漏磁信号。实验结果表明,该技术凹形缺陷磁场强度检测结果只在峰值处出现了与实际数据最大为50 A/m的偏差,凸形缺陷磁场强度检测结果与实验数据一致。 展开更多
关键词 双正交样条小波 输油管道 焊接缺陷 漏磁信号识别 磁感应强度 稀疏矩阵求解 连续小波变换 磁导率
下载PDF
基于局部加密等级网格的2.5D直流电法有限元模拟 被引量:3
9
作者 胡宏伶 肖晓 +2 位作者 潘克家 汤井田 谢维 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第7期2259-2267,共9页
合理截取半圆形计算区域,采取局部加密的?-等级网格,结合对称行索引存贮格式(CSR)及并行稀疏直接求解器PARDISO,提出一种高效、高精度的2.5D直流电阻率法有限元正演方案,并编制相应的Fortran程序,对具有解析解的3个典型地电模型进行计... 合理截取半圆形计算区域,采取局部加密的?-等级网格,结合对称行索引存贮格式(CSR)及并行稀疏直接求解器PARDISO,提出一种高效、高精度的2.5D直流电阻率法有限元正演方案,并编制相应的Fortran程序,对具有解析解的3个典型地电模型进行计算与分析。研究结果表明:圆形截断边界不仅便于在径向方向上采取?-等级网格剖分,而且能大大简化有限元模拟中单元刚度矩阵的计算;结构化的等级网格避开了通常非结构化网格有限元计算时繁琐的网格剖分及总体刚度阵的集成过程,且能在不增大问题规模的前提下,显著提高2.5D直流电法正演源点附近的模拟精度;Intel MKL的PARDISO求解器能在普通PC机上5 s内求解电法正演有限元离散得到的100万阶稀疏线性方程组,可广泛用于各种地球物理正演问题。 展开更多
关键词 直流电阻率 等级网格 有限元 局部加密 并行稀疏直接求解 行索引存贮格式
下载PDF
三维自由面流动模拟中GPU并行计算技术 被引量:2
10
作者 李海州 唐振远 万德成 《海洋工程》 CSCD 北大核心 2016年第5期20-29,39,共11页
MPS(Moving Particle Semi-implicit)法能够有效地处理溃坝、晃荡等自由面大变形流动问题。在三维MPS方法中,粒子数量的急剧增加会导致其计算效率的降低并限制其在大规模流动问题中的应用。基于自主开发的MPS求解器MLParticleSJTU,本文... MPS(Moving Particle Semi-implicit)法能够有效地处理溃坝、晃荡等自由面大变形流动问题。在三维MPS方法中,粒子数量的急剧增加会导致其计算效率的降低并限制其在大规模流动问题中的应用。基于自主开发的MPS求解器MLParticleSJTU,本文对求解过程中耗时最多的邻居粒子搜寻和泊松方程求解两个模块采用了GPU并行加速,详细探讨了CPU+GPU策略。以三维晃荡和三维溃坝这两种典型的自由面大变形流动为例,比较了CPU+GPU相对于MLParticle-SJTU串行求解时的加速情况,结果表明CPU+GPU在邻居粒子和泊松方程这两个模块中的加速比最高能达到十倍左右。此外,采用CPU+GPU并行能够较准确地模拟溃坝、晃荡等自由面大变形问题。 展开更多
关键词 MLParticle-SJTU求解 邻居粒子搜索 GPU并行技术 稀疏矩阵求解 溃坝 晃荡
下载PDF
基于面向对象的非线性瞬态电磁场快速算法
11
作者 徐景钧 孟大伟 周封 《哈尔滨理工大学学报》 CAS 2003年第3期64-67,共4页
针对求解非线性瞬态电磁场问题数据量大、速度慢的缺点,以及商业软件对研究的自主性、深入程度的制约,基于数据结构的基本原理,采用面向对象(OOP)和组件(COM)技术,提出了一种非线性瞬态电磁场问题求解的快速算法,将ICCG法、N—R法求解... 针对求解非线性瞬态电磁场问题数据量大、速度慢的缺点,以及商业软件对研究的自主性、深入程度的制约,基于数据结构的基本原理,采用面向对象(OOP)和组件(COM)技术,提出了一种非线性瞬态电磁场问题求解的快速算法,将ICCG法、N—R法求解等过程和稀疏矩阵的构建紧密耦合,大大提高了计算速度,并易嵌入到其他软件中。仿真计算表明,该方法是有效的,且适合于工程及科研应用。 展开更多
关键词 面向对象 非线性瞬态电磁场 电机模型 非线性方程求解 算法 数据结构 组件技术 稀疏矩阵 ICCG法 N-R法
下载PDF
有限单元法 并行稀疏静力学和本征值求解
12
作者 Duc Thai Nguyen 邓守春 《国外科技新书评介》 2007年第11期15-15,共1页
有限单元法(FEM)及其软件是求解大型工程应用的最有效工具之一。在这类应用问题中,有效的方程和本征值求解器扮演着至关重要的角色。稀疏矩阵及其求解技术已经足够成熟并在商用软件中实现。然而,截至目前,关于稀疏系数方程求解、La... 有限单元法(FEM)及其软件是求解大型工程应用的最有效工具之一。在这类应用问题中,有效的方程和本征值求解器扮演着至关重要的角色。稀疏矩阵及其求解技术已经足够成熟并在商用软件中实现。然而,截至目前,关于稀疏系数方程求解、Lanczos域分解或FEM并行计算的详细介绍的书籍尚不多见。 展开更多
关键词 有限单元法 稀疏矩阵 并行计算 求解 本征值 静力学 商用软件 方程求解
原文传递
优秀产品介绍
13
《工业设计》 2009年第12期62-62,共1页
设计工具DS SIMULIA发布Abaqus6.9-EF此知名FEA分析工具的最新版本拥有重要的新功能,同时增强了建模,高等力学和性能等众多方面。这种改善使得用户更加强化了仿真软件的应用,使得在产品开发过程中能够降低成本和提高效率。
关键词 产品介绍 DS 仿真软件 软件工程 模拟输入 SFDR 混合信号 稀疏矩阵求解 单通道 迭代求解 AOS 占空比
下载PDF
工程计算中大型稀疏矩阵存储方法研究 被引量:8
14
作者 纪国良 丁勇 +1 位作者 周曼 冯仰德 《数值计算与计算机应用》 2018年第3期217-230,共14页
在工程实际中,许多问题都可以归结为数值法求解偏微分方程(组)的问题.偏微分方程数值解法主要包括有限差分法、有限元法和有限体积法,其中大多数方法都是通过离散的方式将方程转化为线性方程组,通过求解线性系统得到原方程的数值解.... 在工程实际中,许多问题都可以归结为数值法求解偏微分方程(组)的问题.偏微分方程数值解法主要包括有限差分法、有限元法和有限体积法,其中大多数方法都是通过离散的方式将方程转化为线性方程组,通过求解线性系统得到原方程的数值解.在这个过程中,线性方程组的系数矩阵通常很大并且很稀疏,会占用大量存储空间并使方程组难以求解.针对这个问题,本文研究大型稀疏矩阵的压缩存储方法,只存储非零元素,降低存储空间消耗,避免零元素参与计算,提升计算效率.具体来说,在稀疏矩阵生成过程中,使用十字链表法存储,可以在常数时间内完成非零元素的插入操作;在方程组求解过程中,使用按行(列)压缩存储方法,既节约存储空间,又可以提高求解器的求解效率.在实验部分,本文分别使用有限差分法求解Laplace方程和有限元法计算圆环截面应力分布问题,对其中大型稀疏线性方程组的系数矩阵,采用十字链表法和按行(列)压缩存储法存储,使用直接法和迭代法求解线性方程组.实验结果显示,对于结构化和非结构化的稀疏矩阵,压缩存储方法不仅能够大幅度减少内存空间的占用,而且能够显著提升求解器的效率. 展开更多
关键词 偏微分方程 大型稀疏矩阵 十字链表 按行(列)压缩存储格式 求解
原文传递
适用于等熵流动的交错拉氏Godunov方法 被引量:3
15
作者 孙晨 李肖 沈智军 《计算物理》 EI CSCD 北大核心 2020年第5期529-538,共10页
为消除传统单元中心型Godunov方法在求解稀疏波问题时的非物理过热现象,发展一种适用于等熵流动的交错拉氏Godunov方法.主要的特征是采用速度与热力学变量交错分布的形式,避免在单元内进行速度平均,从而消除由于动量平均过程导致的动能... 为消除传统单元中心型Godunov方法在求解稀疏波问题时的非物理过热现象,发展一种适用于等熵流动的交错拉氏Godunov方法.主要的特征是采用速度与热力学变量交错分布的形式,避免在单元内进行速度平均,从而消除由于动量平均过程导致的动能耗散.与传统的von Neumann型交错网格方法相比,网格的边界通量由节点处的多维黎曼求解器提供,克服了多维人工粘性选取带来的困难.为减少多维黎曼求解器在求解稀疏波问题时的非物理熵增,给出稀疏波出现的合理判据,从而保证了热力学关系式的满足.数值实验表明:该方法能很好地消除稀疏波的过热现象,同时在求解激波问题时又能保持与传统单元中心型拉氏方法相同的激波捕捉能力. 展开更多
关键词 交错网格 黎曼求解 稀疏 Godunov方法
原文传递
拉格朗日方法中减小非物理熵增的方法
16
作者 王丽吉 郭虹平 沈智军 《计算物理》 CSCD 北大核心 2022年第2期179-190,共12页
为了减少Godunov方法在计算等熵流动问题时的非物理现象,研究单元中心型拉格朗日方法的离散熵增问题。通过对传统数值方法进行压力修正,提出一种基于完全离散熵不等式的通量修正方法。数值实验表明:改进后的通量算法在计算包含膨胀波的... 为了减少Godunov方法在计算等熵流动问题时的非物理现象,研究单元中心型拉格朗日方法的离散熵增问题。通过对传统数值方法进行压力修正,提出一种基于完全离散熵不等式的通量修正方法。数值实验表明:改进后的通量算法在计算包含膨胀波的问题时能够有效地减少原拉格朗日方法的非物理误差。 展开更多
关键词 Godunov方法 黎曼求解 稀疏
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部