期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
不完全LU分解预处理的BICGSTAB算法在大地电磁二维正演模拟中的应用 被引量:49
1
作者 柳建新 蒋鹏飞 +3 位作者 童孝忠 徐凌华 谢维 王浩 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第2期484-491,共8页
基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式。针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩... 基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式。针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩阵,求解其对应方程组会遇到很多困难等问题,采用不完全LU分解(即上三角与下三角分解)处理的稳定双共轭梯度算法(BICGSTAB算法)求解该线性方程组,通过对层状介质和二维模型电磁响应进行计算,获得二维大地电磁的视电阻率曲线和阻抗相位曲线。研究结果表明,BICGSTAB算法具有速度快、精度高和稳定性好等优点。 展开更多
关键词 大地电磁 有限单元法 二维正演 不完全lu分解 BICGSTAB算法
下载PDF
矩阵LU分解的容错并行算法设计与实现 被引量:3
2
作者 杜云飞 王攀峰 +2 位作者 富弘毅 周海芳 杨学军 《微电子学与计算机》 CSCD 北大核心 2008年第10期1-4,共4页
给出了容错并行算法的定义,提出了一种新的基于并行复算的容错并行算法.针对许多计算密集型任务中的矩阵LU分解设计了相应的基于并行复算的容错并行算法,并对设计的矩阵LU分解的容错并行算法的性能进行了评估并与checkpointing方法进行... 给出了容错并行算法的定义,提出了一种新的基于并行复算的容错并行算法.针对许多计算密集型任务中的矩阵LU分解设计了相应的基于并行复算的容错并行算法,并对设计的矩阵LU分解的容错并行算法的性能进行了评估并与checkpointing方法进行了对比.结果表明与checkpointing方法相比,矩阵LU分解的容错并行算法有性能上的优势. 展开更多
关键词 矩阵lu分解 并行算法 容错
下载PDF
LU分解和Laplace算法在GPU上的实现 被引量:9
3
作者 陈颖 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期851-855,共5页
随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)... 随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。 展开更多
关键词 图形处理器 lu分解 Laplace算法 统一计算设备架构 共享存储器
下载PDF
LU-ADI方法在求解跨声速翼型绕流问题中的应用 被引量:1
4
作者 李锋 汪翼云 《空气动力学学报》 CSCD 北大核心 1990年第3期358-362,共5页
本文利用LU-ADI方法求解了跨声速范围内的Euler、NS方程。研究了边界的处理和某些求解方法的改进。
关键词 翼型 跨声速流 绕流 lu-ADI法
下载PDF
自适应谱修正LU分解法解算高病态法方程 被引量:15
5
作者 邓兴升 孙虹虹 《大地测量与地球动力学》 CSCD 北大核心 2014年第6期135-139,共5页
谱修正迭代算法及其改正算法均没有很好地解决收敛速度与降低矩阵病态性之间的矛盾,且改进算法的阻尼因子缺乏有效的确定方法。针对该问题,提出自适应谱修正LU分解算法。该算法基于谱修正方程,采用LU分解法解算法方程,回避了矩阵求逆问... 谱修正迭代算法及其改正算法均没有很好地解决收敛速度与降低矩阵病态性之间的矛盾,且改进算法的阻尼因子缺乏有效的确定方法。针对该问题,提出自适应谱修正LU分解算法。该算法基于谱修正方程,采用LU分解法解算法方程,回避了矩阵求逆问题;在迭代过程中,阻尼因子不固定,而是根据残差下降速度自适应地调整其大小。该算法能极大降低高病态法方程的解算迭代次数,提高收敛速度和计算精度。 展开更多
关键词 自适应 谱修正算法 lu分解 高病态矩阵 法方程
下载PDF
矩阵的LU并行递归分解算法的设计研究 被引量:1
6
作者 黄丽嫦 《科学技术与工程》 北大核心 2012年第15期3626-3629,3635,共5页
分析了矩阵的LU分解原理,并在双核微机上设计实现了一种矩阵的LU并行递归分解算法.该算法的特点是引入分块矩阵把LU分解形成迭代递归的形式,进而较好地发挥了新型微机的并行运算和高速缓冲存储器的功能.实验结果表明该算法是可行和有效的。
关键词 矩阵 lu分解 并行递归算法
下载PDF
可选主元LU分解流水线算法设计与FPGA实现
7
作者 牛新 周杰 +1 位作者 窦勇 雷元武 《高技术通讯》 EI CAS CSCD 北大核心 2009年第5期511-518,共8页
提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与... 提出了一种可以进行列主元选取的细粒度LU分解流水线算法并在现场编程门阵列(FPGA)上得到了实现。该算法可以在进行列主元选取的同时,充分利用数据的重用性,以减少数据读写次数。对其中的关键运算实现了细粒度全流水,提高了分解性能。与Celeron(R) 3.07GHz通用处理器主机相比可以得到平均6到7倍的加速比。与其他在FP-GA上实现的LU分解算法相比,该算法在占用相对较少资源和保持高分解效率的前提下提高了计算的精确度和稳定性。 展开更多
关键词 lu 分解 流水线 并行算法 列主元选取 现场编程门阵列(FPGA)
下载PDF
基于脉动阵列的LU算法矩阵求逆VLSI结构 被引量:2
8
作者 孙泉 赵明 张秀君 《微电子学与计算机》 CSCD 北大核心 2007年第3期138-141,共4页
介绍了对矩阵进行LU分解算法求逆的电路结构设计,设计过程中通过对算法进行分解得到合理的运算顺序,从而发现结构中可以复用的模块。结构的设计采用了脉动阵列,并且阵列单元模块的内部结构控制信号和运算过程简单,不存在输出信号反馈和... 介绍了对矩阵进行LU分解算法求逆的电路结构设计,设计过程中通过对算法进行分解得到合理的运算顺序,从而发现结构中可以复用的模块。结构的设计采用了脉动阵列,并且阵列单元模块的内部结构控制信号和运算过程简单,不存在输出信号反馈和多种信号综合控制的情况。电路因为脉动阵列中运用的流水的结构使得整个系统具有较大的吞吐量,所以系统的运算速度很快,而且通过对结构进行的优化可以使得整个设计的面积减小很大。 展开更多
关键词 脉动阵列 lu算法 矩阵求逆 吞吐量
下载PDF
高超声速流动计算中LU-SGS隐式算法的应用 被引量:3
9
作者 曹文斌 李桦 丁国昊 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第3期18-23,共6页
在高超声速条件下,对原始LU-SGS格式及其改进方法的收敛速度做了深入的比较分析,目的是进一步更好地将LU-SGS算法用于工程上复杂外形的计算模拟中。二维圆柱,三维钝锥及空天飞机算例的结果表明:对于高超声速粘性流动的计算,粘性项应进... 在高超声速条件下,对原始LU-SGS格式及其改进方法的收敛速度做了深入的比较分析,目的是进一步更好地将LU-SGS算法用于工程上复杂外形的计算模拟中。二维圆柱,三维钝锥及空天飞机算例的结果表明:对于高超声速粘性流动的计算,粘性项应进行隐式处理;BLU-SGS方法给出的内迭代方式的收敛性优于DP-LUR方法所给出的内迭代方式;LU-SGS算法中雅克比系数矩阵的计算方式对计算量及收敛性影响较大,若采用精确的矩阵形式,则在流动无分离情况下能取得快速收敛的效果,而在含有流动分离的情况,因受稳定性的影响,精确的矩阵形式的收敛表现不及对角近似形式。 展开更多
关键词 lu-SGS隐式算法 收敛性 高超声速 计算流体力学
下载PDF
全隐LU-SGS算法在高超声速热化学非平衡流刚性问题中的应用 被引量:2
10
作者 蒋浩 柳军 +2 位作者 王君媛 黄伟 杜洋 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第2期1-8,共8页
在高超声速热化学非平衡流动计算中,当地气体能量松弛时间、化学反应特征时间与流动时间推进步长量级差异过大会带来严重数值刚性问题,且在高雷诺数条件下,壁面、拐角等强干扰区网格加密使得该问题加剧,导致初始最大CFL数极小,收敛速度... 在高超声速热化学非平衡流动计算中,当地气体能量松弛时间、化学反应特征时间与流动时间推进步长量级差异过大会带来严重数值刚性问题,且在高雷诺数条件下,壁面、拐角等强干扰区网格加密使得该问题加剧,导致初始最大CFL数极小,收敛速度缓慢。原始LU-SGS算法仅考虑化学反应源项和对流项的隐式处理,通过推导黏性项Jacobian矩阵谱半径并采用对角近似处理,发展了热化学非平衡FLU-SGS和BLU-SGS两种全隐LU-SGS算法;针对高焓二维圆柱和轴对称返回舱算例,对比改进前后三种算法的收敛特性。结果表明,FLU-SGS及BLU-SGS算法能够快速建立强黏性干扰和大分离流场、解决热化学非平衡复杂流计算中的刚性问题,实现初始最大CFL数3至5个量级的提升,加速收敛效果明显。 展开更多
关键词 高超声速 热化学非平衡 数值刚性 全隐lu-SGS算法 收敛性
下载PDF
一种基于图形处理器加速的批量LU分解算法 被引量:2
11
作者 李梦月 王颖 +1 位作者 马刚 周赣 《电力工程技术》 2019年第2期57-63,共7页
潮流计算是电力系统计算的基础,其核心是LU分解计算,因此电力系统潮流计算加速的关键在于LU分解加速。当前,基于中央处理器(CPU)的并行算法已经成熟,性能提升空间有限。图形处理器(GPU)作为协处理器,在科学计算方面具有强大的优越性,被... 潮流计算是电力系统计算的基础,其核心是LU分解计算,因此电力系统潮流计算加速的关键在于LU分解加速。当前,基于中央处理器(CPU)的并行算法已经成熟,性能提升空间有限。图形处理器(GPU)作为协处理器,在科学计算方面具有强大的优越性,被广泛应用到电力系统潮流计算中。文中首先分析了GPU结构和并行运行架构,然后介绍了LU分解原理,并选择了合适的矩阵排序算法和稀疏矩阵存储模型,借助统一计算设备架构(CUDA)编程模型实现了基于GPU的单个LU分解和批量LU分解并行加速,最后在仿真设备上测试了5个不同的案例,对比分析其并行算法的加速效果。仿真测试结果表明,基于GPU的批量稀疏LU分解并行算法,平均可以获得25~50倍的加速效果。 展开更多
关键词 图形处理器 潮流计算 批处理 lu分解 并行算法
下载PDF
基于LU分解的LDPC编码改进算法研究 被引量:3
12
作者 高宏伟 《无线电工程》 2017年第4期31-34,共4页
为了使低密度奇偶校验码(Low Density Parity-check Code,LDPC)的校验矩阵H满足系统码的形式,同时降低校验矩阵的复杂度,减少编码时的存储空间,提出改进的优化准则,设计一种基于LU分解的算法。通过用全主元策略对校验矩阵进行高斯消元... 为了使低密度奇偶校验码(Low Density Parity-check Code,LDPC)的校验矩阵H满足系统码的形式,同时降低校验矩阵的复杂度,减少编码时的存储空间,提出改进的优化准则,设计一种基于LU分解的算法。通过用全主元策略对校验矩阵进行高斯消元、行列交换等调整,使之具有系统码的形式,分解后得到的矩阵具有更好的稀疏性,从而可以进一步简化编码设计、减小存储空间占用和降低计算复杂度。所采用的算法与校验矩阵的构造无关,对性能无影响,且利于硬件实现,具有较好的应用前景。 展开更多
关键词 校验矩阵 系统码 lu分解 低密度奇偶校验码 编码 改进算法
下载PDF
用LU分解格式及FAS型多层网格法计算流体力学Euler方程 被引量:2
13
作者 高书春 王保国 《计算物理》 CSCD 北大核心 1990年第1期39-43,共5页
本文将LU分解法用于流体力学及空气动力学Euler方程组的计算,使计算可逐点推进,避免了Beam—Warming近似因子分解法出现的块三对角阵的求逆过程;文中还采用FAS型多层网格技术将上述算法进行加速。
关键词 流体力学 EULER方程 lu分解 格式
下载PDF
稀疏矩阵LU分解的FPGA实现
14
作者 邬贵明 王森 +1 位作者 谢向辉 窦勇 《高技术通讯》 CAS CSCD 北大核心 2013年第8期789-796,共8页
研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结... 研究了直接法求解稀疏线性方程组过程中最耗时的稀疏矩阵LU分解的数值计算,提出了一种稀疏矩阵LU分解并行算法,该算法可通过动态的相关性检测来开发更多的并行性。同时提出了基于现场可编程门阵列(FPGA)实现该并行算法的硬件结构,该结构不依赖于分解因子的稀疏结构信息,分解因子的数据结构可动态生成。与相关工作比较,这种新的硬件结构具有更好的通用性。实验结果表明,这种新的结构的性能优于通用处理器的软件实现。 展开更多
关键词 稀疏矩阵 lu分解 并行算法 现场可编程门阵列(FPGA) 任务并行
下载PDF
A Generalized Symbolic Thomas Algorithm 被引量:2
15
作者 Moawwad El-Mikkawy 《Applied Mathematics》 2012年第4期342-345,共4页
The current paper is mainly devoted to construct a generalized symbolic Thomas algorithm that will never fail. Two new efficient and reliable computational algorithms are given. The algorithms are suited for implement... The current paper is mainly devoted to construct a generalized symbolic Thomas algorithm that will never fail. Two new efficient and reliable computational algorithms are given. The algorithms are suited for implementation using computer algebra systems (CAS) such as Mathematica, Macsyma and Maple. Some illustrative examples are given. 展开更多
关键词 TRIDIAGONAL MATRICES lu FACTORIZATION Linear Systems DETGTRI algorithm Thomas algorithm
下载PDF
New Algorithms for Solving Bordered <i>k</i>-Tridiagonal Linear Systems
16
作者 Moawwad El-Mikkawy Faiz Atlan 《Journal of Applied Mathematics and Physics》 2015年第7期862-873,共12页
The present article is mainly devoted for solving bordered k-tridiagonal linear systems of equations. Two efficient and reliable symbolic algorithms for solving such systems are constructed. The computational cost of ... The present article is mainly devoted for solving bordered k-tridiagonal linear systems of equations. Two efficient and reliable symbolic algorithms for solving such systems are constructed. The computational cost of the algorithms is obtained. Some illustrative examples are given. 展开更多
关键词 Bordered k-Tridiagonal MATRICES Partitioned MATRICES algorithm lu FACTORIZATION MAPLE
下载PDF
基于FPGA的LU分解算法对电路的快速测算
17
作者 曹政 张永明 《电子设计工程》 2019年第16期74-78,共5页
风电发电机组的并网测试需要半实物测试平台进行电路仿真。高频性能和电路规模一直是评价测试平台性能的主要指标。在解算电路问题上,LU分解的快慢影响着导纳线性方程的求解时间。针对于这个方向,本文探讨了采用预选算法和块矩阵并结合F... 风电发电机组的并网测试需要半实物测试平台进行电路仿真。高频性能和电路规模一直是评价测试平台性能的主要指标。在解算电路问题上,LU分解的快慢影响着导纳线性方程的求解时间。针对于这个方向,本文探讨了采用预选算法和块矩阵并结合FPGA平台的并行运算模式。本次实验通过分别对比大型稀疏矩阵和小型稠密矩阵在传统LU解法和并行方法下通过实验证明预选并行的合理性。实验还进一步显示了对于大型电路导纳矩阵,该算法的复杂度为O(n^3)/k^3,而对于一般2n阶导纳矩阵,该算法同样可在电路维度增加的时候,保持LU分解时间不受影响,体现了并行算法的优越性。因此,LU预选择分块算法对电力半实物测试平台具有现实意义。 展开更多
关键词 lu分解 预选矩阵 并行算法 线性方程
下载PDF
A Class of Generalized Approximate Inverse Solvers for Unsymmetric Linear Systems of Irregular Structure Based on Adaptive Algorithmic Modelling for Solving Complex Computational Problems in Three Space Dimensions
18
作者 Anastasia-Dimitra Lipitakis 《Applied Mathematics》 2016年第11期1225-1240,共17页
A class of general inverse matrix techniques based on adaptive algorithmic modelling methodologies is derived yielding iterative methods for solving unsymmetric linear systems of irregular structure arising in complex... A class of general inverse matrix techniques based on adaptive algorithmic modelling methodologies is derived yielding iterative methods for solving unsymmetric linear systems of irregular structure arising in complex computational problems in three space dimensions. The proposed class of approximate inverse is chosen as the basis to yield systems on which classic and preconditioned iterative methods are explicitly applied. Optimized versions of the proposed approximate inverse are presented using special storage (k-sweep) techniques leading to economical forms of the approximate inverses. Application of the adaptive algorithmic methodologies on a characteristic nonlinear boundary value problem is discussed and numerical results are given. 展开更多
关键词 Adaptive algorithms algorithmic Modelling Approximate Inverse Incomplete lu Factorization Approximate Decomposition Unsymmetric Linear Systems Preconditioned Iterative Methods Systems of Irregular Structure
下载PDF
神经网络中LMBP算法收敛速度改进的研究 被引量:29
19
作者 李炯城 黄汉雄 《计算机工程与应用》 CSCD 北大核心 2006年第16期46-49,95,共5页
文章对标准BP算法收敛慢的问题进行了分析,并针对其目前最快的改进版本Levenberg-MarquardtBP(LMBP)进行了深入研究,发现其中涉及的矩阵[JTJ+μkI]求逆是其收敛速度的瓶颈。通过使用LU分解法去除耗时的矩阵求逆运算,极大地减少了LMBP的... 文章对标准BP算法收敛慢的问题进行了分析,并针对其目前最快的改进版本Levenberg-MarquardtBP(LMBP)进行了深入研究,发现其中涉及的矩阵[JTJ+μkI]求逆是其收敛速度的瓶颈。通过使用LU分解法去除耗时的矩阵求逆运算,极大地减少了LMBP的计算量。此外,简化求增广MarquardtSensitivity矩阵的步骤,也在一定程度上减少了LMBP的计算量。笔者用MicrosoftVisualC++6编程实现了改进后的LMBP算法,发现对这两方面的改进,大大提高了收敛速度。文章对Matlab的基于最速下降的BP算法(Traingdx)、Matlab改进的LMBP算法(Trainlm)、LMBP和作者改进的LMBP(ILMBP)进行了大量的试验。结果发现,ILMBP的平均收敛速度比LMBP快约23倍,比Trainlm算法快约9倍。 展开更多
关键词 BP算法 LEVENBERG-MARQUARDT算法 lu分解
下载PDF
基于二维非结构网格的GMRES隐式算法 被引量:5
20
作者 李春娜 叶正寅 王刚 《西北工业大学学报》 EI CAS CSCD 北大核心 2007年第5期630-635,共6页
将广义极小残差GMRES(Generalized Minimum RESidual)隐式算法应用到二维非结构网格上,并结合LU-SGS(Lower Upper-Symmetric Gauss-Seidel)方法对所求解方程组的残值向量进行预处理,发展了一套高效、可靠的二维Euler方程的求解器。NACA0... 将广义极小残差GMRES(Generalized Minimum RESidual)隐式算法应用到二维非结构网格上,并结合LU-SGS(Lower Upper-Symmetric Gauss-Seidel)方法对所求解方程组的残值向量进行预处理,发展了一套高效、可靠的二维Euler方程的求解器。NACA0012翼型和某四段翼型的2个算例,表明该隐式算法的计算效率要比传统的四步Runge-Kutta显式算法高出几十倍,与LU-SGS隐式算法的效率相比,该算法的效率高出近1个量级。应用了重启型的GMRES算法,并对2种构造系数Jacobian矩阵的方法进行了比较。 展开更多
关键词 广义极小残差隐式算法 非结构网格 lu—SGS算法 重启型的GMRES算法
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部