期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
广义稠密对称特征问题标准化算法在GPU集群上的有效实现
1
作者 刘世芳 赵永华 +1 位作者 于天禹 黄荣锋 《计算机科学》 CSCD 北大核心 2020年第4期6-12,共7页
广义稠密对称特征问题的求解是许多应用科学和工程的主要任务,并且是计算电磁学、电子结构、有限元模型和量子化学等计算中的重要部分。将广义对称特征问题转化为标准对称特征问题是求解广义稠密对称特征问题的关键计算步骤。针对GPU集... 广义稠密对称特征问题的求解是许多应用科学和工程的主要任务,并且是计算电磁学、电子结构、有限元模型和量子化学等计算中的重要部分。将广义对称特征问题转化为标准对称特征问题是求解广义稠密对称特征问题的关键计算步骤。针对GPU集群,文中给出了广义稠密对称特征问题标准化块算法在GPU集群上基于MPI+CUDA的实现。为了适应GPU集群的架构,广义对称特征问题标准化算法将正定矩阵的Cholesky分解与传统的广义特征问题标准化块算法相结合,降低了标准化算法中不必要的通信开销,并且增强了算法的并行性。在基于MPI+CUDA的标准化算法中,GPU与CPU之间的数据传输操作被用来掩盖GPU内的数据拷贝操作,这消除了拷贝所花费的时间,进而提高了程序的性能。同时,文中还给出了矩阵在二维通信网格中行通信域和列通信域之间完全并行的点对点的转置算法和基于MPI+CUDA的具有多个右端项的三角矩阵方程BX=A求解的并行块算法。在中科院计算机网络信息中心的超级计算机系统“元”上,每个计算节点配置2块Nvidia Tesla K20 GPGPU卡及2颗Intel E5-2680 V2处理器,使用多达32个GPU对不同规模矩阵的基于MPI+CUDA的广义对称特征问题标准化算法进行测试,取得了较好的加速效果与性能,并且具有良好的可扩展性。当使用32个GPU对50000×50000阶的矩阵进行测试时,峰值性能达到了约9.21 Tflops。 展开更多
关键词 广义对称特征问题标准化算法 GPU集群 CHOLESKY分解 转置算法 三角矩阵方程
下载PDF
基于分治法求解对称三对角矩阵特征问题的MPI/Cilk混合并行算法 被引量:3
2
作者 朱京乔 赵永华 《郑州大学学报(理学版)》 CAS 北大核心 2020年第1期33-38,共6页
对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进... 对称稠密矩阵特征问题的求解通常转化为三对角矩阵特征问题的求解,基于对称三对角矩阵特征求解的分而治之方法,提出了一种基于消息传递接口(message passing interface,MPI)+Cilk多任务并行模型的混合求解算法,采用进程间数据并行和进程内多线程任务并行的方法,实现了对分而治之算法中分治阶段和合并阶段的多任务划分和动态调度。进程内利用Cilk任务执行的有向无环图模型,解决了线程级并行的数据依赖和饥饿等待等问题,提高了程序的并行性;进程间通过粗粒度计算任务的划分,优化了MPI部分的数据通信流程和负载均衡问题。数值实验表明,混合并行算法在计算性能和可扩展性方面都要优于纯MPI并行算法。 展开更多
关键词 三对角矩阵 对称特征问题 并行计算 分治算法 Cilk MPI
下载PDF
非对称广义特征值问题重特征值的灵敏度分析 被引量:1
3
作者 解惠青 戴华 《上海理工大学学报》 EI CAS 北大核心 2006年第1期49-53,共5页
以标准特征值问题灵敏度分析的有关结论为基础,证明了单参数非对称广义特征值问题半单重特征值的可微性,给出了特征值导数的表达式和特征向量的级数展开式.以所得结论为基础,定义了广义特征值问题半单重特征值的灵敏度,给出了确定矩阵... 以标准特征值问题灵敏度分析的有关结论为基础,证明了单参数非对称广义特征值问题半单重特征值的可微性,给出了特征值导数的表达式和特征向量的级数展开式.以所得结论为基础,定义了广义特征值问题半单重特征值的灵敏度,给出了确定矩阵对中敏感元素的方法. 展开更多
关键词 灵敏度分析 对称广义特征问题 半单重特征 导数
下载PDF
基于分治法求解对称三对角矩阵特征问题的混合并行实现
4
作者 朱京乔 赵永华 《计算机系统应用》 2019年第9期246-250,共5页
基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解... 基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解决了线程级并行的数据依赖和饥饿等待等问题,提高了并行性;节点间通过改进合并过程中的通信流程,使组内进程间只进行互补的数据交换,降低了通信开销.数值实验体现了该混合并行算法在计算效率和扩展性方面的优势. 展开更多
关键词 并行计算 对称特征问题 分治算法 Cilk
下载PDF
对称双随机矩阵逆特征值问题 被引量:1
5
作者 杨尚俊 《安徽大学学报(自然科学版)》 CAS 北大核心 2013年第6期1-7,共7页
研究一种特殊的非负矩阵(对称随机矩阵)逆特征值问题,即对给定的实n-重Λ={λ1,…,λn},求在什么条件下存在的以Λ的谱的对称随机矩阵问题.
关键词 特征问题 对称双随机矩阵逆特征问题 特殊正交矩阵 置换相似
下载PDF
低阶对称双随机矩阵逆特征值问题的通解
6
作者 杨尚俊 《安徽大学学报(自然科学版)》 CAS 北大核心 2014年第4期1-8,共8页
对给定的实或复n-重Λ={λ1,…,λn},决定是否存在以Λ为谱的非负(随机)矩阵的问题称为非负(随机)矩阵逆特征值问题,这一直是非负矩阵理论中尚未完全解决的一个研究热点.作者曾对n∈{2,3,4,5},研究n阶双随机矩阵逆特征值问题有解的充分... 对给定的实或复n-重Λ={λ1,…,λn},决定是否存在以Λ为谱的非负(随机)矩阵的问题称为非负(随机)矩阵逆特征值问题,这一直是非负矩阵理论中尚未完全解决的一个研究热点.作者曾对n∈{2,3,4,5},研究n阶双随机矩阵逆特征值问题有解的充分条件并给出相应解的公式.最近,又对任意正整数n,先给出行和为常数的对称矩阵的逆特征值问题的充要条件和解的公式,后给出对称随机矩阵逆特征值问题有解的两种充分条件和解的公式.论文在提出任意阶对称随机矩阵逆特征值问题通解的概念和3阶对称随机矩阵逆特征值问题完全通解的概念之后,首先给出3阶对称随机矩阵逆特征值问题存在完全通解的充要条件和完全通解的公式;其次给出3阶对称随机矩阵逆特征值问题存在通解的充要条件和通解的公式;最后给出4阶对称随机矩阵逆特征值问题有解的几种充分条件和相应解的公式. 展开更多
关键词 特征问题的通解 对称双随机矩阵逆特征问题 特殊正交矩阵
下载PDF
交替投影法求解对称随机逆特征值问题 被引量:1
7
作者 党婵娟 王湘美 《应用数学进展》 2021年第6期2206-2216,共11页
本文主要研究对称随机矩阵的逆特征值问题。通过将该问题转化为求两个集合交点的可行性问题,提出用交替投影法进行求解。因为其中一个集合不是凸集,关于凸可行性问题的收敛性结果不能用来分析算法的收敛性。对于算法的收敛性,本文在已... 本文主要研究对称随机矩阵的逆特征值问题。通过将该问题转化为求两个集合交点的可行性问题,提出用交替投影法进行求解。因为其中一个集合不是凸集,关于凸可行性问题的收敛性结果不能用来分析算法的收敛性。对于算法的收敛性,本文在已有关于两个黎曼流形的交替投影算法收敛性的研究结果上,建立了交替投影算法在一定条件下的线性收敛性。最后数值例子也表明了算法的有效性。 展开更多
关键词 对称随机逆特征问题 可行性问题 交替投影算法 黎曼流形 线性收敛
下载PDF
求解对称非负逆特征值问题的一阶黎曼算法
8
作者 吕文平 王湘美 《应用数学进展》 2022年第10期7411-7421,共11页
基于对称非负逆特征值问题的黎曼优化模型,提出了求解该问题的黎曼梯度下降算法和黎曼共轭梯度算法,并分析了这两种算法的收敛性。通过数值实验,比较了两种算法的收敛效率。数值结果表明,求解高阶的非负逆特征值问题时,黎曼共轭梯度算... 基于对称非负逆特征值问题的黎曼优化模型,提出了求解该问题的黎曼梯度下降算法和黎曼共轭梯度算法,并分析了这两种算法的收敛性。通过数值实验,比较了两种算法的收敛效率。数值结果表明,求解高阶的非负逆特征值问题时,黎曼共轭梯度算法的收敛效率要高于黎曼梯度下降算法。 展开更多
关键词 对称非负逆特征问题 黎曼梯度下降算法 黎曼共轭梯度算法 收敛性
下载PDF
精化块共轭梯度法求解对称特征值问题(英文)
9
作者 卢晓平 高卫国 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2009年第6期747-753,共7页
局部优化块共轭梯度法(LOBPCG)可以用较少的迭代数来计算多个特征值,然而特征向量的精度并不令人满意.为提高特征向量的计算精度,同时保留LOBPCG方法计算特征值的优势,通过采用迭代精化的技巧提出了一种新的子空间迭代法.最后,从数值实... 局部优化块共轭梯度法(LOBPCG)可以用较少的迭代数来计算多个特征值,然而特征向量的精度并不令人满意.为提高特征向量的计算精度,同时保留LOBPCG方法计算特征值的优势,通过采用迭代精化的技巧提出了一种新的子空间迭代法.最后,从数值实验上对比验证了新方法较LOBPCG方法的提高. 展开更多
关键词 对称特征问题 共轭梯度 残量范数 LOBPCG
原文传递
Maximization of the sum of the trace ratio on the Stiefel manifold, I: Theory 被引量:1
10
作者 ZHANG LeiHong LI RenCang 《Science China Mathematics》 SCIE 2014年第12期2495-2508,共14页
We are concerned with the maximization of tr(V T AV)/tr(V T BV)+tr(V T CV) over the Stiefel manifold {V ∈ R m×l | V T V = Il} (l 〈 m), where B is a given symmetric and positive definite matrix, A and... We are concerned with the maximization of tr(V T AV)/tr(V T BV)+tr(V T CV) over the Stiefel manifold {V ∈ R m×l | V T V = Il} (l 〈 m), where B is a given symmetric and positive definite matrix, A and C are symmetric matrices, and tr(. ) is the trace of a square matrix. This is a subspace version of the maximization problem studied in Zhang (2013), which arises from real-world applications in, for example, the downlink of a multi-user MIMO system and the sparse Fisher discriminant analysis in pattern recognition. We establish necessary conditions for both the local and global maximizers and connect the problem with a nonlinear extreme eigenvalue problem. The necessary condition for the global maximizers offers deep insights into the problem, on the one hand, and, on the other hand, naturally leads to a self-consistent-field (SCF) iteration to be presented and analyzed in detail in Part II of this paper. 展开更多
关键词 trace ratio Rayleigh quotient Stiefel manifold nonlinear eigenvalue problem optimality condition EIGENSPACE
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部