期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
LAPACK线性方程求解函数在龙芯3A上的并行化 被引量:1
1
作者 刘斌斌 顾乃杰 +1 位作者 任开新 张杰 《小型微型计算机系统》 CSCD 北大核心 2014年第5期1085-1089,共5页
针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多... 针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,基于原LAPACK库的结构层次实现了线性方程求解函数的并行化版本,用户只需设定核数重新编译出LAPACK的多核库便可使用.通过LAPACK自带的性能测试程序进行测试,实验结果表明,在四核模式下,大多数函数加速比达到2以上,部分函数加速比超过了3,所有线性方程求解类函数加速比的算术平均值达到2.04. 展开更多
关键词 lapack BLAS 龙芯3A 多核
下载PDF
基于龙芯3A的LAPACK函数优化
2
作者 张斌 顾乃杰 +1 位作者 何颂颂 刘斌斌 《计算机系统应用》 2012年第11期63-67,共5页
针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数的性能.用LAPACK自带的性能测试程序进行测试,实验结果表明,有240个LAPACK函数的性能提升达到30%以上,... 针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数的性能.用LAPACK自带的性能测试程序进行测试,实验结果表明,有240个LAPACK函数的性能提升达到30%以上,占全部性能测试函数的81%. 展开更多
关键词 lapack BLAS 龙芯3A 优化 双单精度
下载PDF
LAPACK的自动并行化工具研究 被引量:3
3
作者 谢幸 李玉成 《数值计算与计算机应用》 CSCD 北大核心 2001年第2期130-133,共4页
LAPACK (Linear Algebra PACKage) is a subroutine library for solving the most common problems in numerical linear algebra, designed to run efficiently on shared-memory vector and parallel processors. Only the general s... LAPACK (Linear Algebra PACKage) is a subroutine library for solving the most common problems in numerical linear algebra, designed to run efficiently on shared-memory vector and parallel processors. Only the general sequential code of LAPACK is available on INTERNET, the optimization of it on a special machine is very burdensome. To solve this problem, we develop an automatic parallelizing tool on SGI POWER Challenge, and it shows good results. 展开更多
关键词 lapack 自动并行化 并行化工具 源代码分析 相关性分析 数据私有化 基本技术
原文传递
LAPACK中的分块算法及其效果 被引量:5
4
作者 李玉成 《数值计算与计算机应用》 CSCD 北大核心 2001年第3期172-180,共9页
This paper shows two approaches to improve the performance of numeral al- gebra software by describing block algorithms in LAPACK. The block algorithms can make up higher level and more effcient BLAS programs. This pa... This paper shows two approaches to improve the performance of numeral al- gebra software by describing block algorithms in LAPACK. The block algorithms can make up higher level and more effcient BLAS programs. This paper further presents the relations between the effciency of the block algorithm and the size of block, and shows the relations relates to not only scale of algorithms and problems but also architectures and Characters of destination machines. Finally The paper gives the test results on Hitachi SR2201& SR8000. 展开更多
关键词 lapack 分块算法 线性代数软件包 数值线性代数问题
原文传递
基于Linux的Fortran与C/C++混合编程 被引量:3
5
作者 李霞 亓雪冬 《现代计算机(中旬刊)》 2012年第2期57-60,共4页
Fortran、C/C++是用户数量最多,使用最为广泛的编程语言,存在大量优秀的软件包及源代码,通过混合编程可以合并不同语言的优势,充分利用目前存在的这些软件资源。分析在Linux系统中Fortran与C/C++混合编程基本原理和内部调用约定,并通过... Fortran、C/C++是用户数量最多,使用最为广泛的编程语言,存在大量优秀的软件包及源代码,通过混合编程可以合并不同语言的优势,充分利用目前存在的这些软件资源。分析在Linux系统中Fortran与C/C++混合编程基本原理和内部调用约定,并通过实例阐述了使用C/C++调用Fortran77编写的线性代数软件包LAPACK的方法。实践表明,这种方法有效且可靠。 展开更多
关键词 混合编程 FORTRAN F2C G77 lapack
下载PDF
ABEEMσπ模型中计算分子电荷分布加速方法的比较
6
作者 杨忠志 马丽 《商丘师范学院学报》 CAS 2014年第6期1-6,共6页
基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基... 基于ABEEMσπ模型计算分子的电荷分布时,求解线性方程组是最为耗时的环节.本文针对不同硬件环境下,系数矩阵是稠密、对称非正定矩阵的线性方程组的求解方法进行了比较.详细介绍了串行求解库LAPACK以及基于GPU的CULA库的使用,并给出了基于Bunch-Kaufman方法的串行改进算法以及MPI多机并行求解方法,并分别给出了几种方法的运行时间.用户可以根据不同的硬件条件选择不同的加速算法,以求解系数矩阵是对称非正定矩阵的线性方程组,进而加快分子体系中电荷分布的计算速度. 展开更多
关键词 ABEEMΣΠ模型 MPI GPU lapack CULA 对称非正定矩阵
下载PDF
PLASMA自适应调优与性能优化的设计与实现
7
作者 吕渐春 张云泉 +1 位作者 王婷 肖玄基 《计算机科学》 CSCD 北大核心 2012年第4期282-286,共5页
PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLA... PLASMA是一个高效的线性代数软件包,其数据分布结合分堆、细粒度并行以及乱序执行机制等大大提高了程序的性能。但PLASMA仍然存在一些问题,比如分块大小对程序性能的影响非常大,以及产生了大量的数据拷贝等。通过对比传统的LAPACK和PLASMA的实现机制,分析了PLASMA中存在的优势和不足,介绍了两种弥补PLASMA自身不足的方法。针对PLASMA的架构,经过大量的测试与分析,提出了边缘矩阵的概念并分析了其对性能的影响,据此提出了一种自适应调优的方法。并通过数据拷贝与计算并行的运行方式,进一步提高了PLASMA性能,最后通过大量的测试验证了该优化方法的效果。 展开更多
关键词 lapack PLASMA 自适应调优 优化
下载PDF
用矩阵法拟合新磁性材料的耦合参数J及朗道因子g
8
作者 冯晓霞 《山西师范大学学报(自然科学版)》 2009年第2期58-61,共4页
对于已制备的新磁性材料,考虑到其分子中不同位置磁性原子间的自旋相互作用能量及塞曼能,用矩阵法通过LAPACK软件包实现精确对角化求解其哈密顿量得出了配分函数,并应用Monte Carlo方法采用随机行走计算出磁化率,χ通过与实验中测定的... 对于已制备的新磁性材料,考虑到其分子中不同位置磁性原子间的自旋相互作用能量及塞曼能,用矩阵法通过LAPACK软件包实现精确对角化求解其哈密顿量得出了配分函数,并应用Monte Carlo方法采用随机行走计算出磁化率,χ通过与实验中测定的结果进行数值拟合,可得到材料的耦合参数J及朗道因子g,为磁性物理及分子化学中研究此类问题提供了一种更精确可靠的数值计算方法. 展开更多
关键词 新磁性材料 磁化机制 矩阵法 lapack MonteCarlo方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部