检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

国产SW26010-Pro处理器上3级BLAS函数众核并行优化: 1; 作者胡怡陈道琨 +5 位作者杨超马文静刘芳芳宋超博孙强史俊达《软件学报》 EI CSCD 北大核心 2024年第3期1569-1584,共16页; BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发... 展开更多; 关键词 BLAS 3级 SW26010-Pro众核处理器直接内存访问远程内存访问浮点计算效率; 下载PDF 职称材料

BLU Factorization for Block Tridiagonal Matrices and Its Error Analysis: 2; 作者 Chi-Ye Wu 《Advances in Linear Algebra & Matrix Theory》 2012年第4期39-42,共4页; A block representation of the BLU factorization for block tridiagonal matrices is presented. Some properties on the factors obtained in the course of the factorization are studied. Simpler expressions for errors incur... 展开更多; 关键词 BLOCK TRIDIAGONAL MATRICES BLU FACTORIZATION ERROR Analysis blas3; 下载PDF 职称材料

矩阵乘协处理器上BLAS level-3运算的设计: 3; 作者贾迅钱磊 +2 位作者原昊张昆吴东《计算机工程与科学》 CSCD 北大核心 2020年第11期1913-1921,共9页; BLAS level-3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运算。在矩阵乘协处理器上高效实现BLAS level-3运算,对大规模科学与工程仿真应用的计算加速至关重要。以矩... 展开更多; 关键词线性阵列矩阵乘协处理器 BLAS level-3; 下载PDF 职称材料

A High Performance Multifrontal Code for Linear Solution of Structures Using Multi-Core Microprocessors: 4; 作者 Efe Guney Kenneth Will 《Tsinghua Science and Technology》 SCIE EI CAS 2008年第S1期34-39,共6页; A multifrontal code is introduced for the efficient solution of the linear system of equations arising from the analysis of structures. The factorization phase is reduced into a series of interleaved element assembly ... 展开更多; 关键词 multifrontal METHOD Cholesky DECOMPOSITION high performance COMPUTING FINITE element METHOD MULTI-CORE PROGRAMMING blas3 parallel COMPUTING; 原文传递

	题名	作者	出处	发文年	操作
1	国产SW26010-Pro处理器上3级BLAS函数众核并行优化	胡怡陈道琨杨超马文静刘芳芳宋超博孙强史俊达	《软件学报》 EI CSCD 北大核心	2024	下载PDF 职称材料
2	BLU Factorization for Block Tridiagonal Matrices and Its Error Analysis	Chi-Ye Wu	《Advances in Linear Algebra & Matrix Theory》	2012	下载PDF 职称材料
3	矩阵乘协处理器上BLAS level-3运算的设计	贾迅钱磊原昊张昆吴东	《计算机工程与科学》 CSCD 北大核心	2020	下载PDF 职称材料
4	A High Performance Multifrontal Code for Linear Solution of Structures Using Multi-Core Microprocessors	Efe Guney Kenneth Will	《Tsinghua Science and Technology》 SCIE EI CAS	2008	原文传递

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部