检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到6篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于 Pentium Pro 的高性能 BLAS 的设计与实现被引量：4: 1; 作者李忠泽陈瑾 +1 位作者龙翔李未《北京航空航天大学学报》 EI CAS CSCD 北大核心 1998年第4期455-457,共3页; 支持科学和工程计算的ＢＬＡＳ（基本线性代数子程序）在高性能计算中有着重要作用．本文针对ＰｅｎｔｉｕｍＰｒｏ的体系结构特点，提出了一些优化方法使得ＢＬＡＳ在ＰｅｎｔｉｕｍＰｒｏ上计算性能达到最佳．测试表明，在２００ＭＨ... 展开更多; 关键词寄存器基本线性代数子程序 BLAS 循环展开; 下载PDF 职称材料

弹道跟踪数据融合处理的快速算法被引量：3: 2; 作者李冬孙杰《飞行器测控学报》 CSCD 2015年第4期368-373,共6页; 针对弹道跟踪数据融合处理中的大计算量环节研究了快速算法。用样条函数表示弹道参数,建立了多测元的联合观测模型和弹道参数的非线性融合计算模型,给出了弹道参数的求解算法,分析了弹道参数融合计算中的大型矩阵运算问题,利用基础线性... 展开更多; 关键词弹道跟踪数据融合处理快速算法基础线性代数函数库并行算法; 下载PDF 职称材料

并行计算通信库测试方法研究及实践: 3; 作者熊玉庆张云泉《软件学报》 EI CSCD 北大核心 2000年第12期1681-1684,共4页; 并行计算通信库的测试在并行计算系统中起着重要的作用 .对通信库的测试一般都是通过设计一些测试程序对库的各个或几个部分分别进行单独隔离测试 .但是有许多库中的错误用这种隔离测试方法测不出来 ,只有当库的多个部分以某种复杂的、... 展开更多; 关键词测试方法并行计算通信库并行计算系统; 下载PDF 职称材料

基于ARMv8架构的面向机器翻译的单精度浮点通用矩阵乘法优化被引量：9: 4; 作者龚鸣清叶煌 +2 位作者张鉴卢兴敬陈伟《计算机应用》 CSCD 北大核心 2019年第6期1557-1562,共6页; 针对使用ARM处理器的移动智能设备执行神经网络推理计算效率不高的问题,提出了一套基于ARMv8架构的单精度浮点通用矩阵乘法(SGEMM)算法优化方案。首先,确定ARMv8架构的处理器执行SGEMM算法的计算效率受限于向量化计算单元使用方案、指... 展开更多; 关键词 ARMv8 单指令多数据流计算基础线性代数子程序库高性能计算; 下载PDF 职称材料

基于申威1621的通用矩阵向量乘法的性能分析与优化被引量：1: 5; 作者邓洁赵荣彩王磊《计算机应用》 CSCD 北大核心 2022年第S01期215-220,共6页; 通用矩阵向量乘法(GEMV)函数是整个二级基础线性代数子程序(BLAS)函数库的构建基础,BLAS作为关键基础计算软件之一,目前在申威处理器上却没有一个高性能实现的版本。针对上述问题,为充分发挥申威1621平台的高性能BLAS库计算优势,提出一... 展开更多; 关键词申威1621 基础线性代数子程序函数库单指令多数据流通用矩阵向量乘法性能优化; 下载PDF 职称材料

基于申威1621处理器的BLAS一级函数优化被引量：1: 6; 作者李浩然王磊《计算机系统应用》 2021年第7期246-252,共7页; BLAS(Basic Linear Algebra Subprograms)是一个基本线性代数操作的数学函数标准,该库函数分为三个级别,每个级别提供了向量与向量(1级)、向量与矩阵(2级)、向量与向量(三级)之间的基本运算.本文研究了在申威1621处理器上BLAS一级函数... 展开更多; 关键词申威1621 BLAS 并行线程分配 SIMD向量化; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部