检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向龙芯3B1500体系结构的DGEMM函数优化被引量：3: 1; 作者刘刚张恒 +1 位作者毛睿陆克中《小型微型计算机系统》 CSCD 北大核心 2014年第7期1523-1527,共5页; 双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保留的物理内存与大页技术减少内存页的换进换出以及TLB缺失,通过龙芯128位向量访存指令和向量乘加指令实现... 展开更多; 关键词龙芯3B1500处理器 BLAS dgemm 矩阵乘法数据预取; 下载PDF 职称材料

CPU-GPU并行矩阵乘法的实现与性能分析被引量：11: 2; 作者程豪张云泉 +1 位作者张先轶李玉成《计算机工程》 CAS CSCD 北大核心 2010年第13期24-26,29,共4页; 实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过... 展开更多; 关键词混合并行 GPU技术 dgemm程序加速比; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部