检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

面向现代GPU的Winograd卷积加速研究: 1; 作者童敢黄立波吕雅帅《电子学报》 EI CAS CSCD 北大核心 2024年第1期244-257,共14页; 卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,... 展开更多; 关键词 Winograd卷积低精度部分计算核融合卷积加速 gpu内存层级 Tensor Core; 下载PDF 职称材料

GPU数据库OLAP优化技术研究: 2; 作者张延松刘专 +2 位作者韩瑞琛张宇王珊《软件学报》 EI CSCD 北大核心 2023年第11期5205-5229,共25页; GPU数据库近年来在学术界和工业界吸引了大量的关注.尽管一些原型系统和商业系统(包括开源系统)开发了作为下一代的数据库系统,但基于GPU的OLAP引擎性能是否真的超过CPU系统仍然存有疑问,如果能够超越,那什么样的负载/数据/查询处理模... 展开更多; 关键词混合CPU-gpu平台 gpu加速OLAP OLAP gpu内存 gpu量化处理模型; 下载PDF 职称材料

基于AVX2指令集的深度学习混合运算策略被引量：2: 3; 作者蒋文斌王宏斌 +1 位作者刘湃陈雨浩《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2020年第5期408-414,共7页; 由于图形处理器(GPU)内存容量有限,其所能承载的深度学习网络模型规模受到很大限制。该文提出了一种深度学习混合运算策略,借助于Intel新的单指令多数据AVX2指令集,充分挖掘CPU对GPU的辅助支撑潜力。为节省GPU内存,将中间数据规模较大... 展开更多; 关键词混合运算深度学习 AVX2指令集图形处理器(gpu)内存 Caffe; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部