期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于CUDA流技术的深度学习系统优化 被引量:3
1
作者 蒋文斌 刘湃 +1 位作者 陈雨浩 张杨松 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第7期107-111,共5页
为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在... 为了在不损失模型准确率的同时优化Caffe深度学习框架的训练速度,提出了一种面向Caffe并基于计算统一设备架构(CUDA)流技术的深度学习系统优化方法,以便充分利用GPU资源,提高计算的并行度.在Caffe网络的各层使用异步CUDA流,使其运行在独立线程以并行执行GPU计算任务;同时将批处理块划分成多个数据片,使用调度算法在前向传播和反向传播过程中以流水线形式进行处理.在数据集MNIST和CIFAR-10上的实验结果表明:优化后的系统在训练速度上有明显提升,同时准确率基本无损失. 展开更多
关键词 深度学习 计算统一设备架构(CUDA)流 训练速度 调度算法 准确率
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部