检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于AVX2指令集的深度学习混合运算策略被引量：2: 1; 作者蒋文斌王宏斌 +1 位作者刘湃陈雨浩《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2020年第5期408-414,共7页; 由于图形处理器(GPU)内存容量有限,其所能承载的深度学习网络模型规模受到很大限制。该文提出了一种深度学习混合运算策略,借助于Intel新的单指令多数据AVX2指令集,充分挖掘CPU对GPU的辅助支撑潜力。为节省GPU内存,将中间数据规模较大... 展开更多; 关键词混合运算深度学习 avx2指令集图形处理器(GPU)内存 Caffe; 原文传递

一种基于复合域的国密SM4算法快速软件实现方法被引量：4: 2; 作者陈晨郭华 +2 位作者王闯刘源灏刘建伟《密码学报》 CSCD 2023年第2期289-305,共17页; 成为ISO/IEC国际标准算法后,SM4的性能受到更多关注.目前针对SM4算法实现效率提升的方法主要集中在缩短S盒的运算时间,其中采用复合域实现的方法大都基于AES算法实现的复合域,而在GF((2^(4))^(2))上鲜有针对SM4算法软件实现的复合域被提... 展开更多; 关键词 SM4算法 S盒复合域比特切片 avx2扩展指令集; 下载PDF 职称材料

分组密码uBlock算法快速软件实现: 3; 作者高莹汪龙昕 +4 位作者田蕾胡洋张宇鹏严宇伍前红《国防科技大学学报》 EI CAS 2024年第6期96-106,共11页; 为对国产分组密码算法uBlock进行软件优化,选择支持256 bit数据位宽的AVX2指令集,提高编译器自动优化等级,优化函数的调用过程,优化数据存储结构,综合使用高位并行、低延迟指令逻辑优化等方法实现单线程并行计算。通过使用这种有效的组... 展开更多; 关键词 uBlock算法 avx2指令集并行运算低延迟快速软件实现; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部