检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

民国初期翻译短篇小说经典化中的深度编译策略被引量：2: 1; 作者权继振《出版发行研究》 CSSCI 北大核心 2016年第12期107-109,共3页; 民国初期是中国文学史上短篇小说最为风行的时期,鲁迅、胡适、周瘦鹃等推出的经典翻译短篇小说在推动文学现代化和启蒙国民方面都卓有成效。本文以《短篇小说第一集》《欧美名家短篇小说丛刊》和《小说月报》中的经典翻译短篇小说为个... 展开更多; 关键词短篇小说民国初期经典化深度编译; 下载PDF 职称材料

AutoConfig:面向深度学习编译优化的自动配置机制: 2; 作者张洪滨周旭林 +2 位作者邢明杰武延军赵琛《软件学报》 EI CSCD 北大核心 2024年第6期2668-2686,共19页; 随着深度学习模型和硬件架构的快速发展,深度学习编译器已经被广泛应用.目前,深度学习模型的编译优化和调优的方法主要依赖基于高性能算子库的手动调优和基于搜索的自动调优策略.然而,面对多变的目标算子和多种硬件平台的适配需求,高性... 展开更多; 关键词深度学习编译器编译优化代码生成自动配置机制; 下载PDF 职称材料

面向深度学习算子的循环不变式外提算法: 3; 作者梁佳利华保健 +1 位作者吕雅帅苏振宇《计算机科学与探索》 CSCD 北大核心 2023年第1期127-139,共13页; TVM是一个深度学习编译器,支持将TVM的领域专用语言即张量表达式定义的算子编译生成目标平台的代码,并在高级中间表示TVM IR上进行一系列优化。张量表达式对算子执行循环变换,产生与循环迭代变量相关的复杂表达式的计算,在多层嵌套循环... 展开更多; 关键词深度学习编译器领域专用语言循环不变量外提中间表示; 下载PDF 职称材料

一种基于TVM的算子生成加速策略: 4; 作者高伟李帅龙 +3 位作者茆琳王磊李颖颖韩林《计算机工程》 CAS CSCD 北大核心 2024年第8期353-362,共10页; 随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也... 展开更多; 关键词深度学习编译器代价模型梯度提升算法剪枝策略自动调优; 下载PDF 职称材料

基于MLIR的FP8量化模拟与推理内存优化: 5; 作者徐金龙桂中华 +2 位作者李嘉楠李颖颖韩林《计算机科学》 CSCD 北大核心 2024年第9期112-120,共9页; 随着目标检测模型和语言大模型的迅速发展,网络模型正变得越来越庞大。为了更好地在端侧硬件上进行模型部署,通常采用模型量化技术对模型进行压缩。现有的模型量化策略主要基于FP16,BF16和INT8等类型实现。其中,8bit数据类型在降低推理... 展开更多; 关键词模型压缩深度学习编译器 FP8量化 MLIR Yolov5s模型; 下载PDF 职称材料

基于专用卷积神经网络加速器的编译器设计与实现被引量：1: 6; 作者焦禹铭吴凯 +2 位作者郭风祥王昭宋庆增《计算机应用》 CSCD 北大核心 2022年第S01期208-214,共7页; 不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方... 展开更多; 关键词现场可编程门阵列模型压缩深度学习编译器中间表示目标检测; 下载PDF 职称材料

基于RISC-V的神经网络加速器硬件实现被引量：1: 7; 作者鞠虎高营 +1 位作者田青周颖《电子与封装》 2023年第2期68-73,共6页; 针对第五代开放精简指令集(RISC-V)的人工智能(AI)处理器较少、先进的精简指令微处理器(ARM)架构供应链不稳定、自主可控性弱的问题,设计了以RISC-V处理器为核心的神经网络推理加速器系统级芯片(SoC)架构。采用开源项目搭建So C架构;基... 展开更多; 关键词 RISC-V 神经网络可变张量加速器通用矩阵乘深度学习编译器; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部