期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于张量虚拟机的快速卷积自动性能优化 被引量:1
1
作者 陈疆 朱泓霖 +1 位作者 孟金涛 魏彦杰 《集成技术》 2024年第5期3-18,共16页
卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定... 卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定优化往往缺乏性能可移植性。对此,作者提出BlazerML,一个基于张量虚拟机(TVM)模板代码自动生成的开源卷积计算库,可为任何输入形状自动生成高性能的卷积实现。BlazerML是基于Winograd算法实现的,因为该算法是快速卷积算法中性能最高的算法。实验结果表明:BlazerML显著优于当下最先进的开源库。在x86 CPU上运行常见的深度学习网络前向推理分别比OnnxRuntime、MNN和TVM社区版本快1.18~2.47倍、1.18~2.27倍和1.01~1.66倍。在ARMCPU上运行常见深度学习网络的单层推理分别比ACL和FastConv快1.26~6.11倍、1.04~4.28倍。 展开更多
关键词 深度学习 卷积神经网络 快速卷积算法 Winograd算法 TVM 自动性能优化
下载PDF
建筑设计知识库——以楼梯间详图知识库及给排水系统的自动性能优化知识库为例 被引量:1
2
作者 赵正楠 李一帆 +1 位作者 秦承祚 刘磊 《智能建筑与智慧城市》 2022年第9期87-90,共4页
建筑行业信息化升级需从其源头——设计端提供统一的信息化模型。文章介绍的建筑设计知识库,提出了建筑设计行业数智化转型的解决方案,一方面可以帮助建筑行业从源头建立信息化模型,一方面可以帮助建筑设计企业完成从项目导向产品导向... 建筑行业信息化升级需从其源头——设计端提供统一的信息化模型。文章介绍的建筑设计知识库,提出了建筑设计行业数智化转型的解决方案,一方面可以帮助建筑行业从源头建立信息化模型,一方面可以帮助建筑设计企业完成从项目导向产品导向的生产模式的转变。本文将通过楼梯间详图知识库及给排水系统的自动化性能优化知识库为例具体阐述建筑设计知识库的架构与实现。 展开更多
关键词 建筑设计 数智化 楼梯间详图 排水系统的自动性能优化
下载PDF
SEMD:一种面向实际数值模拟软件的跨平台自动性能优化编程工具
3
作者 张鹏 张爱清 +1 位作者 莫则尧 王景焘 《计算物理》 CSCD 北大核心 2024年第1期52-63,共12页
针对手工软件性能优化缺乏可复用性和可移植性的问题,设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD(Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进... 针对手工软件性能优化缺乏可复用性和可移植性的问题,设计实现一种面向实际数值模拟软件的跨平台自动性能优化编程工具SEMD(Single element-based computing multiple data)。SEMD采用数值模拟领域基于网格的高层语义对数值计算循环进行抽象,完全屏蔽底层硬件特征和性能优化实现,使得基于其编写的数值计算子程序能够自动实现跨平台性能可移植。典型算例测试结果显示:在X86、ARM、GPU三种不同架构的处理器上,SEMD的整体性能优化效果超过国际上的同类产品。此外,SEMD在结构、流体、电磁等领域实际数值模拟软件的研制中也得到了初步应用,支撑4款软件热点数值计算子程序平均性能提升164%. 展开更多
关键词 跨平台自动性能优化 性能可移植 数值计算循环 编程接口
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部