期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于GPGPU-sim的多kernel场景下GPGPU性能优化实验方法
1
作者 张军 魏继桢 +2 位作者 沈凡凡 谭海 何炎祥 《实验技术与管理》 CAS 北大核心 2024年第7期87-93,共7页
该文介绍了基于GPGPU-sim的多kernel环境下GPGPU性能优化实验方法,旨在为初学者开展多kernenl场景下GPGPU性能优化研究提供实验方法参考,也能为计算机系统结构教学提供案例。文中重点分析讨论了基于GPGPU-sim模拟器、多kernel场景下的... 该文介绍了基于GPGPU-sim的多kernel环境下GPGPU性能优化实验方法,旨在为初学者开展多kernenl场景下GPGPU性能优化研究提供实验方法参考,也能为计算机系统结构教学提供案例。文中重点分析讨论了基于GPGPU-sim模拟器、多kernel场景下的一种自适应线程块调度方法的改进思想、实验方法及过程,还对GPGPU的微系统结构、GPGPU-sim模拟器及源代码结构进行了介绍。实验结果表明,该文阐述的实验方法可行,相对于基准方法,该文提出的改进策略可以提升多kernel场景下GPGPU的执行效率。 展开更多
关键词 多kernel场境 GPGPU gpgpu-sim 性能优化
下载PDF
GPGPU-Sim兼容性问题解决方案及脚本自动化运行方法的研究
2
作者 曹建立 仲怡宁 赵晨阳 《洛阳师范学院学报》 2023年第8期25-29,共5页
分析了GPGPU-Sim模拟器在高版本Ubuntu操作系统上运行时发生的动态链接库不兼容的问题,通过实验发现了解决方案,在此基础上提出了无需编译GPGPU-Sim源代码便可使用GPGPU-Sim模拟运行CUDA程序的办法,并给出了利用脚本自动化运行和采集数... 分析了GPGPU-Sim模拟器在高版本Ubuntu操作系统上运行时发生的动态链接库不兼容的问题,通过实验发现了解决方案,在此基础上提出了无需编译GPGPU-Sim源代码便可使用GPGPU-Sim模拟运行CUDA程序的办法,并给出了利用脚本自动化运行和采集数据的方法.提出的兼容性解决方案和并行运行方式可以提高模拟器部署和工作的效率,对于该模拟器的使用者和研究者有积极借鉴意义. 展开更多
关键词 gpgpu-sim模拟器 动态链接库 编译 SHELL脚本
下载PDF
GPU矩阵乘法的性能定量分析模型 被引量:1
3
作者 尹孟嘉 许先斌 +1 位作者 熊曾刚 张涛 《计算机科学》 CSCD 北大核心 2015年第12期13-17,22,共6页
性能评价和优化是设计高效率并行程序必不可少的重要工作,存储系统的性能高低直接影响到处理器的整体性能。利用GPGPU-Sim对GPU的存储层次结构进行了模拟,找出了SM数量与存储控制器数量之间最佳配置关系。矩阵乘法是科学计算领域中的基... 性能评价和优化是设计高效率并行程序必不可少的重要工作,存储系统的性能高低直接影响到处理器的整体性能。利用GPGPU-Sim对GPU的存储层次结构进行了模拟,找出了SM数量与存储控制器数量之间最佳配置关系。矩阵乘法是科学计算领域中的基本组成部分,是一种具有计算和访存密集特点的典型应用,其性能是GPU高性能计算的一个重要指标。性能模型作为并行系统性能评价的新的技术解决方案,具有许多其它性能评价方法无法比拟的优势。建立了一个性能模型,模型通过对指令流水线、共享存储器访存、全局存储器访存进行定量分析,找到了程序运行瓶颈,提高了执行速度。实验证明,该模型具有实用性,并有效地实现了矩阵乘法的优化。 展开更多
关键词 GPU gpgpu-sim 矩阵乘法 性能定量分析模型 指令流水线 共享存储器访存 全局存储器访存
下载PDF
数据密集型应用在NVIDIA Fermi片内存储结构上的适应性分析
4
作者 舒兵 任秀江 +1 位作者 张清波 陈芳园 《计算机工程与科学》 CSCD 北大核心 2014年第4期601-606,共6页
数据密集型应用是一类以数据搜索、分析、传输和处理为主的应用。利用GPGPU-SIM模拟器模拟NVIDIA的Fermi架构,分析了Fermi存储结构与数据密集型应用的适应性关系,并给出其存储层次优化设计建议。
关键词 数据密集 gpgpu-sim FERMI 存储层次
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部