期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
GROMACS 2020在ROCm平台上的移植与优化 被引量:3
1
作者 张驭洲 曹武迪 +2 位作者 卜景德 谭光明 吉青 《计算机工程与科学》 CSCD 北大核心 2021年第11期1901-1909,共9页
GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一... GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一个复杂离子液体模拟算例为目标,使用GPU性能分析工具rocprof对移植代码进行了性能分析。针对MI50硬件特性,先后对成键力核函数、静电力的PME核函数和短程非成键力核函数进行了优化,优化后运行目标算例的性能相比初始版本整体上获得了约2.8倍的加速比,在MI50上的性能高于GROMACS原版OpenCL代码60.5%,相对纯CPU版本有约2.7倍的加速比。在另外2个具有代表性算例的单结点测试以及离子液体算例的多结点扩展性测试中,优化后的代码也达到了较好的性能提升,这表明所采用的优化操作具有一定的通用性。 展开更多
关键词 分子动力学 GROMACS rocm 应用移植 性能优化
下载PDF
基于人工蜂群算法的多维函数优化加速方法 被引量:2
2
作者 李辉 韩林 +1 位作者 于哲 王威 《计算机科学》 CSCD 北大核心 2022年第S02期926-931,共6页
人工蜂群算法在农业农村大数据应用开发中被广泛采用,但是串行人工蜂群算法时间的复杂度较高,不适用于多维函数的快速求解问题。针对串行人工蜂群算法对多维函数求解执行效率较低的问题进行分析,通过解析多维函数及人工依赖关系判定,提... 人工蜂群算法在农业农村大数据应用开发中被广泛采用,但是串行人工蜂群算法时间的复杂度较高,不适用于多维函数的快速求解问题。针对串行人工蜂群算法对多维函数求解执行效率较低的问题进行分析,通过解析多维函数及人工依赖关系判定,提出了一种基于人工蜂群算法的多维函数优化加速方法,该方法包括任务划分、数据分布、同步操作和任务并行。为了证明方法的有效性,以海光处理器为硬件测试平台,对4个多维函数进行对比测试。实验结果表明,与串行人工蜂群算法对多维函数的求解速度相比,该方法对于4个多维函数的求解速度能得到大幅提升。 展开更多
关键词 大数据 人工蜂群算法 多维函数 rocm HIP模型 海光处理器
下载PDF
使用GTC-P应用评估曙光E级原型机的性能 被引量:1
3
作者 王一超 胡航 +2 位作者 William Tang 王蓓 林新华 《计算机工程与科学》 CSCD 北大核心 2020年第1期1-7,共7页
曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,... 曙光E级原型机是我国“十三五”计划中3台原型系统之一,该系统采用异构计算架构,CPU和加速器选用AMD授权的国产海光处理器架构。除了采用基准测试程序对芯片进行测试外,为探究真实应用在该原型机上的性能,移植了激光等离子体应用GTC-P,对比了GTC-P在海光CPU和DCU与Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型机的多结点上进行了扩展性分析。性能评估工作反映了高性能计算应用在曙光E级原型机上的实际运行性能。 展开更多
关键词 曙光E级原型机 性能评测 质点网格法 rocm HIP模型
下载PDF
论大学图书馆电子阅览室建设
4
作者 张哲芬 《吉林省经济管理干部学院学报》 2004年第4期79-80,共2页
信息时代的发展,对我国大学图书馆的发展提出了更高的要求,大学图书馆的管理者需着手建立电子阅览室,在规划中要遵循渐进性、先进性、可扩展性原则,重视技术人才的培养,做好电子阅览室的宣传、管理工作。
关键词 图书馆 电子阅览室 建设
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部