-
题名Intel多核工具对并行程序的设计,调试和优化
- 1
-
-
作者
支宝珠
鞠和新
舒化
-
机构
新疆油田公司百口泉采油厂信息所
新疆油田公司社保中心
-
出处
《中国科技财富》
2010年第18期18-18,19,共2页
-
文摘
本文阐述了如何将Intel多核工具运用到并行化设计,介绍了他们的应用,分析了对应的解决方案。本文对于Intel多核并行开发具有借鉴意义。
-
关键词
多核
intel工具
并行开发
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-
-
题名MASNUM海浪模式的代码现代化优化
被引量:4
- 2
-
-
作者
杨晓丹
宋振亚
周姗
刘海行
尹训强
-
机构
中国海洋大学海洋与大气学院
青岛海洋科学与技术国家实验室区域海洋动力学与数值模拟功能实验室
国家海洋局第一海洋研究所
英特尔亚太研发有限公司
-
出处
《海洋科学进展》
CAS
CSCD
北大核心
2017年第4期473-482,共10页
-
基金
国家重点研发计划--大规模多模式多过程地球系统模式耦合平台研发(2016YFA0602200)
中央级公益性科研院所基本科研业务费专项--束星北青年学者基金(2016S03)
+2 种基金
青岛海洋科学与技术国家实验室鳌山人才计划--优秀青年学者专项
国家自然科学基金委员会-山东省人民政府联合资助海洋科学研究中心项目--海洋环境动力学和数值模拟(U1406404)
全球变化与海气相互作用专项--海洋动力系统可预报性研究(GASI-IPOVAI-06)
-
文摘
海洋数值模式当前已经成为海洋研究和预测的核心工具,其高分辨率。多物理过程的发展趋势对数值模式计算速度也提出了越来越高的要求。为了使得海洋数值模式更好的适应计算机基础架构,充分发挥现代化计算机体系的计算特点,提高计算效率,本文提出了一种简单易行且有效的代码现代化优化方案,并以MASNUM海浪模式为例进行了测试。首先利用诊断工具Intel Vtune Amplifier XE和Intel Trace Analyzer Collector,对模式的性能和负载均衡性进行了分析;之后,针对热点函数,在单节点上制定了4个优化步骤,包括编译器选项优化,串行和标量优化,向量化和OpenMP并行优化。结果表明,经过优化后,单节点内模式的计算速度可以提高1.95倍,多节点的模式强扩展性呈线性。这表明本文提出的代码现代化方案是一种行之有效的优化方法。
-
关键词
intel分析工具
代码现代化优化
海洋数值模式
海浪模式
高性能计算
-
Keywords
intel analysis tools
code optimization
oceanic numerical model
surface wave model
high performance computation
-
分类号
P73
[天文地球—海洋科学]
-
-
题名海洋环流模式NEMO的代码现代化
- 3
-
-
作者
周生昌
刘卫国
宋振亚
杨晓丹
-
机构
山东大学软件学院
自然资源部第一海洋研究所
青岛海洋科学与技术试点国家实验室区域海洋动力学与数值模拟功能实验室
海洋环境科学和数值模拟自然资源部重点实验室
-
出处
《海洋科学进展》
CAS
CSCD
北大核心
2021年第1期62-72,共11页
-
基金
国家自然科学基金项目--海量数据驱动下的高分辨率海洋数值模式关键算法研究(U1806206)和新型海洋与气候模式的发展(41821004)
自然资源部基本科研业务费专项资金项目--ENSO,PDO和AMO的非线性调制机理研究(GY0219Q08)
-
文摘
海洋数值模式是精准海洋环境预报的核心手段。随着计算分辨率的不断提高,海洋数值模式对计算性能的要求也越来越高。为了提高模式计算性能,充分发挥现代计算机的特点,选取海洋环流模式NEMO开展了代码现代化优化方案在海洋环流模式中的应用研究。首先使用Intel性能分析工具对模式的计算性能进行了分析;随后,针对热点函数,开展了编译选项优化、标量串行代码优化、SIMD优化、内存带宽优化以及多进程扩展。结果显示:经过以上优化步骤,在不增加任何硬件成本的前提下,模式整体性能可提升31%,且在多进程下表现出了较好的负载均衡性。这表明,本研究采用的优化策略是一种切实可行的方法。在此基础上,进一步对代码现代化过程中出现的显著影响计算效率的问题,如大量指针的使用阻止矢量化、循环嵌套过多、内存带宽占用过高等,开展了分析和讨论,为未来模式的设计和改进提供了参考和建议。
-
关键词
代码现代化
海洋环流模式
NEMO
intel性能分析工具
SIMD
-
Keywords
code modernization
Ocean General Circulation Model
NEMO
intel performance
analysis tools
SIMD
-
分类号
P73
[天文地球—海洋科学]
-
-
题名Bzip2解压缩的优化
- 4
-
-
作者
罗少兰
-
机构
厦门海洋职业技术学院
-
出处
《信息与电脑(理论版)》
2013年第1期172-174,共3页
-
文摘
随着大规模集成电路的迅速发展,计算机的核心CPU也得到性能的提升,无论是PC还是嵌入式的CPU都已经发展为体积小、功耗低、性能高、可靠性强架构。并且高性能应用也越来越广泛,如目前一些计算密集性的应用:音视频信号的处理、视频图像的处理、3D游戏等。这些应用对多媒体数据进行高效率、高比例的压缩,计算频度和复杂度都非常高。在多核体系时代,需要选择合适的微处理器,根据具体的平台进行改进个优化,降低运算的复杂度。本文运用posix pthread线程库对bzip2进行优化,通过对结果进行分析,和ipp库的应用比较,可以得出并行化的优越性,和理想的加速比相近。
-
关键词
bzip2
多线程
intel工具
优化
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-