期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
并行FORTRAN程序性能分析系统(PFPA)的设计与实现 被引量:1
1
作者 胡正国 张延园 +1 位作者 刘敏 蒋立源 《西北工业大学学报》 EI CAS CSCD 北大核心 1995年第4期587-591,共5页
研究和开发了一个性能分析系统,它能自动地提取描述程序运行过程的真实数据,依据这些数据描述并行FORTRAN程序的各种性能指标,并对影响程序运行性能的原因作出直观的图形表述,本系统的实现策略也可用于其它并行语言编写的并... 研究和开发了一个性能分析系统,它能自动地提取描述程序运行过程的真实数据,依据这些数据描述并行FORTRAN程序的各种性能指标,并对影响程序运行性能的原因作出直观的图形表述,本系统的实现策略也可用于其它并行语言编写的并行程序的性能分析。 展开更多
关键词 并行程序 性能分析 并行fortran 并行软件
下载PDF
基于采样的并行程序性能测量分析工具研究
2
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
下载PDF
一种HPF程序的监测与分析工具 被引量:7
3
作者 都志辉 汪剑平 +2 位作者 程旭 许卓群 石利霞 《软件学报》 EI CSCD 北大核心 1999年第10期1091-1095,共5页
该文介绍了一个构筑在HPF(highperformaanceFortran)编译系统之上的性能监测与性能分析工具.文章概述了HPF编译系统,讨论了性能分析的重要性及主要任务,详细介绍了这一工具所使用的性能分析方法和性... 该文介绍了一个构筑在HPF(highperformaanceFortran)编译系统之上的性能监测与性能分析工具.文章概述了HPF编译系统,讨论了性能分析的重要性及主要任务,详细介绍了这一工具所使用的性能分析方法和性能监测与性能数据收集方法。 展开更多
关键词 性能分析 可视化 HPF 性能监测 并行编译
下载PDF
Bellman-Ford算法性能可移植的GPU并行优化 被引量:7
4
作者 刘磊 王燕燕 +2 位作者 申春 李玉祥 刘雷 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第5期1559-1564,共6页
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AM... 提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。 展开更多
关键词 计算机软件 Bellman-Ford算法 GPU并行编程及优化技术 并行归约算法 性能可移植性
下载PDF
基于分层排队网络模型的MCU性能预测及优化研究 被引量:10
5
作者 边学工 胡瑞敏 +1 位作者 陈军 李德仁 《计算机学报》 EI CSCD 北大核心 2004年第2期209-215,共7页
针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该... 针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该方法可以较快地从多种设计方案或硬件平台中选择满足系统性能设计目标的软件或硬件配置 .仿真结果显示 ,选择双处理器配置和采用多线程技术 ,多点控制单元的接入容量提高了 5 0 % .最后 ,多点控制单元终端接入实验证明了该方法的有效性 . 展开更多
关键词 视频会议 多点控制单元 MCU 分层排队网络 接入容量
下载PDF
并行软件性能监测分析工具的设计与实现 被引量:4
6
作者 张慧成 王清贤 +3 位作者 杜祝平 曹蓉蓉 李霞 苏铭 《信息工程大学学报》 2002年第2期54-57,共4页
本文详细介绍了一个可对运行在多处理机上的并行应用软件进行性能评估的软件工具包。文章首先提出了性能分析的主要任务 ,然后较细致地介绍了并行软件性能监测分析工具包的设计与实现思想。利用工具包可以对并行程序执行过程作详细分析 ... 本文详细介绍了一个可对运行在多处理机上的并行应用软件进行性能评估的软件工具包。文章首先提出了性能分析的主要任务 ,然后较细致地介绍了并行软件性能监测分析工具包的设计与实现思想。利用工具包可以对并行程序执行过程作详细分析 ,能够帮助算法设计人员及软件体系结构设计人员揭示系统的行为 ,分析影响应用软件执行效率的因素和瓶颈 ,据此通过改进和优化软件结构 ,达到充分利用某种应用软件的内在并行特征和硬件特色 。 展开更多
关键词 性能监测分析工具 设计 并行软件 可视化 性能指标 性能评估 软件工具包 并行程序
下载PDF
基于动态插桩的程序分析工具的性能改进 被引量:2
7
作者 代声馨 洪玫 +2 位作者 郭鑫宇 张鹏 祁琳莹 《计算机应用研究》 CSCD 北大核心 2013年第7期2087-2090,共4页
基于动态插桩的工具被广泛应用于程序分析中,但该类工具都面临着严重的性能问题。这类工具的性能开销主要由两部分组成,即插桩引擎的开销和用户定义的分析程序的开销。为降低用户定义的分析工具的开销,首先分析了基于动态插桩的工具的... 基于动态插桩的工具被广泛应用于程序分析中,但该类工具都面临着严重的性能问题。这类工具的性能开销主要由两部分组成,即插桩引擎的开销和用户定义的分析程序的开销。为降低用户定义的分析工具的开销,首先分析了基于动态插桩的工具的性能开销的组成,并通过实验分析了造成性能开销的几点原因及其对工具的性能影响;根据分析结论提出了使用离线分析方式来优化工具性能,最后通过并行数据收集来进一步提升工具性能。使用该方法能减少分析程序5%~15%的CPU占用时间。 展开更多
关键词 动态插桩 离线分析 并行数据收集 性能优化 程序分析
下载PDF
一种并行调试与监测分析软件的体系结构设计 被引量:3
8
作者 张慧成 谢余强 +1 位作者 王华 魏鸿 《计算机工程》 CAS CSCD 北大核心 2003年第8期5-7,共3页
在对并行调试技术进行深入分析的基础上,对并行程序调试及性能分析工具软件的体系结构设计进行了详细的探讨,并指出了该软件体系结构设计的长处所在。
关键词 软件体系结构 并行调试 性能监测 静态分析 事件记录器 共享信息
下载PDF
嵌入式并行软件的集成开发环境研究 被引量:4
9
作者 刘敏 康慕宁 吴健 《西北工业大学学报》 EI CAS CSCD 北大核心 2000年第3期349-351,共3页
致力于嵌入式并行软件开发工具的研究 ,重点是将并行软件开发技术与嵌入式系统设计技术有机地结合在一起 ,研究系统仿真中的多任务并发调度问题 ,探索用于并行程序调试和性能分析的目标监控模式 ,并用系统集成技术将已实现的软件工具予... 致力于嵌入式并行软件开发工具的研究 ,重点是将并行软件开发技术与嵌入式系统设计技术有机地结合在一起 ,研究系统仿真中的多任务并发调度问题 ,探索用于并行程序调试和性能分析的目标监控模式 ,并用系统集成技术将已实现的软件工具予以集成 ,以形成支持嵌入式并行软件开发的工具集。它的应用将缩短嵌入式并行应用软件的开发周期 ,加快高性能嵌入式系统的研制速度。 展开更多
关键词 嵌入式并行系统 系统仿真 软件开发 多目标跟踪
下载PDF
重组竹梁受弯承载力数值分析 被引量:6
10
作者 周军文 沈玉蓉 《中国科技论文》 CAS 北大核心 2018年第1期83-86,共4页
为了解重组竹梁的受弯力学性能,用加筋的SOLID65单元分析两种工况下重组竹梁4点受弯时的承载力和竖向位移,材料的应力-应变关系曲线和相关的力学特性采用小试件的试验结果,得到重组竹梁的应力云图和跨中梁的荷载-位移曲线。同时,2组4根... 为了解重组竹梁的受弯力学性能,用加筋的SOLID65单元分析两种工况下重组竹梁4点受弯时的承载力和竖向位移,材料的应力-应变关系曲线和相关的力学特性采用小试件的试验结果,得到重组竹梁的应力云图和跨中梁的荷载-位移曲线。同时,2组4根重组竹梁采用与数值分析相同的荷载工况进行试验。结果表明,数值分析结果和试验结果吻合较好。验证了应用ANSYS软件对重组竹梁进行数值模拟分析的可行性。 展开更多
关键词 重组竹梁 受弯承载力 力学性能 数值分析 ANSYS软件
下载PDF
并行程序环境及其系统移植实现 被引量:1
11
作者 温钰洪 沈美明 +1 位作者 郑纬民 王鼎兴 《小型微型计算机系统》 EI CSCD 北大核心 1996年第1期13-19,共7页
并行程序设计环境作为分布并行系统中,并行应用程序开发设计与调试运行控制的工具,对于并行处理技术的研究发展与推广应用,具有重要的作用、本文将分析讨论并行程序环境Express与PVM的系统特点及其实现方法,同时,介绍E... 并行程序设计环境作为分布并行系统中,并行应用程序开发设计与调试运行控制的工具,对于并行处理技术的研究发展与推广应用,具有重要的作用、本文将分析讨论并行程序环境Express与PVM的系统特点及其实现方法,同时,介绍Express系统在并行图归约智能工作站上的系统移植实现。 展开更多
关键词 并行程序环境 消息通讯 任务分配 性能分析
下载PDF
WRF三维变分同化并行程序性能分析 被引量:2
12
作者 卢风顺 宋君强 朱小谦 《计算机工程与科学》 CSCD 2007年第11期149-151,156,共4页
并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF... 并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF三维变分同化并行程序运行效率进行了量化分析,确定了程序的计算热点和瓶颈,并提出了相应的优化方案。 展开更多
关键词 WRF三雏变分同化 并行程序 性能分析 TAU
下载PDF
一种新型4自由度柔顺并联机构的设计和特性 被引量:4
13
作者 胡俊峰 徐贵阳 《机械科学与技术》 CSCD 北大核心 2014年第4期496-500,共5页
设计一种新型4自由度精密微动平台,并对其静态和动态特性进行分析。在传统4一RRUR并联机构的基础上,采用替换法设计具有解耦的柔顺并联机构。采用有限元软件ANSYS对机构进行刚度和运动学分析,分析结果表明所设计的平台具有解耦的x和... 设计一种新型4自由度精密微动平台,并对其静态和动态特性进行分析。在传统4一RRUR并联机构的基础上,采用替换法设计具有解耦的柔顺并联机构。采用有限元软件ANSYS对机构进行刚度和运动学分析,分析结果表明所设计的平台具有解耦的x和y方向平动,并能实现4自由度微动。对机构进行灵敏度分析表明该柔顺机构的各个方向的位移灵敏度约为6μm/μm,说明平台灵敏。对机构进行模态分析,从振型可以看出该机构能实现4自由度方向的运动,并分析了在有和无预应力两种情况下的固有频率,两者差值范围为17.2%~52.4%,说明预应力对机构的固有频率有较大影响。 展开更多
关键词 柔顺并联机构 动态特性 4 RRUR并联机构 静态特性
下载PDF
并行软件性能监测与分析系统中运行时性能监控器的设计 被引量:3
14
作者 杜祝平 《信息工程大学学报》 2000年第4期65-68,共4页
并行软件性能监测与分析系统是一个对运行在多处理器上的并行应用软件进行性能评估的软件工具包 ,其中的运行时性能监控器提供了一套完整的监测数据采集与处理的方法。本文对其设计原理和实现方法进行了重点阐述。
关键词 性能监测与分析系统 性能监控器 并行软件 性能评估 软件工具包 系统设计
下载PDF
并行程序开发流程及其辅助工具设计 被引量:1
15
作者 崔焕庆 《计算机工程与设计》 CSCD 北大核心 2007年第17期4079-4081,4088,共4页
并行程序开发大多遵循"开发-执行-验证和分析"的流程,开发周期较长,效率低下,而正确性和高性能是使用并行程序的首要条件。为此,提出了一种贯彻算法设计、程序开发到结果分析全过程的、可以同时进行正确性验证和性能分析的开... 并行程序开发大多遵循"开发-执行-验证和分析"的流程,开发周期较长,效率低下,而正确性和高性能是使用并行程序的首要条件。为此,提出了一种贯彻算法设计、程序开发到结果分析全过程的、可以同时进行正确性验证和性能分析的开发流程,给出了较完善的计算机辅助开发工具设计的原则和方法,并开发了消息传递并行程序设计的辅助工具原型。实验证明,该流程和方法提高了并行程序开发效率,简化了程序员的工作。 展开更多
关键词 并行程序 计算机辅助并行软件工程 验证 性能分析 辅助工具
下载PDF
一种精确的调用图生成技术
16
作者 唐新春 郭克榕 《计算机工程与设计》 CSCD 北大核心 1997年第5期34-39,共6页
调用图是过程间分析和程序自动并行化的基础。生成精确调用图可以进一步开发程序的并行性。此文针对Fortran程序,提出了一项完全消除哑过程,产生精确调用图的技术与相应的算法。该算法已在面向MPPFortran的程序自动... 调用图是过程间分析和程序自动并行化的基础。生成精确调用图可以进一步开发程序的并行性。此文针对Fortran程序,提出了一项完全消除哑过程,产生精确调用图的技术与相应的算法。该算法已在面向MPPFortran的程序自动并行化工具中实现。 展开更多
关键词 软件工具 调用图 过程间分析 程序自动并行化
下载PDF
数据并行高层描述语言研究综述
17
作者 郑全录 陆林生 《信息工程大学学报》 2000年第2期36-40,共5页
本文介绍了数据并行编程语言总的研究情况 ,并行编程语言的研究背景、与其他学科的关系和现有并行语言的评述。作为例子 ,介绍了当前已公开发表或发布的一些原型系统及其主要应用领域 ,指出了当前语言的挑战性、局限性 ,结合当前语言的... 本文介绍了数据并行编程语言总的研究情况 ,并行编程语言的研究背景、与其他学科的关系和现有并行语言的评述。作为例子 ,介绍了当前已公开发表或发布的一些原型系统及其主要应用领域 ,指出了当前语言的挑战性、局限性 ,结合当前语言的发展 ,探讨了新型语言应有的关键技术。 展开更多
关键词 数据并行 编程环境 并行算法 编译器 性能分析
下载PDF
并行程序中同步瓶颈的检测和优化方法
18
作者 张杨 李柳旭 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第5期92-101,共10页
针对并发程序中锁的不当使用可能导致性能瓶颈的问题,提出检测和优化并发程序中同步瓶颈的方法IdeSync。IdeSync使用静态分析方法获取同步方法和同步块,构建静态同步依赖图,采用基于执行路径的动态分析技术进行同步依赖关系分析,构建同... 针对并发程序中锁的不当使用可能导致性能瓶颈的问题,提出检测和优化并发程序中同步瓶颈的方法IdeSync。IdeSync使用静态分析方法获取同步方法和同步块,构建静态同步依赖图,采用基于执行路径的动态分析技术进行同步依赖关系分析,构建同步依赖图。为了暴露性能瓶颈,在同步依赖图上通过增加程序工作负载的方式,监测临界区的性能变化,并针对检测到的同步瓶颈给出优化建议。在实验中通过HSQLDB、SPECjbb2005和RxJava等12个大型实际应用程序对IdeSync的有效性进行验证,共检测到72个同步瓶颈,根据优化建议进行优化后程序性能均有所提升。实验表明,IdeSync能够有效地检测和优化同步瓶颈。 展开更多
关键词 同步瓶颈 并行程序 性能优化 程序分析
下载PDF
并行程序性能分析系统的研究
19
作者 张延园 刘敏 蒋立源 《微机发展》 1997年第5期17-19,共3页
在并行程序的开发过程中,常常会出现负载不平衡、通讯开销过大、同步等待等一些导致计算机系统性能降低的因素。为了克服这些问题,及时对并行程序进行性能分析是十分重要的.在[1]、[2]、[3]中虽然对并行程序的性能分析作了一些研究... 在并行程序的开发过程中,常常会出现负载不平衡、通讯开销过大、同步等待等一些导致计算机系统性能降低的因素。为了克服这些问题,及时对并行程序进行性能分析是十分重要的.在[1]、[2]、[3]中虽然对并行程序的性能分析作了一些研究,但都没有实现对并行程序的全局住分析,作者在对并行程序的运行状态进行分析的基础上,研究和开发了一个住能分析系统,它能自动地提取描述程序运行过程的真实数据,依据这些数据描述并行程序的各种性能指标,并对影响并行程序运行性能的原因作出直观的图形表述。 展开更多
关键词 并行程序 性能分析 计算机系统
下载PDF
基于Julia语言的并行计算方法初探 被引量:1
20
作者 巩庆奎 张常有 +1 位作者 张先轶 张云泉 《计算机科学》 CSCD 北大核心 2015年第1期44-46,共3页
Julia语言是一种在MIT许可证下免费的开发中脚本语言(beta 0.2.0),目标是降低并行程序的编程难度。基于Julia现有语法机制,逐步增强Julia语法特性,结合公交线路的平均走行时间统计案例,研究Julia并行编程框架和程序逐步精化的方法。Juli... Julia语言是一种在MIT许可证下免费的开发中脚本语言(beta 0.2.0),目标是降低并行程序的编程难度。基于Julia现有语法机制,逐步增强Julia语法特性,结合公交线路的平均走行时间统计案例,研究Julia并行编程框架和程序逐步精化的方法。Julia程序支持本地多核心/多CPU并行计算。为充分发挥实验平台的计算潜能,尝试了提高Julia程序计算性能的策略。对案例程序的实验分析表明,Julia并行程序在管理计算核心方面耗费了一定的工作时间,但随着问题规模的增大,其影响可逐渐忽略,从而可获得接近线性的加速比。 展开更多
关键词 Julia语言 计算规模 并行程序 程序精化 性能分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部