期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于并行Benchmark的高性能机实用测试与评价方法 被引量:1
1
作者 迟利华 刘杰 +1 位作者 胡庆丰 李晓梅 《计算机工程与科学》 CSCD 2004年第4期45-47,58,共4页
文中分析了传统基于并行基准测试程序测试方法的不足,针对目前高性能计算机处理机台数多的特点,给出了实用的测试方法,推广了传统加速比的概念,提出了一种可扩展性评价方法。使用文中给出的方法,可方便地对高性能计算机进行测试和性能评... 文中分析了传统基于并行基准测试程序测试方法的不足,针对目前高性能计算机处理机台数多的特点,给出了实用的测试方法,推广了传统加速比的概念,提出了一种可扩展性评价方法。使用文中给出的方法,可方便地对高性能计算机进行测试和性能评价,同时可以使用小规模的并行机测试结果预测大规模并行机的性能。最后给出了NPB在某高性能计算机上的测试和性能评价结果。 展开更多
关键词 高性能计算机 测试 性能评价 并行基准测试程序 benchmark
下载PDF
气象应用基准测试程序MM5 Benchmark并行性能优化
2
作者 朱小谦 张卫民 +1 位作者 宋君强 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2010年第12期102-106,共5页
由美国国家大气研究中心(NCAR)和宾夕法尼亚大学(PSU)共同开发的MM5模式是目前气象领域广泛采用的中尺度模式之一。由于MM5模式的广泛应用和计算特点,MM5 Benchmark成为了高性能计算领域衡量计算机实用性能的典型应用之一。本文介绍了MM... 由美国国家大气研究中心(NCAR)和宾夕法尼亚大学(PSU)共同开发的MM5模式是目前气象领域广泛采用的中尺度模式之一。由于MM5模式的广泛应用和计算特点,MM5 Benchmark成为了高性能计算领域衡量计算机实用性能的典型应用之一。本文介绍了MM5模式的并行计算方法,针对目前流行的Intel Itanium-2 CPU特点,在性能分析的基础上,从编译选项、代码优化、区域分解、处理机拓扑结构等方面对程序性能进行优化。实际测试结果表明,在某国产巨型机上优化后的持续计算性能最大提高20%左右。 展开更多
关键词 MM5 benchmark Itanium-2 并行 性能分析 优化
下载PDF
面向处理器微体系结构评估的高通量MicroBenchmark研究
3
作者 薛瑞 苗福涛 +2 位作者 叶笑春 孙凝晖 徐文星 《计算机研究与发展》 EI CSCD 北大核心 2018年第7期1569-1583,共15页
基准测试程序是评估处理器微体系结构设计的重要手段,然而当前的基准测试程序无法有效全面地评估面向高通量应用的处理器微体系结构的设计.基于此,针对高通量应用的特征,提出了用于评估面向高通量应用的处理器微体系结构设计的基准测试... 基准测试程序是评估处理器微体系结构设计的重要手段,然而当前的基准测试程序无法有效全面地评估面向高通量应用的处理器微体系结构的设计.基于此,针对高通量应用的特征,提出了用于评估面向高通量应用的处理器微体系结构设计的基准测试程序——HTC-MicroBench.首先,提出一种基于应用特征的高通量应用分类方法,并基于此分类方法对高通量应用中的Workload进行分类.其次,针对高通量应用的特征,提出了一种基于线程的作业处理节点并行化模型,基于此模型完成了HTCMicroBench的设计和实现.最后,从作业并发性、作业之间的耦合性和Cache使用效率等指标对HTCMicroBench进行实验评估;并基于HTC-MicroBench对TILE-Gx和Xeon两种处理器的并行加速能力做了评估,高并发、低耦合和由Workload特征所体现出的不同Cache命中率的评估结果说明了HTCMicroBench能够准确刻画高通量应用的特征,并对面向高通量应用的处理器微体系结构的设计进行有效的测评. 展开更多
关键词 高通量应用 处理器微体系结构设计 基准测试程序 并行化 Pthread模型
下载PDF
Comparison of Parallel Kinematic Machines with Three Translational Degrees of Freedom and Linear Actuation 被引量:7
4
作者 PRAUSE Isabel CHARAF EDDINE Sami CORVES Burkhard 《Chinese Journal of Mechanical Engineering》 SCIE EI CAS CSCD 2015年第4期841-850,共10页
The development of new robot structures, in particular of parallel kinematic machines(PKM), is widely systematized by different structure synthesis methods. Recent research increasingly focuses on PKM with less than... The development of new robot structures, in particular of parallel kinematic machines(PKM), is widely systematized by different structure synthesis methods. Recent research increasingly focuses on PKM with less than six degrees of freedom(DOF). However, an overall comparison and evaluation of these structures is missing. In order to compare symmetrical PKM with three translational DOF, different evaluation criteria are used. Workspace, maximum actuation forces and velocities, power, actuator stiffness, accuracy and transmission behavior are taken into account to investigate strengths and weaknesses of the PKMs. A selection scheme based on possible configurations of translational PKM including different frame configurations is presented. Moreover, an optimization method based on a genetic algorithm is described to determine the geometric parameters of the selected PKM for an exemplary load case and a prescribed workspace. The values of the mentioned criteria are determined for all considered PKM with respect to certain boundary conditions. The distribution and spreading of these values within the prescribed workspace is presented by using box plots for each criterion. Thereby, the performance characteristics of the different structures can be compared directly. The results show that there is no "best" PKM. Further inquiries such as dynamic or stiffness analysis are necessary to extend the comparison and to finally select a PKM. 展开更多
关键词 parallel kinematic machines COMPARISON benchmark selection scheme
下载PDF
并行NAS Benchmarks的需求特征分析
5
作者 王建勇 徐志伟 +1 位作者 孙毓忠 祝明发 《计算机研究与发展》 EI CSCD 北大核心 1998年第6期506-510,共5页
文中采用阶段并行模型(phaseparalelmodel),分析了并行NASbenchmarks的结构和资源需求特征,得到了其对内存、I/O及通信的时延和带宽等需求的参数值.这些量化的参数对各类并行计算机的设计和评价... 文中采用阶段并行模型(phaseparalelmodel),分析了并行NASbenchmarks的结构和资源需求特征,得到了其对内存、I/O及通信的时延和带宽等需求的参数值.这些量化的参数对各类并行计算机的设计和评价具有一定的参考价值. 展开更多
关键词 阶段并行模型 需求特征 并行计算机
下载PDF
Advances in Vision-Based Lane Detection:Algorithms,Integration,Assessment,and Perspectives on ACP-Based Parallel Vision 被引量:16
6
作者 Yang Xing Chen Lv +5 位作者 Long Chen Huaji Wang Hong Wang Dongpu Cao Efstathios Velenis Fei-Yue Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2018年第3期645-661,共17页
Lane detection is a fundamental aspect of most current advanced driver assistance systems(ADASs). A large number of existing results focus on the study of vision-based lane detection methods due to the extensive knowl... Lane detection is a fundamental aspect of most current advanced driver assistance systems(ADASs). A large number of existing results focus on the study of vision-based lane detection methods due to the extensive knowledge background and the low-cost of camera devices. In this paper, previous visionbased lane detection studies are reviewed in terms of three aspects, which are lane detection algorithms, integration, and evaluation methods. Next, considering the inevitable limitations that exist in the camera-based lane detection system, the system integration methodologies for constructing more robust detection systems are reviewed and analyzed. The integration methods are further divided into three levels, namely, algorithm, system,and sensor. Algorithm level combines different lane detection algorithms while system level integrates other object detection systems to comprehensively detect lane positions. Sensor level uses multi-modal sensors to build a robust lane recognition system. In view of the complexity of evaluating the detection system, and the lack of common evaluation procedure and uniform metrics in past studies, the existing evaluation methods and metrics are analyzed and classified to propose a better evaluation of the lane detection system. Next, a comparison of representative studies is performed. Finally, a discussion on the limitations of current lane detection systems and the future developing trends toward an Artificial Society, Computational experiment-based parallel lane detection framework is proposed. 展开更多
关键词 Advanced driver assistance systems(ADASs) ACP theory benchmark lane detection parallel vision performance evaluation
下载PDF
NAMD Package Benchmarking on the Base of Armenian Grid Infrastructure
7
作者 Armen Poghosyan Levon Arsenyan +3 位作者 Hrachya Astsatryan Mikayel Gyurjyan Hovsep Keropyan Aram Shahinyan 《Communications and Network》 2012年第1期34-40,共7页
The parallel scaling (parallel performance up to 48 cores) of NAMD package has been investigated by estimation of the sensitivity of interconnection on speedup and benchmark results—testing the parallel performance o... The parallel scaling (parallel performance up to 48 cores) of NAMD package has been investigated by estimation of the sensitivity of interconnection on speedup and benchmark results—testing the parallel performance of Myrinet, Infiniband and Gigabit Ethernet networks. The system of ApoA1 of 92 K atoms, as well as 1000 K, 330 K, 210 K, 110 K, 54 K, 27 K and 16 K has been used as testing systems. The Armenian grid infrastructure (ArmGrid) has been used as a main platform for series of benchmarks. According to the results, due to the high performance of Myrinet and Infiniband networks, the ArmCluster system and the cluster located in the Yerevan State University show reasonable values, meanwhile the scaling of clusters with various types of Gigabit Ethernet interconnections breaks down when interconnection is activated. However, the clusters equipped by Gigabit Ethernet network are sensitive to change of system, particularly for 1000 K systems no breakdown in scaling is observed. The infiniband supports in comparison with Myrinet, make it possible to receive almost ideally results regardless of system size. In addition, a benchmarking formula is suggested, which provides the computational throughput depending on the number of processors. These results should be important, for instance, to choose most appropriate amount of processors for studied system. 展开更多
关键词 parallel MOLECULAR Dynamics NAMD benchmarkING GRID
下载PDF
国产万亿次机群系统NPB性能测试分析 被引量:13
8
作者 袁伟 张云泉 +1 位作者 孙家昶 李玉成 《计算机研究与发展》 EI CSCD 北大核心 2005年第6期1079-1084,共6页
对3个国产万亿次机群系统进行了NPB性能测试分析,重点研究大规模并行处理时(处理器数目达到上千个)的性能特点和趋势.分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机器上的性能特点和表现并不一... 对3个国产万亿次机群系统进行了NPB性能测试分析,重点研究大规模并行处理时(处理器数目达到上千个)的性能特点和趋势.分析了不同的处理器、互连网络等系统配置对NPB性能的影响,发现NPB的8个程序在3个万亿次机器上的性能特点和表现并不一致,表明国产高性能机群在设计上正在逐渐走出同质化的趋势,向多样化发展.进一步分析表明,目前NPB程序的可扩展性可以达到几百个处理器,但尚不能达到上千个处理器,NPB程序能发挥出的系统峰值的百分比仍然徘徊在10%左右,机群系统的并行可扩展性和应用程序对机器运算潜能的利用还需要进一步提高.对于处理器数目达到上千个的万亿次机群系统来说,对集合通信和细粒度通信能力的支持亟需提高. 展开更多
关键词 万亿次机群 性能评测 NPB
下载PDF
基于高性能计算的开源云平台性能评估 被引量:19
9
作者 李春艳 张学杰 《计算机应用》 CSCD 北大核心 2013年第12期3580-3585,共6页
云计算是一种提供各种IT服务的互联网资源利用的新模式,已经广泛地应用在包括高性能计算的各种领域。然而,虚拟化带来了一些性能开销;同时,不同的云平台实施虚拟化技术的不同,使得在这些云平台上应用高性能计算服务的性能也千差万别。通... 云计算是一种提供各种IT服务的互联网资源利用的新模式,已经广泛地应用在包括高性能计算的各种领域。然而,虚拟化带来了一些性能开销;同时,不同的云平台实施虚拟化技术的不同,使得在这些云平台上应用高性能计算服务的性能也千差万别。通过HPC Challenge(HPCC)Benchmark和NAS Parallel Benchmark(NPB)分别对CPU、内存、网络、扩展性和高性能计算真实负载进行评估,比较并分析了诸如Nimbus、OpenNebula和OpenStack实施高性能计算的性能,实验显示OpenStack对计算密集型的高性能应用负载表现出较好的性能,因此,OpenStack是实施高性能计算的开源云平台的一个好的选择。 展开更多
关键词 高性能计算 云计算 基准测试 HPCC NAS并行基准测试程序 开源
下载PDF
并行程序的优化与性能评价 被引量:5
10
作者 刘杰 迟利华 胡庆丰 《计算机工程与科学》 CSCD 2000年第5期67-70,共4页
文中讨论了并行程序的优化问题 ,指出并行程序的优化应从数据划分、通信优化和串行程序优化三个方面着手。针对传统加速比的缺点和不足 ,我们提出了优化加速比模型来评价优化并行程序的性能 ;对 NAS基准测试程序 MG和 FT进行了优化 ,用... 文中讨论了并行程序的优化问题 ,指出并行程序的优化应从数据划分、通信优化和串行程序优化三个方面着手。针对传统加速比的缺点和不足 ,我们提出了优化加速比模型来评价优化并行程序的性能 ;对 NAS基准测试程序 MG和 FT进行了优化 ,用优化加速比模型分析了上述两个程序在IBM SP2上的性能。 展开更多
关键词 加速比 优化 并行程序 性能评价
下载PDF
优化并行计算的性能评价 被引量:1
11
作者 刘杰 迟利华 胡庆丰 《计算机工程与设计》 CSCD 北大核心 2000年第6期4-7,共4页
传统的并行计算的性能评价模型是加速比,文中讨论了加速比的缺点和不足,在此基础上提出了一种新的优化并行计算的性能评价模型(我们称之为优化加速比)。利用优化加速比分析了NAS基准测试程序MG和FT在IBM SP2(66mhz/wn)上的性能。
关键词 加速比 优化并行计算 性能评价模型 NAS基准测试程序集
下载PDF
NPB CG在分布式环境下的并行实现 被引量:1
12
作者 胡庆丰 刘杰 迟利华 《计算机工程与科学》 CSCD 1997年第4期54-56,共3页
CGBenchmark是NASParalelBenchmarks(NPB)中的一个核心程序,它用共轭梯度法求大型稀疏对称正定矩阵的最小特征值,本文介绍其主要算法,并给出在分布式环境下的高效并行算法。
关键词 基准测试程序 共轭梯度法 并行算法
下载PDF
基于NPB的并行机群系统可扩展性研究 被引量:1
13
作者 苑野 于永澔 《哈尔滨商业大学学报(自然科学版)》 CAS 2016年第1期60-63,共4页
使用NPB并行基准测试程序能有效的测试出大型计算流体力学(CFD)应用中的计算和数据移动特征,这对大量科学与工程应用具有重要意义.在并行机群计算环境下,使用NPB基准测试程序(IS、EP、CG、MG、FT、BT、SP和LU)对该系统的性能进行了评测... 使用NPB并行基准测试程序能有效的测试出大型计算流体力学(CFD)应用中的计算和数据移动特征,这对大量科学与工程应用具有重要意义.在并行机群计算环境下,使用NPB基准测试程序(IS、EP、CG、MG、FT、BT、SP和LU)对该系统的性能进行了评测,实验表明,在一定规模下,NPB的8个基准测试程序随着处理器数目的提高,其系统性能和可扩展性的表现各不一致.EP程序的可扩展性较好,性能较稳定;而IS、CG、MG、BT和SP的可扩展性较差,性能较差;LU和FT在不同规模下,其可扩展性表现为不规律性.机群系统的可扩展性与应用程序的匹配程度还需要进一步提高. 展开更多
关键词 NPB 性能评测 并行基准测试程序
下载PDF
集群计算技术及其在石油工业中的应用 被引量:36
14
作者 赵改善 包红林 《石油物探》 EI CSCD 2001年第3期118-126,共9页
对于高性能计算不断增长的需求和计算技术的持续发展 ,促进了计算机集群技术的发展和应用。计算机集群系统具有系统建设、维护和升级成本低 ,可扩展性好 ,易维护 ,易升级 ,计算性能强以及通用和跨平台的并行计算软件开发环境 (PVM和MPI... 对于高性能计算不断增长的需求和计算技术的持续发展 ,促进了计算机集群技术的发展和应用。计算机集群系统具有系统建设、维护和升级成本低 ,可扩展性好 ,易维护 ,易升级 ,计算性能强以及通用和跨平台的并行计算软件开发环境 (PVM和MPI等 )等优点。本文概述了计算机集群技术的概念、技术基础、并行软件开发环境和Beowulf集群 ;论述了石油工业对高性能计算的需求 ;介绍了集群技术在石油勘探中的应用现状 ;指出了集群技术将大大降低石油勘探开发成本 ,促进新技术的应用和推广 ; 展开更多
关键词 高性能计算 集群系统 并行计算 PVM MPI 性能测试 油气勘探 地震勘探
下载PDF
基于异构网络机群环境下NPB性能分析 被引量:2
15
作者 苑野 于永澔 《哈尔滨师范大学自然科学学报》 CAS 2016年第2期75-78,共4页
在异构网络机群环境下,使用NPB基准测试程序对并行系统的性能进行了评测与分析.实验表明,在64个处理器Class D规模下,NPB程序在TCP/IP协议下的整体性能优于在Infiniband协议下的整体性能.随着处理器数目的提高,其可扩展性在TCP/IP协议和... 在异构网络机群环境下,使用NPB基准测试程序对并行系统的性能进行了评测与分析.实验表明,在64个处理器Class D规模下,NPB程序在TCP/IP协议下的整体性能优于在Infiniband协议下的整体性能.随着处理器数目的提高,其可扩展性在TCP/IP协议和Infiniband协议中表现的各不相同,并行系统的可扩展性和应用程序的硬件性能利用率还需进一步提高. 展开更多
关键词 NPB 性能评测 并行基准测试程序
下载PDF
并行图重写抽象机PAM/TGR的性能与评价 被引量:1
16
作者 田新民 王鼎兴 沈美明 《小型微型计算机系统》 CSCD 北大核心 1992年第8期1-9,共9页
本文首先扼要地介绍了我们基于多相并行图重写执行模型HPGREM的并行图重写抽象机PAM/TGR的设计和实现。其次讨论了面向PAM/TGR的性能评价标准,并且揭示了超越加速和病态加速两种在并行多机系统中可能出现的加速现象,给出了超越加速比和... 本文首先扼要地介绍了我们基于多相并行图重写执行模型HPGREM的并行图重写抽象机PAM/TGR的设计和实现。其次讨论了面向PAM/TGR的性能评价标准,并且揭示了超越加速和病态加速两种在并行多机系统中可能出现的加速现象,给出了超越加速比和病态加速比的定义。在此基础之上,我们基于典型的Bench-mark测试和评价了PAM/TGR的性能,测试结果表明,PAM/TGR机的加速效果好,处理机利用率高,能有效地避免严重的病态加速现象,系统性能优于目前国外同类系统的性能。 展开更多
关键词 并行图 并行抽象机 性能 评价
下载PDF
遗传并行粒子群优化算法及其性能分析 被引量:1
17
作者 刘昊 李大卫 王莉 《辽宁科技大学学报》 CAS 2008年第3期239-239,共1页
在已有的并行粒子群优化算法的基础上,结合遗传算法,并利用Java语言支持多线程特点,开发出单子群、k子群、任意子群三种遗传并行粒子群优化算法。通过对6个Benchmark测试函数的测试分析,表明这三种算法都具有运行速度快,求解质量... 在已有的并行粒子群优化算法的基础上,结合遗传算法,并利用Java语言支持多线程特点,开发出单子群、k子群、任意子群三种遗传并行粒子群优化算法。通过对6个Benchmark测试函数的测试分析,表明这三种算法都具有运行速度快,求解质量高的特点。相信应用于大规模工程实际问题也能取到令人满意的结果。 展开更多
关键词 粒子群优化算法 遗传算法 性能分析 并行 benchmark JAVA语言 测试分析 测试函数
下载PDF
遗传并行粒子群优化算法及其性能分析 被引量:1
18
作者 刘昊 李大卫 王莉 《辽宁科技大学学报》 CAS 2008年第5期495-499,共5页
在已有的并行粒子群优化算法的基础上,结合遗传算法,并利用Java语言支持多线程特点,开发出单子群、k子群、任意子群三种遗传并行粒子群优化算法。通过对6个Benchmark测试函数的测试分析,表明这三种算法都具有运行速度快,求解质量高的特点。
关键词 粒子群优化 并行 遗传算法 benchmark测试函数 性能分析
下载PDF
面向并行Agent仿真的合成基准测试模型 被引量:1
19
作者 余文广 王维平 +1 位作者 侯洪涛 李群 《系统工程与电子技术》 EI CSCD 北大核心 2012年第4期813-819,共7页
为了评估并行仿真算法的性能,需要建立一个基准测试模型。针对并行Agent仿真研究领域中缺乏一种与应用无关的基准测试模型这一问题,在借鉴并行离散事件仿真中经典的合成测试模型PHOLD设计思想的基础上,根据基于Agent仿真的特点,提出面... 为了评估并行仿真算法的性能,需要建立一个基准测试模型。针对并行Agent仿真研究领域中缺乏一种与应用无关的基准测试模型这一问题,在借鉴并行离散事件仿真中经典的合成测试模型PHOLD设计思想的基础上,根据基于Agent仿真的特点,提出面向并行Agent仿真的合成基准测试模型,利用该模型可以方便地合成符合不同应用特点的计算负载,去除与应用相关的因素对性能分析的影响,能够为不同的并行Agent仿真研究者提供一个公共的测试基准。最后,采用该模型从实验层次上分析了Agent计算粒度、所采用的处理器数目等因素对并行Agent仿真加速比的影响。 展开更多
关键词 并行Agent仿真 PHOLD模型 基准测试模型 性能分析
下载PDF
NPB MG在分布式环境下的并行实现
20
作者 胡庆丰 刘杰 迟利华 《计算机工程与科学》 CSCD 1998年第1期28-30,共3页
NASParalelBenchmarks(NPB)是为了测试和评价超级计算机性能而设计的并行基准测试程序集,MGBenchmark是其中的一个核心程序,它用多重网格方法求解三维Poison偏微分方程,本文介绍了其主要... NASParalelBenchmarks(NPB)是为了测试和评价超级计算机性能而设计的并行基准测试程序集,MGBenchmark是其中的一个核心程序,它用多重网格方法求解三维Poison偏微分方程,本文介绍了其主要算法,并给出了在分布式环境下的并行算法,最后给出了在SGIChalengePVM平台上的测试结果。 展开更多
关键词 基准测试程序 并行算法 NPB 应用程序
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部