期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
Development of high performance casting analysis software by coupled parallel computation
1
作者 Sang Hyun CHO Jeong Kil CHOI 《China Foundry》 SCIE CAS 2007年第3期215-219,共5页
Up to now,so much casting analysis software has been continuing to develop the new access way to real casting processes. Those include the melt flow analysis,heat transfer analysis for solidification calculation,mecha... Up to now,so much casting analysis software has been continuing to develop the new access way to real casting processes. Those include the melt flow analysis,heat transfer analysis for solidification calculation,mechanical property predictions and microstructure predictions. These trials were successful to obtain the ideal results comparing with real situations,so that CAE technologies became inevitable to design or develop new casting processes. But for manufacturing fields,CAE technologies are not so frequently being used because of their difficulties in using the software or insufficient computing performances. To introduce CAE technologies to manufacturing field,the high performance analysis is essential to shorten the gap between product designing time and prototyping time. The software code optimization can be helpful,but it is not enough,because the codes developed by software experts are already optimized enough. As an alternative proposal for high performance computations,the parallel computation technologies are eagerly being applied to CAE technologies to make the analysis time shorter. In this research,SMP (Shared Memory Processing) and MPI (Message Passing Interface) (1) methods for parallelization were applied to commercial software "Z-Cast" to calculate the casting processes. In the code parallelizing processes,the network stabilization,core optimization were also carried out under Microsoft Windows platform and their performances and results were compared with those of normal linear analysis codes. 展开更多
关键词 parallel computation message passing interface casting analysis SMP performance improvement
下载PDF
Parallelization and performance tuning of molecular dynamics code with OpenMP 被引量:3
2
作者 白树仁 冉丽萍 鲁奎麟 《Journal of Central South University of Technology》 2006年第3期260-264,共5页
An OpenMP approach was proposed to parallelize the sequential molecular dynamics(MD) code on shared memory machines. When a code is converted from the sequential form to the parallel form, data dependence is a main pr... An OpenMP approach was proposed to parallelize the sequential molecular dynamics(MD) code on shared memory machines. When a code is converted from the sequential form to the parallel form, data dependence is a main problem. A traditional sequential molecular dynamics code is anatomized to find the data dependence segments in it, and the two different methods, i.e., recover method and backward mapping method were used to eliminate those data dependencies in order to realize the parallelization of this sequential MD code. The performance of the parallelized MD code was analyzed by using some performance analysis tools. The results of the test show that the computing size of this code increases sharply form 1 million atoms before parallelization to 20 million atoms after parallelization, and the wall clock during computing is reduced largely. Some hot-spots in this code are found and optimized by improved algorithm. The efficiency of parallel computing is 30% higher than that of before, and the calculation time is saved and larger scale calculation problems are solved. 展开更多
关键词 system analysis molecular dynamics parallel computing performance tuning OPENMP
下载PDF
Performance Characterization of Parallel Game-tree Search Application Crafty
3
作者 谭膺 罗克露 +1 位作者 陈玉荣 张益民 《Journal of Electronic Science and Technology of China》 2006年第2期155-160,共6页
Game-tree search plays an important role in the field of Artificial Intelligence (AI). In this paper, we characterize one parallel game-tree search workload in chess: the latest version of Crafty, a state of art pr... Game-tree search plays an important role in the field of Artificial Intelligence (AI). In this paper, we characterize one parallel game-tree search workload in chess: the latest version of Crafty, a state of art program, on two Intel Xeon shared-memory multiprocessor systems. Our analysis shows that Crafty is latency-sensitive and the hash-table and dynamic tree splitting used in Crafty cause large scalability penalties. They consume 35%-50% of the running time on the 4-way system. Furthermore, Crafty is not bandwidth-limited. 展开更多
关键词 performance characterization workload analysis parallel game-tree search computer chess crafty
下载PDF
A spatial decomposition approach for accelerating buffer analysis of vector data 被引量:1
4
作者 Li Xiaohua Guo Mingqiang Qi Xinhong 《High Technology Letters》 EI CAS 2020年第4期455-459,共5页
Parallel vector buffer analysis approaches can be classified into 2 types:algorithm-oriented parallel strategy and the data-oriented parallel strategy.These methods do not take its applicability on the existing geogra... Parallel vector buffer analysis approaches can be classified into 2 types:algorithm-oriented parallel strategy and the data-oriented parallel strategy.These methods do not take its applicability on the existing geographic information systems(GIS)platforms into consideration.In order to address the problem,a spatial decomposition approach for accelerating buffer analysis of vector data is proposed.The relationship between the number of vertices of each feature and the buffer analysis computing time is analyzed to generate computational intensity transformation functions(CITFs).Then,computational intensity grids(CIGs)of polyline and polygon are constructed based on the relative CITFs.Using the corresponding CIGs,a spatial decomposition method for parallel buffer analysis is developed.Based on the computational intensity of the features and the sub-domains generated in the decomposition,the features are averagely assigned within the sub-domains into parallel buffer analysis tasks for load balance.Compared with typical regular domain decomposition methods,the new approach accomplishes greater balanced decomposition of computational intensity for parallel buffer analysis and achieves near-linear speedups. 展开更多
关键词 high performance spatial computing buffer analysis parallel computing load balancing vector data
下载PDF
面向国产工业级CFD软件的并行性能测试分析
5
作者 戴未希 邱昊中 +4 位作者 丁越 汪青松 林拥真 张健 徐传福 《软件导刊》 2024年第10期8-14,共7页
NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowSta... NNW-FlowStar(简称FlowStar)是依托国家数值风洞工程研发的一款工业级通用非结构计算流体力学软件,包含了丰富的数值模型和复杂的功能模块,已广泛应用于航空航天和其他相关领域。随着高性能计算机体系结构的发展,在HPC系统上优化FlowStar等大型工业级CFD软件越发困难。鉴于此,依托典型HPC平台,针对FlowStar软件,从计算、通信、访存等角度对FlowStar性能特征进行了深入的测试和分析,可帮助研究人员更好地理解HPC系统上复杂CFD软件运行性能特征,为后续FlowStar软件的并行计算和性能优化提供参考。该研究对其他非结构CFD软件并行计算、性能优化以及HPC与CFD融合发展也具有借鉴意义。 展开更多
关键词 CFD并行计算 FlowStar 性能测试 性能分析
下载PDF
基于分层排队网络模型的MCU性能预测及优化研究 被引量:10
6
作者 边学工 胡瑞敏 +1 位作者 陈军 李德仁 《计算机学报》 EI CSCD 北大核心 2004年第2期209-215,共7页
针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该... 针对视频会议系统中的多点控制单元 (MCU)提出了一个基于分层排队网络模型的性能预测方法 .通过对分层排队网络模型进行扩展 ,建立了多点控制单元的分层排队模型 .设计了一个仿真程序对模型进行评价 ,仿真程序的输入即模型配置文件 .该方法可以较快地从多种设计方案或硬件平台中选择满足系统性能设计目标的软件或硬件配置 .仿真结果显示 ,选择双处理器配置和采用多线程技术 ,多点控制单元的接入容量提高了 5 0 % .最后 ,多点控制单元终端接入实验证明了该方法的有效性 . 展开更多
关键词 视频会议 多点控制单元 MCU 分层排队网络 接入容量
下载PDF
一种异步BSP模型及其程序优化技术 被引量:6
7
作者 刘方爱 刘志勇 乔香珍 《计算机学报》 EI CSCD 北大核心 2002年第4期373-380,共8页
基于 BSP模型 ,该文提出了异步计算模型 (CSA- BSP) .该模型更准确地描述了并行机的性能参数 ,引导用户编写高效率的并行程序 ;在 CSA- BSP模型下 ,两个进程异步执行的位置至多相差 p- 1个超步 ;基于程序的执行时间 ,作者分析了 BSP、A-... 基于 BSP模型 ,该文提出了异步计算模型 (CSA- BSP) .该模型更准确地描述了并行机的性能参数 ,引导用户编写高效率的并行程序 ;在 CSA- BSP模型下 ,两个进程异步执行的位置至多相差 p- 1个超步 ;基于程序的执行时间 ,作者分析了 BSP、A- BSP和 CSA- BSP程序的效率 ,得出 CSA - BSP程序的效率是最高的 .在曙光并行机上 ,用“红黑格法”和“矩阵乘法”进行了验证 ,和 BSP模型相比 ,这两个 CSA- BSP程序的效率分别提高 2 0 %和 37% ;同时 ,其进程执行时间的和最大可以降低 8% .因此 ,按照 CSA- BSP模型编程对于提高程序效率和改善系统的吞吐率 ,都有良好的效果 . 展开更多
关键词 并行计算模型 性能分析 异步BSP模型 程序优化 并行计算机
下载PDF
二维等离子体模拟粒子云网格方法的并行计算与性能分析 被引量:9
8
作者 莫则尧 许林宝 +1 位作者 张宝琳 沈隆钧 《计算物理》 CSCD 北大核心 1999年第5期496-504,共9页
在共享和 分布式存储两种 并行计算环境 下,组织了二 维等离 子体模 拟粒子 云网 格法程 序(2 D C I C) 的并 行计算。首先,通 过分 析串 行算法 和2 D C I C 程序 的单 机执 行特 征,设 计了 并 行算 法和 实现策略... 在共享和 分布式存储两种 并行计算环境 下,组织了二 维等离 子体模 拟粒子 云网 格法程 序(2 D C I C) 的并 行计算。首先,通 过分 析串 行算法 和2 D C I C 程序 的单 机执 行特 征,设 计了 并 行算 法和 实现策略;然后 ,基于共享存储和 消息传递两种 并行程序设 计方式, 在四种 共享和 分布 式存储 并行 机上,组织了具 体的并行计算,对 性能结果进行 了详细的比较分 析,获得了若干 重要结论。 展开更多
关键词 粒子云网格方法 并行计算 性能分析 等离子体
下载PDF
波分复用光传输网中波长路由算法的研究进展 被引量:6
9
作者 许胤龙 陈国良 万颖瑜 《计算机学报》 EI CSCD 北大核心 2003年第11期1409-1423,共15页
光纤正迅速成为主干通信网的标准传介媒质 .随着光学器件的发展 ,使得信号在传输过程中 ,除了在源、汇节点需要光电转换外 ,中间节点可保持光传输 ,这种通信网络叫光传送网 .光传送网中的波分复用技术是将整个光纤的带宽分成多个信道 ,... 光纤正迅速成为主干通信网的标准传介媒质 .随着光学器件的发展 ,使得信号在传输过程中 ,除了在源、汇节点需要光电转换外 ,中间节点可保持光传输 ,这种通信网络叫光传送网 .光传送网中的波分复用技术是将整个光纤的带宽分成多个信道 ,不同的信道可使用不同的波长来同时进行信息传输 ,从而增加了整个网络的带宽 .在光传送网中 ,实现一个通信请求需要建立一条通信路径 ,并为该通信路径所经过的每条链上分配一个波长 ,即所谓波长路由 .该文详细介绍了波分复用光传送网中波长路由算法的研究进展 ,内容包括波长分配算法、网络的信元阻塞率分析、容错和QoS波长路由、多播波长路由、最小化ADM数路由以及基于光或光电连接的并行机模型等 . 展开更多
关键词 通信网 波分复用光传输网 波长路由算法 波长分配算法 NP问题
下载PDF
弹道导弹六自由度仿真决策系统设计与研制 被引量:14
10
作者 邓方林 黄先祥 《系统仿真学报》 CAS CSCD 2004年第2期186-189,193,共5页
简要介绍了第二炮兵工程学院近十余年来在弹道导弹仿真系统开发、研制和应用方面的基本情况。重点介绍了弹道导弹六自由度一体化建模的理论和方法、分布式并行仿真计算机系统设计与研制、复杂连续系统仿真程序自动并行化系统的设计与实... 简要介绍了第二炮兵工程学院近十余年来在弹道导弹仿真系统开发、研制和应用方面的基本情况。重点介绍了弹道导弹六自由度一体化建模的理论和方法、分布式并行仿真计算机系统设计与研制、复杂连续系统仿真程序自动并行化系统的设计与实现,以及六自由度一体化建模与仿真在导弹全生命周期中的应用。 展开更多
关键词 弹道导弹 六自由度仿真决策系统 并行仿真计算机 自动并行化系统 性能分析
下载PDF
基于最大负载偏移率的并行负载平衡性能分析 被引量:5
11
作者 张理论 叶红 +1 位作者 吴建平 宋君强 《计算机研究与发展》 EI CSCD 北大核心 2010年第6期1125-1131,共7页
大规模并行应用的负载平衡能力对性能的影响很大,但难以度量.针对基于局部离散格式的(有限差分、有限元等)并行应用,通过分析并行计算通信比、并行规模、问题规模、格式复杂度与并行效率之间的数量关系,提出一个"最大负载偏移率&qu... 大规模并行应用的负载平衡能力对性能的影响很大,但难以度量.针对基于局部离散格式的(有限差分、有限元等)并行应用,通过分析并行计算通信比、并行规模、问题规模、格式复杂度与并行效率之间的数量关系,提出一个"最大负载偏移率"概念,即并行任务的最大负载相对平均负载的偏移量与平均负载之比,作为衡量负载平衡能力的性能指标,并导出了一个负载平衡性能量化模型.将POP全球海洋模式Benchmark程序作为计算实例,验证了负载平衡性能模型的有效性.该模型揭示出整体并行计算性能对负载平衡的依赖程度,特别是对大规模并行计算的情形,负载平衡程度对整体性能的影响随着并行规模的增大而愈加敏感. 展开更多
关键词 大规模数值并行计算 负载平衡 最大负载偏移率 评估模型 性能分析
下载PDF
若干并行计算模型上的N体问题求解算法 被引量:2
12
作者 苗乾坤 孙广中 +1 位作者 李涛 陈国良 《计算机工程与应用》 CSCD 北大核心 2007年第10期52-54,57,共4页
从在实际中广泛应用的N体问题入手,研究如何在几种实际的并行计算模型(PRAM、APRAM、BSP、LogP、NHBL)上设计具体的并行算法;给出了这些模型上的并行算法的设计模式,分析不同模型上算法的性能,比较各个模型上算法设计风格以及算法性能... 从在实际中广泛应用的N体问题入手,研究如何在几种实际的并行计算模型(PRAM、APRAM、BSP、LogP、NHBL)上设计具体的并行算法;给出了这些模型上的并行算法的设计模式,分析不同模型上算法的性能,比较各个模型上算法设计风格以及算法性能的差异,并对这些并行计算模型做一个综合的评价。 展开更多
关键词 并行计算模型 N体问题 并行算法 性能分析
下载PDF
基于R的并行统计计算 被引量:2
13
作者 宋磊 尹俊平 陈虹 《计算机科学》 CSCD 北大核心 2013年第3期95-99,共5页
随着统计分析中数据规模和复杂性的不断增加,高性能计算也开始在金融、经济和管理等统计计算主导的领域中发挥重要的作用。将对基于R的统计分析中并行计算技术的发展现状和最新进展做一个综述,重点从用户的角度考察R在不同体系结构计算... 随着统计分析中数据规模和复杂性的不断增加,高性能计算也开始在金融、经济和管理等统计计算主导的领域中发挥重要的作用。将对基于R的统计分析中并行计算技术的发展现状和最新进展做一个综述,重点从用户的角度考察R在不同体系结构计算平台上并行统计计算的实现。一个人造和真实应用的测试表明了其应用效果。 展开更多
关键词 R 统计分析 高性能计算 并行统计计算
下载PDF
并行计算模型 被引量:2
14
作者 乔香珍 刘方爱 《计算机科学》 CSCD 北大核心 2002年第7期1-5,共5页
1.引言 为提高系统性能,并行机系统设计者在体系结构上采用了多种新技术,然而目前并行软件(包括系统软件和应用软件)的研究和开发远远落后于体系结构的进步,即体系结构上的进步并未充分反映到并行软件的设计中.
关键词 并行计算模型 程序设计语言 程序设计 计算机
下载PDF
异构计算系统的三元模型与性能分析 被引量:3
15
作者 郑飞 陆鑫达 《上海交通大学学报》 EI CAS CSCD 北大核心 1997年第8期12-15,共4页
基于异构计算系统(HCS)体系结构的双层异构性,提出一种描述HCS体系结构的三元模型,其本质是对HCS各类性能模型作出划分.推导并分析HCS〈0,2*。
关键词 性能分析 三元模型 计算机网络 异构计算系统
下载PDF
压水堆燃料辐照性能多物理耦合并行分析程序开发 被引量:1
16
作者 韩智杰 何晓军 +4 位作者 明春 杨衍康 任帅 胡长军 杨文 《原子能科学技术》 EI CAS CSCD 北大核心 2021年第9期1606-1612,共7页
核燃料元件是反应堆的核心部件,其性能影响反应堆的安全性与经济性,利用燃料元件性能分析程序开展燃料堆内稳态辐照性能分析对于燃料设计及安全评价具有重要意义。通过开发燃料温度分布、变形计算、裂变气体释放及内压等模型,结合燃料... 核燃料元件是反应堆的核心部件,其性能影响反应堆的安全性与经济性,利用燃料元件性能分析程序开展燃料堆内稳态辐照性能分析对于燃料设计及安全评价具有重要意义。通过开发燃料温度分布、变形计算、裂变气体释放及内压等模型,结合燃料元件热工-力学多物理耦合计算分析耦合方案,基于先进并行计算方法构建了高性能并行化燃料性能分析程序Athena。利用典型商用压水堆核电站数据及同类程序计算结果进行了程序初步验证,结果表明Athena程序计算结果合理可靠。通过定义堆芯功率及热工水力边界条件,程序能够并行开展压水堆全堆芯燃料辐照性能分析,提高燃料辐照性能分析效率,是数值反应堆原型系统(CVR1.0)的重要组成。 展开更多
关键词 燃料元件 辐照性能分析 并行计算
下载PDF
数字地形分析并行计算技术研究 被引量:4
17
作者 汤国安 江岭 刘凯 《地理信息世界》 2015年第6期7-15,共9页
地随着对地观测技术的快速发展,数字高程模型(DEM)数据量呈现数量级增长,且DEM应用领域中流域模拟、减灾应急、区域生态等大型地学问题的不断涌现,传统的数字地形分析(DTA)串行计算模式已不能充分利用和发挥当前新型硬件构架(单机多核... 地随着对地观测技术的快速发展,数字高程模型(DEM)数据量呈现数量级增长,且DEM应用领域中流域模拟、减灾应急、区域生态等大型地学问题的不断涌现,传统的数字地形分析(DTA)串行计算模式已不能充分利用和发挥当前新型硬件构架(单机多核、多机多核、集群等)计算机资源的能力,更是难以满足实际应用的区域规模与计算时效需求。本文在数字地形分析并行计算研究现状的基础上,从数字地形分析粒度模型、数字地形分析数据与任务调度方法、数字地形分析并行可视化及数字地形分析算法并行策略等方面研究了数字地形分析并行计算关键理论与技术,进而研发了面向新型硬件构架的新一代GIS的数字地形分析并行算法库和中间件,并已集成到国产高性能GIS平台——Hi GIS中,对推动我国GIS的跨越式发展具有重要作用。 展开更多
关键词 数字地形分析 数字高程模型 并行计算 高性能 HiGIS
下载PDF
格子Boltzmann算法并行性能的系统分析 被引量:1
18
作者 张丹丹 赵鹏 钱跃竑 《计算机应用与软件》 CSCD 2009年第12期12-15,共4页
从处理器映射方式、域分解方式、通信开销、通信模式、可扩展性等方面对格子Boltzmann算法的并行性能作了全面系统的分析,并提出了对该类并行程序效率定量化分析的方法。经过相应的测试与分析,说明该方法对提高大规模并行计算的效率具... 从处理器映射方式、域分解方式、通信开销、通信模式、可扩展性等方面对格子Boltzmann算法的并行性能作了全面系统的分析,并提出了对该类并行程序效率定量化分析的方法。经过相应的测试与分析,说明该方法对提高大规模并行计算的效率具有指导作用。 展开更多
关键词 格子Boltzmann算法 并行计算 性能分析 定量分析
下载PDF
一种新型4自由度柔顺并联机构的设计和特性 被引量:4
19
作者 胡俊峰 徐贵阳 《机械科学与技术》 CSCD 北大核心 2014年第4期496-500,共5页
设计一种新型4自由度精密微动平台,并对其静态和动态特性进行分析。在传统4一RRUR并联机构的基础上,采用替换法设计具有解耦的柔顺并联机构。采用有限元软件ANSYS对机构进行刚度和运动学分析,分析结果表明所设计的平台具有解耦的x和... 设计一种新型4自由度精密微动平台,并对其静态和动态特性进行分析。在传统4一RRUR并联机构的基础上,采用替换法设计具有解耦的柔顺并联机构。采用有限元软件ANSYS对机构进行刚度和运动学分析,分析结果表明所设计的平台具有解耦的x和y方向平动,并能实现4自由度微动。对机构进行灵敏度分析表明该柔顺机构的各个方向的位移灵敏度约为6μm/μm,说明平台灵敏。对机构进行模态分析,从振型可以看出该机构能实现4自由度方向的运动,并分析了在有和无预应力两种情况下的固有频率,两者差值范围为17.2%~52.4%,说明预应力对机构的固有频率有较大影响。 展开更多
关键词 柔顺并联机构 动态特性 4 RRUR并联机构 静态特性
下载PDF
2008电网控制中心新技术综述 被引量:4
20
作者 傅书逷 《电网技术》 EI CSCD 北大核心 2009年第9期1-7,共7页
综述了2008年IEEE PES General Meeting和2008年CIGRE大电网会议主要内容。内容包括:CIGRE关于新一代能量管理系统/市场管理系统(energy management system/market management system,EMS/MMS)结构设计;EMS的公用数据接口标准化规范的... 综述了2008年IEEE PES General Meeting和2008年CIGRE大电网会议主要内容。内容包括:CIGRE关于新一代能量管理系统/市场管理系统(energy management system/market management system,EMS/MMS)结构设计;EMS的公用数据接口标准化规范的信息结构;高性能计算(并行计算)在控制中心的应用。这些内容可能代表了当代电力系统控制中心新技术的发展方向,可为我国从事EMS/MMS研究和实际工作的人员提供参考。 展开更多
关键词 EMS/MMS结构设计 高性能计算技术 并行处 分布式计算 状态估计 安全分析
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部