期刊文献+
共找到205篇文章
< 1 2 11 >
每页显示 20 50 100
基于混合有限元法的油浸式变压器稳态流-热耦合场并行计算方法
1
作者 刘刚 靳立鹏 +2 位作者 胡万君 刘云鹏 武卫革 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期2259-2269,共11页
针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic proces... 针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic processing unit,GPU)实现流体场的并行计算,针对单分区分匝模型对比分析了不同GPU卡在不同网格条件下的并行计算效率,分析结果表明数据规模越大,GPU卡流处理器越多并行效果越好。其次,基于Intel MKL(Intel math kernel library)函数库结合共享存储并行编程(open multi-processing,OpenMP)实现了2维温度场的并行计算,并对比分析了不同网格数量对并行效率的影响。最后,在此基础上提出了根据不同仿真条件的混合并行计算方法,并应用到大型油浸式变压器绕组模型的2维温升热点分析中。结果表明,相较于串行程序,混合有限元并行计算方法的加速比达到了69.5,实验测试结果进一步验证了并行计算结果的准确性,研究成果为大型油浸式变压器流-热耦合问题的快速计算奠定了基础。 展开更多
关键词 变压器绕组 混合有限元 热点 并行计算 加速比
下载PDF
Parallel finite element modeling of earthquake ground response and liquefaction 被引量:1
2
作者 陆金池 彭军 +2 位作者 Ahmed Elgamal 杨朝晖 Kincho H.Law 《Earthquake Engineering and Engineering Vibration》 SCIE EI CSCD 2004年第1期23-37,共15页
Parallel computing is a promising approach to alleviate the computational demand in conducting large-scale finite element analyses.This paper presents a numerical modeling approach for earthquake ground response and l... Parallel computing is a promising approach to alleviate the computational demand in conducting large-scale finite element analyses.This paper presents a numerical modeling approach for earthquake ground response and liquefaction using the parallel nonlinear finite element program,ParCYCLIC,designed for distributed-memory message-passing parallel computer systems.In ParCYCLIC,finite elements are employed within an incremental plasticity,coupled solid-fluid formulation,A constitutive model calibrated by physical tests represents the salient characteristics of sand liquefaction and associated accumulation of shear deformations.Key elements of the computational strategy employed in ParCYCLIC include the development of a parallel sparse direct solver,the deployment of an automatic domain decomposer,and the use of the Multilevel Nested Dissection algorithm for ordering of the finite element nodes.Simulation results of centrifuge test models using ParCYCLIC are presented.Performance results from grid models and geotechnical simulations show that ParCYCLIC is efficiently scalable to a large number of processors. 展开更多
关键词 parallel finite element domain decomposition LIQUEFACTION parallel speedup EARTHQUAKE site amplification
下载PDF
SPEEDUP指标的适用性分析
3
作者 刘德才 王鼎兴 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 1995年第5期52-56,共5页
长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?... 长期以来,speeduP一直被视为衡量并行处理性能的主要指标之一。不论是并行计算机系统的设计者,还是并行算法的设计者,均非常重视speedup指标。那么,speedup能否像人们想象的那样正确地描述并行处理的性能呢?迄今为止,人们对这一问题尚缺乏认识。本文从speedup的定义出发,结合实例,全面分析了speedup度量并行处理的性能所存在的问题以及可能导致的错误,还讨论了speedup的适应条件。 展开更多
关键词 并行处理 性能评价 并行计算机
下载PDF
线云隐私攻击算法的并行加速研究
4
作者 郭宸良 阎少宏 宗晨琪 《计算机工程与科学》 CSCD 北大核心 2024年第4期615-625,共11页
线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式... 线云定位方法能保护场景隐私,但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云,但其计算效率较低。针对该问题,提出了一种并行优化算法,并对其运行时间和加速比进行了分析。具体来说,分别采用SPMD模式和流水线模式实现了CPU多核并行和GPGPU并行。然后,进一步结合数据并行模式实现了异构计算,以达到最高的并行度。实验结果表明,并行优化算法加速比最大为15.11,最小为8.20;相比原算法,并行优化算法的还原点云相对误差控制在原误差的0.4%以内,保证了算法的精度。该研究对线云隐私攻击算法以及其他密度估计问题、不同场景下的线云隐私保护算法等有重要意义和参考价值。 展开更多
关键词 线云隐私安全 异构计算 并行化处理 隐私攻击算法 加速比
下载PDF
PARALLEL COMPUTATION OF SUPER-SONIC BLUNT BODY VISCOUS FLOWFIELDS IN PVM
5
作者 Yang Xiaohui, Wang Zhenghua, Wang Chengyao (Dept. 1, National University of Defense Technology, Changsha, 410073, China) 《Chinese Journal of Aeronautics》 SCIE EI CAS CSCD 1997年第4期26-30,共5页
Supersonic viscous flows past blunt bodies is calculated with TVD difference scheme and implicit Lower Upper Symmetric Gauss Seidel (LU SGS) method, and parallel programming designing software platform PVM is used b... Supersonic viscous flows past blunt bodies is calculated with TVD difference scheme and implicit Lower Upper Symmetric Gauss Seidel (LU SGS) method, and parallel programming designing software platform PVM is used based on message passing to distribute a large task according to some patching strategies to a large number of processors in the network. These processors accomplish this large task together. The marked improvement of computational efficiency in networks, especially in MPP system, demonstrates the potential vitality of CFD in engineering design. 展开更多
关键词 computational fluid dynamics supersonic speed blunt bodies viscous flow PVM patching strategy parallel mode speedup networks
下载PDF
The Model of Asynchronous Parallel Nonlinear Multisplitting Method on Shared Memory System
6
作者 Yang Cao Qingyang Li(Dept. of Applied Mathematics, Tsinghua Universitg Beijing 100084, P.R. of China) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期483-489,共7页
Nonlinear multisplitting method is known as parallel iterative methods for solving a large-scale system of nonlinear equations F(x) = 0. We extend the idea of nonlinear multisplitting and consider a new model ill whic... Nonlinear multisplitting method is known as parallel iterative methods for solving a large-scale system of nonlinear equations F(x) = 0. We extend the idea of nonlinear multisplitting and consider a new model ill which the iteration is executed asynchronously: Each processor calculate the solution of an individual nonlinear system belong to its nonlinear multisplitting and can update the global approximation residing in the shared memory at any time. A local convergence analysis of this model is presented. Finally, we give a uumerical example which shows a 'strange' property that speedup Sp > p and efficiency Ep > 1. 展开更多
关键词 Asynchronous parallel Nonlinear Multisplitting Method Shared Memory processors Efficiency. speedup.
下载PDF
大规模GNSS网多进程并行解算研究
7
作者 王建伟 程传录 +4 位作者 赵辉 冯在梅 刘晓云 田婕 马润霞 《大地测量与地球动力学》 CSCD 北大核心 2023年第2期148-152,共5页
针对大规模GNSS网常规数据处理时效性差、效率低的问题,基于GAMIT/GLOBK软件,利用进程池技术从多时段与多子网2个维度分别设计共享内存模型数据并行算法,并融合实现大规模GNSS网在时间域和空间域上的时空一体化双层并行解决方案。该方... 针对大规模GNSS网常规数据处理时效性差、效率低的问题,基于GAMIT/GLOBK软件,利用进程池技术从多时段与多子网2个维度分别设计共享内存模型数据并行算法,并融合实现大规模GNSS网在时间域和空间域上的时空一体化双层并行解决方案。该方案可突破软件传统串行处理GNSS数据时效性差、多核计算资源利用率低的限制,在测试环境下最大加速比高达19.39,可充分挖掘计算机算力,大幅提升大规模GNSS网数据处理的时效性。 展开更多
关键词 大规模GNSS网 加速比 进程池 并行计算
下载PDF
并行程序设计课程全过程多途径思政建设方案
8
作者 熊智 蔡玲如 洪秀秀 《高教学刊》 2023年第35期181-184,共4页
并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案... 并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案。思政元素涵盖所有5个思政目标,且较好地分布在全部5个知识单元中,教学方法和工具均根据各个思政元素的特点量身选择或设计。该文最后论述两个课程思政设计案例供相关课程参考,包括通过引导加速比上限的讨论强调辩证地理解相关规律,以及借助互斥锁的线上实践培养严谨求实的治学态度。 展开更多
关键词 并行程序设计 课程思政 课程目标 加速比 互斥锁
下载PDF
一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法
9
作者 陈瑞强 张瓯 +1 位作者 池晓蘅 涂清松 《中国科技纵横》 2023年第21期21-23,62,共4页
本文介绍一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法,主要包含一个管理模块和若干个执行模块,通过成对的生产者-消费者管道连接,可以部署在多核心处理器并行执行。建立全波形激光雷达波实验平台,采集回波数据... 本文介绍一种基于生产者-消费者模型的全波形激光雷达回波波形数据并行处理方法,主要包含一个管理模块和若干个执行模块,通过成对的生产者-消费者管道连接,可以部署在多核心处理器并行执行。建立全波形激光雷达波实验平台,采集回波数据集验证并行处理方法的性能。实验结果表明,与串行处理方法相比,当并行处理方法包含两个执行模块时,处理时间加速比为1.8;当并行处理方法包含3个执行模块时,处理时间加速比为2.4。 展开更多
关键词 全波形激光雷达 波形数据 并行处理 生产者-消费者模型 处理时间加速比
下载PDF
关于并行计算系统中加速比的研究与分析 被引量:19
10
作者 谢超 麦联叨 +1 位作者 都志辉 马群生 《计算机工程与应用》 CSCD 北大核心 2003年第26期66-68,共3页
着眼于并行计算中的加速比,重点讨论了几种通用的并行系统中的加速比模型,并且就它们各自的优点和不足进行了分析和说明,确立了它们之间的内在联系,最后结合并行系统中存在的其他因素,提出了未来加速比模型需要考虑的问题。
关键词 并行处理 加速比 效率 负载
下载PDF
MC程序并行设计及提高加速比措施 被引量:7
11
作者 邓力 谢仲生 +1 位作者 黄正丰 许海燕 《计算物理》 CSCD 北大核心 2001年第2期177-180,共4页
MC程序的并行设计涉及算法及模块划分 ,它直接关系到并行加速效率的高低 .中子 γ耦合输运蒙特卡罗程序MCNP经过并行改造 ,实现了PVM和MPI两种系统下的并行化 .由于作了模块化设计 ,并行加速效率极佳 .PVM版和MPI版并行程序在多个处理... MC程序的并行设计涉及算法及模块划分 ,它直接关系到并行加速效率的高低 .中子 γ耦合输运蒙特卡罗程序MCNP经过并行改造 ,实现了PVM和MPI两种系统下的并行化 .由于作了模块化设计 ,并行加速效率极佳 .PVM版和MPI版并行程序在多个处理器下的加速比均呈线性增长 .相比PVM ,MPI的适应性更强 ,多数情况下其效率高于PVM ,并行MCNP程序的计算结果可靠 .MPI并行程序在 16、32和 6 4个处理器上的并行效率分别达到了 99%、97%和 89% 展开更多
关键词 MPI PVM 并行加速比 MONTE Carlo 并行设计 蒙特卡罗法 程序设计
下载PDF
波形松弛法的电力系统暂态稳定性并行仿真计算 被引量:7
12
作者 林济铿 李杨春 +3 位作者 罗萍萍 叶剑华 郑卫洪 王海林 《电工技术学报》 EI CSCD 北大核心 2006年第12期47-53,65,共8页
仿真计算是进行电力系统暂态稳定性分析迄今为止最可靠的方法。本文提出一个基于波形松弛的电力系统暂态稳定并行仿真新方法。首先按照系统各部分的地理分区将其划分为多个子系统,将通过联络线及边界节点互联的子系统进行等值,从而得出... 仿真计算是进行电力系统暂态稳定性分析迄今为止最可靠的方法。本文提出一个基于波形松弛的电力系统暂态稳定并行仿真新方法。首先按照系统各部分的地理分区将其划分为多个子系统,将通过联络线及边界节点互联的子系统进行等值,从而得出相邻子系统对本子系统的影响;进一步将移置到边界处的子系统等值电流作为子系统间波形交互信息,实现互联子系统之间的解偶和并行松弛求解。在PC集群上的计算结果表明,该算法有比较高的并行加速比和计算效率,在无任何加速措施的情况下,对于较大规模的系统已达到了在线实时计算速度。 展开更多
关键词 波形松弛 电力系统 暂态稳定分析 并行仿真 并行加速比 计算效率
下载PDF
多尺度量子谐振子优化算法的并行性研究 被引量:5
13
作者 黄焱 王鹏 +1 位作者 程琨 刘峰 《通信学报》 EI CSCD 北大核心 2016年第9期68-74,共7页
多尺度量子谐振子优化算法(MQHOA,multi-scale quantum harmonic oscillator algorithm)是一种利用量子谐振子波函数构造的新的智能算法,采样运算是MQHOA算法的基本运算单元和主要运算量,采样运算的独立性赋予MQHOA算法内在并行性。通过... 多尺度量子谐振子优化算法(MQHOA,multi-scale quantum harmonic oscillator algorithm)是一种利用量子谐振子波函数构造的新的智能算法,采样运算是MQHOA算法的基本运算单元和主要运算量,采样运算的独立性赋予MQHOA算法内在并行性。通过对MQHOA算法群体参数和采样参数进行实验,确定算法的并行粒度并提出多尺度量子谐振子并行算法(MQHOA-P,multi-scale quantum harmonic oscillator parallel algorithm)。在由10个计算节点构成的集群上对6种标准测试函数进行实验,通过改变计算节点数、函数维数和采样参数测试MQHOA-P算法的加速比,实验结果表明,MQHOA-P算法具有良好的加速比和扩展性,可以在大规模集群中部署、运行。 展开更多
关键词 多尺度量子谐振子优化算法 算法并行性 加速比 并行粒度 函数优化
下载PDF
基于MPI技术的AREM模式并行开发及试验 被引量:5
14
作者 普业 王斌 +2 位作者 徐幼平 程锐 成巍 《气候与环境研究》 CSCD 北大核心 2008年第5期675-680,共6页
应用消息传递接口函数库(MPI)并行程序设计技术开发了中尺度暴雨数值预报模式AREM(Ad-vanced Regional Eta-coordinate Model)的并行版本,并在3种计算机系统平台下进行了加速比测试,结果显示出较高的并行效率和较好的可扩展性。建立并... 应用消息传递接口函数库(MPI)并行程序设计技术开发了中尺度暴雨数值预报模式AREM(Ad-vanced Regional Eta-coordinate Model)的并行版本,并在3种计算机系统平台下进行了加速比测试,结果显示出较高的并行效率和较好的可扩展性。建立并行版本后,模式高分辨率版本能够满足时效性要求。通过采用并行模式的高低分辨率版本对一个暴雨个例进行模拟表明,高分辨并行版本的模拟结果与观测更为接近,并具有较好的预报时效性。 展开更多
关键词 MPI 并行计算 AREM模式 加速比 并行效率
下载PDF
基于CUDA的并行AES算法的实现和加速效率探索 被引量:4
15
作者 费雄伟 李肯立 +1 位作者 阳王东 杜家宜 《计算机科学》 CSCD 北大核心 2015年第1期59-62,74,共5页
网络应用服务(尤其是电子银行和电子商务)需要数据加密提供安全通信.很多应用服务器面临着执行大量计算稠密的加密挑战.CUDA(统一计算架构)是在GPU进行并行和通用计算的平台,能够利用现有显卡资源,以低成本的方式提升加密性能.在Nvi... 网络应用服务(尤其是电子银行和电子商务)需要数据加密提供安全通信.很多应用服务器面临着执行大量计算稠密的加密挑战.CUDA(统一计算架构)是在GPU进行并行和通用计算的平台,能够利用现有显卡资源,以低成本的方式提升加密性能.在Nvidia GeForce G210显卡上实现CUDA的AES(高级加密标准)并行算法并且在AMD Athlon 7850上实现串行AES算法.实现的AES并行算法避免了同一线程块的线程同步和通信,提升了GPU的加速性能,加速比要比Manavski的AES-128并行算法提升2.66~3.34倍.在大数据量(至32MB)加密环境下探索AES并行算法的性能模型,并首次从加速效率角度分析加速性能.该并行AES算法在16核的GPU上能最高达到15.83倍的加速比和99.898%的加速效率. 展开更多
关键词 统一计算架构 高级加密标准 并行 加速比 加速效率
下载PDF
朴素并行LDA 被引量:8
16
作者 高阳 严建峰 刘晓升 《计算机科学》 CSCD 北大核心 2015年第6期243-246,共4页
并行潜在狄利克雷分配(LDA)主题模型在计算与通信两方面的时间消耗较大,导致训练模型的时间过长,因而无法被广泛应用。提出朴素并行LDA算法,针对计算和通信分别提出改进方法。一方面通过加入单词影响因子以及设置阈值的方法来降低文本... 并行潜在狄利克雷分配(LDA)主题模型在计算与通信两方面的时间消耗较大,导致训练模型的时间过长,因而无法被广泛应用。提出朴素并行LDA算法,针对计算和通信分别提出改进方法。一方面通过加入单词影响因子以及设置阈值的方法来降低文本训练的粒度,另一方面通过降低通信频率来减少通信时间。实验结果表明,优化后的并行LDA在保证精度损失为1%的前提下,将训练速度提高了36%,有效提高了并行的加速比。 展开更多
关键词 潜在狄利克雷分配 并行 加速优化
下载PDF
CPU-GPU并行矩阵乘法的实现与性能分析 被引量:11
17
作者 程豪 张云泉 +1 位作者 张先轶 李玉成 《计算机工程》 CAS CSCD 北大核心 2010年第13期24-26,29,共4页
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过... 实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%。通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨了影响混合DGEMM性能的各种因素。 展开更多
关键词 混合并行 GPU技术 DGEMM程序 加速比
下载PDF
OpenMP在MM5中尺度模式中的应用试验 被引量:5
18
作者 张昕 季仲贞 王斌 《气候与环境研究》 CSCD 2001年第1期84-90,共7页
简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行... 简要介绍了一种新的并行编程标准——OpenMP,通过与其他几种并行编程标准的比较,了解其优越与不足之处。详细介绍了 OpenMP在 PSU/ NCAR的中尺度模式MM5中的运用。分别用 OpenMP并行方式与 MPI并行方式在 SGI Origin 2000上进行了并行效能测试。测试结果表明: OpenMP是一种简单、高效的并行编程标准,非常适合于气象科研与业务领域应用。 展开更多
关键词 OPENMP 并行计算 中尺度模式 并行加速比 并行效率 气象 数值大气预报
下载PDF
大规模问题数据并行性能的分析 被引量:14
19
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
下载PDF
多波前并行处理的弹塑性子结构并行有限元 被引量:8
20
作者 余天堂 姜弘道 《计算力学学报》 CAS CSCD 1999年第4期493-496,共4页
研究一种基于PVM 的弹塑性子结构并行有限元法。利用多个波前,对各子结构并行地进行静凝聚。再采用预条件共轭梯度法(PCG)并行求解界面方程。算例表明该方法能获得较好的并行加速比,同时也能有效地节省内存量。
关键词 PVM 弹塑性 子结构 并行有限元 多波前
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部