期刊文献+
共找到562篇文章
< 1 2 29 >
每页显示 20 50 100
流场计算程序并行化方法的研究 被引量:4
1
作者 康继昌 于跃 洪远麟 《航空学报》 EI CAS CSCD 北大核心 1993年第8期B427-B430,共4页
利用“流场分区”的方法把流场计算程序并行化,并成功地在Transputer并行计算机上运行,并行效率可达到80%。介绍了流场划分、并行编程以及提高并行效率的方法。
关键词 流场计算 程序并行 流场划分
下载PDF
顺序扫描实现程序并行化
2
作者 容红波 汤志忠 《软件学报》 EI CSCD 北大核心 2000年第12期1648-1655,共8页
提出扩展选择调度 ,统一处理循环和非循环代码 ,对它们不加区分但却分别产生软件流水和全局压缩的效果 ;程序并行化不需要分层简化 ,只要顺序扫描一遍即可 .该方法打破了有环调度和无环调度的界限 ,是一种基于一般图而不是路径或有向无... 提出扩展选择调度 ,统一处理循环和非循环代码 ,对它们不加区分但却分别产生软件流水和全局压缩的效果 ;程序并行化不需要分层简化 ,只要顺序扫描一遍即可 .该方法打破了有环调度和无环调度的界限 ,是一种基于一般图而不是路径或有向无环图的全局调度算法 .它从一个全新的角度来看待多重循环 ,通过恰当地计算可用集合和活变量集合 ,实现了多重循环的直接调度 。 展开更多
关键词 指令级并行 软件流水 程序并行
下载PDF
基于人工智能搜索和数据依赖分析的程序并行化 被引量:1
3
作者 王磊 曲卫平 李敬兆 《现代电子技术》 2013年第6期1-3,共3页
主要研究了自动并行化中的前端分析技术,引入了人工智能搜索方法,并且对其进行改进,实现了在评估函数支持下进行广度和深度搜索的方法。在前端分析的基础上探讨了传统的数据依赖分析方法,针对其不足之处出现的数组数据流分析技术,对其... 主要研究了自动并行化中的前端分析技术,引入了人工智能搜索方法,并且对其进行改进,实现了在评估函数支持下进行广度和深度搜索的方法。在前端分析的基础上探讨了传统的数据依赖分析方法,针对其不足之处出现的数组数据流分析技术,对其流程图算法进行描述,并且对终写树和写写树的思想加以实例说明。这一流程经过测试后可以很好地提高程序并行化的效率。 展开更多
关键词 程序并行 人工智能搜索 评估函数 数据依赖关系
下载PDF
一种SMP机群下程序并行化模式的设计与应用 被引量:1
4
作者 刘玮 《微电子学与计算机》 CSCD 北大核心 2005年第11期110-112,共3页
基于SMP机群并行编程环境下,提出了一种MPI+Pthread的程序并行化模式。使用这种并行模式实现了对生物DNA序列拼接程序Phrap的并行化。具体分析了Phrap程序的实现流程,对每一流程针对性的提出并行化方案。并且在曙光3000高性能计算机上... 基于SMP机群并行编程环境下,提出了一种MPI+Pthread的程序并行化模式。使用这种并行模式实现了对生物DNA序列拼接程序Phrap的并行化。具体分析了Phrap程序的实现流程,对每一流程针对性的提出并行化方案。并且在曙光3000高性能计算机上得到了实现,获得了较好的性能。 展开更多
关键词 程序并行 机群 MPI Pthread 序列拼接
下载PDF
顺序程序并行转换系统HZPARA的总体设计思想 被引量:2
5
作者 刘键 鄢勇 +4 位作者 谢卫 李胜利 庞丽萍 徐碚 任立 《计算机工程与应用》 CSCD 北大核心 1993年第3期55-59,共5页
本文从总体设计的观点全面地讨论了顺序程序并行转换系统HZPARA的总体设计思想。首先给出了一性能估计模型与加速比估计式,由此得出几点提高加速比的原则性意见,然后扼要而又校全面地介绍了HZPARA的总体设计思想,最后,在总结HZPARA运行... 本文从总体设计的观点全面地讨论了顺序程序并行转换系统HZPARA的总体设计思想。首先给出了一性能估计模型与加速比估计式,由此得出几点提高加速比的原则性意见,然后扼要而又校全面地介绍了HZPARA的总体设计思想,最后,在总结HZPARA运行经验的基础上,从并行程序设计的高度闸述了并行程序设计的发展方向。 展开更多
关键词 总体设计 顺序程序 并行程序设计
下载PDF
利用Petri网进行程序并行处理的方法
6
作者 焦健 翟源 +1 位作者 陈基禄 王保义 《华北电力大学学报(自然科学版)》 CAS 北大核心 2003年第4期62-65,共4页
针对传统的序标分析法在对程序进行并行处理过程中存在的不足,简述了Petri网的基本定义与特点,并将其引入程序并行处理的分析理论中。提出了一种新的程序并行处理的分析方法。该方法可以充分利用程序中的数据相关性,提高程序并行化程度... 针对传统的序标分析法在对程序进行并行处理过程中存在的不足,简述了Petri网的基本定义与特点,并将其引入程序并行处理的分析理论中。提出了一种新的程序并行处理的分析方法。该方法可以充分利用程序中的数据相关性,提高程序并行化程度。结合实例给出了该方法在实际中的应用。 展开更多
关键词 程序并行处理 PETRI网 数据相关性 计算机 串行程序
下载PDF
基于采样的并行程序性能测量分析工具研究
7
作者 胡家瑞 石京燕 郭超奇 《计算机工程与应用》 CSCD 北大核心 2024年第21期286-296,共11页
在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行... 在实际运行中,并行计算程序的性能常常在理论峰值与预期存在较大差距。使用性能分析工具进行程序调优是解决这一问题的高效手段。然而,程序员和开发者在使用性能分析工具时往往面临选择困难、配置和使用复杂等挑战。研究基于采样的并行程序性能分析工具有助于解决上述问题。相比于插桩技术,基于异步采样的性能工具可以更好地控制测量开销和测量数据大小。着重研究了三种典型的基于采样的性能分析工具:VTune Profiler、HPCToolkit和Nsight Systems,分析了其原理和功能,并且结合VASP等实际应用程序对工具的软硬件分析能力和并行编程分析能力进行了详细的探究和对比。根据这些工具在不同的应用场景下表现出的不同适用性和分析效果,提出了综合运用多种工具进行性能分析的方案,为开发者和程序员提供有益的参考。 展开更多
关键词 性能分析工具 异步采样 硬件性能计数器 并行程序 程序调优
下载PDF
蜕变测试研究进展及其在并行程序测试中的研究展望 被引量:2
8
作者 田甜 杨秀婷 +2 位作者 王安轼 于旭 巩敦卫 《软件学报》 EI CSCD 北大核心 2023年第1期130-149,共20页
在软件测试过程中,待测程序的预期输出是判断软件是否存在缺陷的重要因素.蜕变测试技术是利用被测软件的属性来检查程序输出,从而有效地解决程序预期输出难以构造的问题.近年来,蜕变测试在软件测试领域取得了蓬勃的发展,许多研究人员将... 在软件测试过程中,待测程序的预期输出是判断软件是否存在缺陷的重要因素.蜕变测试技术是利用被测软件的属性来检查程序输出,从而有效地解决程序预期输出难以构造的问题.近年来,蜕变测试在软件测试领域取得了蓬勃的发展,许多研究人员将蜕变测试技术进行优化,将其运用到各个领域,有效提高了软件质量.从原理、过程及其优化,应用领域3个方面,总结蜕变测试的研究工作,着重分析了近5年的研究进展,进一步展望了蜕变测试用于并行程序时,可能的研究主题.首先,介绍蜕变测试的基本概念和蜕变测试过程;接着,从蜕变关系、测试用例、测试执行过程以及蜕变测试工具4个角度,总结蜕变测试优化技术;然后,汇总了蜕变测试的应用领域;最后,基于已有研究成果,讨论蜕变测试在并行程序测试领域面临的问题,为蜕变技术在并行程序测试领域的研究提供可能的思路. 展开更多
关键词 蜕变测试 蜕变关系 原始测试用例 蜕变测试优化 并行程序 蜕变测试应用
下载PDF
并行程序设计课程全过程多途径思政建设方案
9
作者 熊智 蔡玲如 洪秀秀 《高教学刊》 2023年第35期181-184,共4页
并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案... 并行计算的应用领域越来越广泛,众多计算机类专业都将并行程序设计作为必修课程。依据ACM/IEEE计算课程体系规范,结合国产超级计算机的发展,该文梳理该课程的教学内容和包括思政目标在内的课程目标,进而设计全过程多途径的总体思政方案。思政元素涵盖所有5个思政目标,且较好地分布在全部5个知识单元中,教学方法和工具均根据各个思政元素的特点量身选择或设计。该文最后论述两个课程思政设计案例供相关课程参考,包括通过引导加速比上限的讨论强调辩证地理解相关规律,以及借助互斥锁的线上实践培养严谨求实的治学态度。 展开更多
关键词 并行程序设计 课程思政 课程目标 加速比 互斥锁
下载PDF
程序自动并行化系统 被引量:34
10
作者 朱传琪 臧斌宇 陈彤 《软件学报》 EI CSCD 北大核心 1996年第3期180-186,共7页
有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术... 有效的自动并行化系统能帮助用户充分地利用并行计算机资源.本文介绍了自动并行化的历史及现状,并着重介绍了作者所开发的自动并行化系统AFT(automaticFortrantransformer)及其特色和所用的关键技术.测试结果表明AFT系统在功能上已超越了传统的自动并行化系统. 展开更多
关键词 程序并行 并行计算机 自动并行化系统
下载PDF
SPMD型程序的自动并行化 被引量:1
11
作者 冯百明 肖骊 +1 位作者 况正谦 康继昌 《西北师范大学学报(自然科学版)》 CAS 1999年第2期10-14,共5页
介绍了基于共享变量的SPMD型程序自动并行化模型,给出了从串行源程序生成以EP860并行计算机系统为运行环境的并行程序源程序的过程,并详细讨论了一些关键技术和实现方法.
关键词 自动并行 程序并行 SPMD型程序 程序自动化
下载PDF
光线跟踪程序PBRT的并行化及性能优化
12
作者 付雄 王汝传 《计算机技术与发展》 2008年第10期5-8,12,共5页
随着多核处理器的出现和迅速发展,将以前经典的串行程序并行化,更好地利用多核体系结构提高其性能,成为了当前多核处理器应用研究值得关注的一个问题。以并行化光线跟踪程序PBRT为例,深入研究了串行程序并行化中的并行模型的设计与实现... 随着多核处理器的出现和迅速发展,将以前经典的串行程序并行化,更好地利用多核体系结构提高其性能,成为了当前多核处理器应用研究值得关注的一个问题。以并行化光线跟踪程序PBRT为例,深入研究了串行程序并行化中的并行模型的设计与实现、正确性验证,以及并行化后的性能优化等问题。优化后的并行PBRT取得了4个线程时近3.5倍的加速比,证明了所给出的并行化及性能优化有良好的效果。 展开更多
关键词 多核体系结构 程序并行 光线跟踪
下载PDF
PVM并行程序验证系统的原理与实现 被引量:6
13
作者 张兆庆 蒋昌俊 +2 位作者 乔如良 叶志宝 周杰 《计算机学报》 EI CSCD 北大核心 1999年第4期409-414,共6页
本文主要介绍PVM并行程序验证系统的基本原理和实现技术.首先,我们扼要分析PVM程序的构成与特点;然后阐述验证系统的理论模型和验证算法;最后,讨论开发过程中的若干关键技术.本系统的研制可为并行程序的自动转换和分析验证提供一... 本文主要介绍PVM并行程序验证系统的基本原理和实现技术.首先,我们扼要分析PVM程序的构成与特点;然后阐述验证系统的理论模型和验证算法;最后,讨论开发过程中的若干关键技术.本系统的研制可为并行程序的自动转换和分析验证提供一个可视化的运行环境. 展开更多
关键词 PVM程序 并行程序验证 并行程序设计
下载PDF
针对子程序结构的线程级推测并行性分析 被引量:6
14
作者 梁博 安虹 +1 位作者 王莉 王耀彬 《小型微型计算机系统》 CSCD 北大核心 2009年第2期230-235,共6页
线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程... 线程级推测技术为开发更多的线程级并行性,充分利用多核加速传统上难以手工或自动并行化的串行程序提供可行的技术途径.然而,这种技术的性能严重地依赖于线程划分方案.有研究表明,仅推测执行循环所产生的并行性是不够的,但推测执行子程序结构比循环结构要难.本文提出寻找适于推测并行执行的子程序结构的基本判定依据;通过运行由Simplescalar工具集改造得到的动态剖析工具ProRV、ProFun和SPEC CPU2000基准测试程序,我们对子程序结构线程化推测执行的适合性进行详细分析,给出具有指导意义的实验分析方法和实验数据.我们发现:1无返回值的子程序结构占据程序整体执行时间的大约40%;返回稀疏整型的子程序结构占据了程序整体执行时间的大约10%,对其返回值的预测成功率在70%左右.对于其他返回值类型的子程序结构,由于对其返回值的预测成功率过低,我们认为不适合作为线程划分的对象.2简单的last-value的值预测方案对于返回值的预测是简单而且足够有效的.3访存数据依赖普遍存在于子程序与其后继代码之间,显式同步机制对于针对子程序结构的线程级推测是必要的. 展开更多
关键词 线程级推测 串行程序自动并行 程序结构 动态剖析 数据依赖分析
下载PDF
Linux机群系统并行程序调试器的设计与实现 被引量:10
15
作者 刘 建 余宏亮 +1 位作者 沈美明 郑纬民 《计算机工程》 CAS CSCD 北大核心 2002年第4期7-9,82,共4页
介绍了在基于Linux的机群系统中,并行程序调试工具XBUSTER的设计与实现,包括调试器的基本结构及在实现时所涉及的一些关键技术。XBUSTER具有一般调试器的基本调试功能,可以调试用C/Fortran语言编写的PVM或MPI,对并行程序的各个进程能够... 介绍了在基于Linux的机群系统中,并行程序调试工具XBUSTER的设计与实现,包括调试器的基本结构及在实现时所涉及的一些关键技术。XBUSTER具有一般调试器的基本调试功能,可以调试用C/Fortran语言编写的PVM或MPI,对并行程序的各个进程能够单独或同时进行调试,并且能够实现进程的动态调试。该系统已在运行Linux系统的清华集群计算机系统上运行,具有较好的实用性。 展开更多
关键词 机群系统 PVM MPI LINUX 并行程序调试器 软件开发
下载PDF
一种基于Message Passing的通信技术和并行程序设计方法 被引量:5
16
作者 温钰洪 王鼎兴 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 1996年第3期211-216,共6页
分布式并行计算机系统中,由于没有处理机间的共享内存以支持数据通信,因而需要以Message-Passing的方式来实现处理机间的数据共享。本文介绍一种基于Message-Passing的通信技术以及以此为基础的并行程... 分布式并行计算机系统中,由于没有处理机间的共享内存以支持数据通信,因而需要以Message-Passing的方式来实现处理机间的数据共享。本文介绍一种基于Message-Passing的通信技术以及以此为基础的并行程序设计方法。 展开更多
关键词 并行计算机 通信 并行程序设计
下载PDF
面向MPP Fortran的程序自动并行化初探 被引量:3
17
作者 郭克榕 唐新春 《国防科技大学学报》 EI CAS CSCD 北大核心 1996年第1期92-97,共6页
MPPFortran是由Cray公司推出的一种较有代表性的数据并行语言,本文首先介绍了MPPFortran的主要特点,然后,以该语言为例,对面向MPP系统程序自动并行化的主要内容进行了初步的探讨。
关键词 程序自动并行 FORTRAN 数据并行语言 MPP系统
下载PDF
一种基于检查点的并行程序调试器的设计与实现 被引量:6
18
作者 刘建 汪东升 +1 位作者 沈美明 郑纬民 《计算机研究与发展》 EI CSCD 北大核心 2002年第12期1580-1586,共7页
为支持大规模长时间运行并行程序的调试 ,有必要将检查点机制引入到并行程序调试器中 .检查点设置与卷回应用中需要解决中途消息、孤儿消息和多米诺效应、活锁 4个问题 ;并行程序调试中需要解决不确定性问题 .提出的基于状态冻结的确定... 为支持大规模长时间运行并行程序的调试 ,有必要将检查点机制引入到并行程序调试器中 .检查点设置与卷回应用中需要解决中途消息、孤儿消息和多米诺效应、活锁 4个问题 ;并行程序调试中需要解决不确定性问题 .提出的基于状态冻结的确定性检查点设置方法 ,可以避免检查点应用中孤儿消息和多米诺效应、活锁 3个问题 ,通过消息记录的方法处理中途消息问题 ;采用记录 /重放方法解决并行调试中的不确定性问题 .基于状态冻结的确定性检查点设置方法 ,有效地解决了并行程序调试器和检查点结合时产生的诸多问题 .该方法具有结构清晰、易于实现的优点 .基于此技术 ,设计并实现了一个并行调试工具—— DENNET. 展开更多
关键词 检查点 并行程序调试器 设计 消息传递
下载PDF
基于Win32平台上的PVM并行程序设计 被引量:4
19
作者 张信一 李代平 章文 《计算机应用研究》 CSCD 北大核心 2004年第5期102-104,108,共4页
着重介绍了在PVM平台上进行并行程序设计的方法,包括如何构造基于Win32平台上的PVM运行环境,进行任务和数据划分,并提出了一个Master/Slave结构的并行程序设计模式;最后给出一个并行计算在物探处理应用的例子,来对并行程序的设计方法进... 着重介绍了在PVM平台上进行并行程序设计的方法,包括如何构造基于Win32平台上的PVM运行环境,进行任务和数据划分,并提出了一个Master/Slave结构的并行程序设计模式;最后给出一个并行计算在物探处理应用的例子,来对并行程序的设计方法进行概括性的说明。 展开更多
关键词 并行程序 PVM 并行计算
下载PDF
3维全电磁粒子模拟大规模并行程序NEPTUNE 被引量:12
20
作者 董烨 陈军 +10 位作者 杨温渊 赵强 夏芳 肖丽 马彦 廖丽 孙会芳 董志伟 周海京 陈虹 莫则尧 《强激光与粒子束》 EI CAS CSCD 北大核心 2011年第6期1607-1615,共9页
介绍了自主编制的3维全电磁粒子模拟大规模并行程序NEPTUNE的基本情况。该程序具备对多种典型高功率微波源器件的3维模拟能力,可以在数百乃至上千个CPU上稳定运行。该程序使用时域有限差分(FDTD)方法更新计算电磁场,采用Buneman-Boris... 介绍了自主编制的3维全电磁粒子模拟大规模并行程序NEPTUNE的基本情况。该程序具备对多种典型高功率微波源器件的3维模拟能力,可以在数百乃至上千个CPU上稳定运行。该程序使用时域有限差分(FDTD)方法更新计算电磁场,采用Buneman-Boris算法更新粒子运动状态,运用质点网格法(PIC)处理粒子与电磁场的耦合关系,最后利用Boris方法求解泊松方程对电场散度进行修正,以确保计算精度。该程序初步具备复杂几何结构建模能力,可以对典型高功率微波器件中常见的一些复杂结构,如任意边界形状的轴对称几何体、正交投影面几何体,慢波结构、耦合孔洞、金属线和曲面薄膜等进行几何建模。该程序将理想导体边界、外加波边界、粒子发射与吸收边界及完全匹配层边界等物理边界应用于几何边界上,实现了数值计算的封闭求解。最后以算例的形式,介绍了使用NEPTUNE程序对磁绝缘线振荡器、相对论返波管、虚阴极振荡器及相对论速调管等典型高功率微波源器件进行的模拟计算情况,验证了模拟计算结果的可靠性,同时给出了并行效率的分布情况。 展开更多
关键词 高功率微波 3维全电磁粒子模拟 大规模并行程序 NEPTUNE程序
下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部