期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
异构并行的高阶散射特征线方法及其在临界实验装置模拟中的应用
1
作者 邹航 陈莹 +5 位作者 张乾 曹巍 张晋超 梁亮 宋佩涛 刘杰 《原子能科学技术》 EI CSCD 北大核心 2024年第1期135-143,共9页
在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并... 在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并行。为确认程序对临界实验装置的物理计算精度,本文选取LCT011临界实验基准进行堆芯物理计算,并与蒙特卡罗程序进行对比验证。各向异性源使得计算量与内存消耗均有显著增加,给异构系统带来较大的显存负担,因此本文进而对高阶散射输运求解器进行性能分析。数值结果表明:在高阶散射计算条件下,程序可达到蒙特卡罗程序的同等精度,且具有较高的计算效率。 展开更多
关键词 特征线方法 高阶散射 临界实验装置 异构并行
下载PDF
并行处理方法在液体火箭发动机三维数值模拟中的应用 被引量:2
2
作者 赵文涛 王正华 +1 位作者 刘仲 杨晓东 《国防科技大学学报》 EI CAS CSCD 1999年第4期9-11,共3页
本文采用预测校正的 M ac Corm ack 格式对液体火箭发动机内的复杂三维流场进行了数值模拟,并在 P V M 的微机网络机群环境下实现了并行计算。从测试结果可以看出, 并行与分布处理技术在液体火箭发动机复杂内流场的数值... 本文采用预测校正的 M ac Corm ack 格式对液体火箭发动机内的复杂三维流场进行了数值模拟,并在 P V M 的微机网络机群环境下实现了并行计算。从测试结果可以看出, 并行与分布处理技术在液体火箭发动机复杂内流场的数值模拟方面能发挥重要作用。 展开更多
关键词 并行处理 PVM 三维数值模拟 火箭发动机
下载PDF
面向对象数据库中的有环查询及其并行化处理 被引量:1
3
作者 王意洁 王勇军 胡守仁 《电子学报》 EI CAS CSCD 北大核心 1999年第5期18-21,35,共5页
本文针对面向对象数据库及其有环查询的特点,以ODMG93国际标准为基础,提出了一种具有一定普遍性和实用性的有环查询处理策略.在异步并行查询执行策略的基础上,进一步提出了有环查询的并行处理策略.
关键词 面向对象数据库 有环查询 环成分 并行处理
下载PDF
计算流动显示的并行处理研究 被引量:2
4
作者 周璐 王正华 李晓梅 《空气动力学学报》 CSCD 北大核心 2002年第z1期106-111,共6页
计算流动显示是研究高温高速气体动力学属性的一种有效手段 ,其缺点是计算过程复杂 ,计算量大。本文在分析其实现原理的基础上 ,提出并讨论了两种并行计算流动显示的处理模式 。
关键词 计算流动显示 可视化 并行绘制 光线投射
下载PDF
LDLT分解协处理器的并行结构研究
5
作者 郭磊 唐玉华 +1 位作者 周杰 董亚卓 《计算机工程》 CAS CSCD 北大核心 2011年第21期241-243,254,共4页
为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结... 为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结果表明,与运行在2.50 GHz Pentium微处理器上的C代码相比,该协处理器可获得32.03倍~43.25倍的性能提升。 展开更多
关键词 LDLT分解 现场可编程门阵列 细粒度并行 协处理器
下载PDF
面向执行-学习者的在线强化学习并行训练方法 被引量:2
6
作者 孙正伦 乔鹏 +2 位作者 窦勇 李青青 李荣春 《计算机学报》 EI CAS CSCD 北大核心 2023年第2期229-243,共15页
近年来,深度强化学习(Deep Reinforcement Learning,DRL)已经成为了人工智能领域中的研究热点.为了加速DRL训练,人们提出了分布式强化学习方法用于提升训练速度.目前分布式强化学习可以分为同策略方法、异策略方法以及最新的近同策略方... 近年来,深度强化学习(Deep Reinforcement Learning,DRL)已经成为了人工智能领域中的研究热点.为了加速DRL训练,人们提出了分布式强化学习方法用于提升训练速度.目前分布式强化学习可以分为同策略方法、异策略方法以及最新的近同策略方法.近同策略方法改善了同策略方法和异策略方法的问题,但是由于其共享内存并行模型的限制,近同策略模型难以扩展到以网络互连的计算集群上,低可扩展性限制了近同策略方法能够利用的资源数量,增加了计算节点的负载,最终导致训练耗时增加.为了提升近同策略方法的可扩展性,提升收敛速度,本文提出了一种以消息传递为基础,使用Gossip算法与模型融合方法的并行执行者-学习者训练框架(Parallel Actor-Learner Architecture,PALA),这一方法通过增强训练的并行性和可扩展性来提升收敛速度.首先,该框架以Gossip算法作为通信基础,借助全局数据代理并使用消息传递模型创建了一套可扩展的多个并行单智能体训练方法.其次,为了保证探索-利用的同策略性,维持训练稳定,本文创建了一套可以用于多机之间进行隐式同步的进程锁.其次,本文面向含有CUDA张量的模型数据,提出了一种序列化方法,以保证模型数据能够通过节点间网络传递、聚合.最后,本文使用模型聚合方法对训练进行加速.基于上述优化和改进,PALA训练方法能够将负载均衡地映射到整个计算集群上,减少由于高负载而造成的长等待时间,提升收敛速度.实验表明,相较于之前使用共享内存模式的方法,PALA训练的智能体在达到相同水平时,训练时间缩减了20%以上,同时,PALA还有着较好的可扩展性,PALA可以扩展的硬件资源数量是原有方法的6倍以上.与其他方法相对比,PALA训练的智能体最终策略在几乎所有测试环境中达到了最优水平. 展开更多
关键词 Gossip算法 强化学习 同策略学习 分布式强化学习 并行训练方法
下载PDF
一种基于分布对象技术的Agent计算框架 被引量:27
7
作者 周健 吴泉源 +2 位作者 腾猛 王怀民 孙海燕 《计算机研究与发展》 EI CSCD 北大核心 2000年第1期45-49,共5页
随着CORBA等分布计算技术的发展,分布式应用开始关注系统的可靠性、可用性、开放性、计算资源共享与可重用等问题.面向Agent的分布计算技术是解决上述问题的有效手段.文中基于面向Agent的计算观点,论述了分布式应用... 随着CORBA等分布计算技术的发展,分布式应用开始关注系统的可靠性、可用性、开放性、计算资源共享与可重用等问题.面向Agent的分布计算技术是解决上述问题的有效手段.文中基于面向Agent的计算观点,论述了分布式应用及其内部分布对象之间的关系,并针对系统可靠性以及可用性的需求,在CORBA平台上实现了一个Agent框架,用于构造面向Agent的分布式应用.最后介绍利用一种Agent通信语言KQML,实现多Agent系统开放互操作的应用实例. 展开更多
关键词 分布对象 CORBA 多AGENT系统 人工智能
下载PDF
基于Java技术的Web环境下分布式数据库互操作性的实现 被引量:9
8
作者 莫倩 李炽明 +1 位作者 徐明 周兴铭 《小型微型计算机系统》 CSCD 北大核心 1999年第1期49-53,共5页
本文首先简要介绍了Java技术中JDBC和RMI机制的工作原理,讨论了如何应用JDBC实现在Web环境下对异种数据库进行透明访问,如何采用RMI机制消除Java对Applet程序的安全性限制,实现Web环境下分布式数... 本文首先简要介绍了Java技术中JDBC和RMI机制的工作原理,讨论了如何应用JDBC实现在Web环境下对异种数据库进行透明访问,如何采用RMI机制消除Java对Applet程序的安全性限制,实现Web环境下分布式数据库的互操作。 展开更多
关键词 分布式数据库 互操作性 JAVA语言 WEB
下载PDF
一种基于分组与适当选取策略的实时多处理器系统的动态调度算法 被引量:17
9
作者 宾雪莲 杨玉海 金士尧 《计算机学报》 EI CSCD 北大核心 2006年第1期81-91,共11页
在分析了近视算法和节约算法缺点的基础上,提出了一种新的实时多处理器系统的动态调度算法———分组适度算法.分组适度算法包括两个策略:分组策略和适当选取策略.分组策略是为了提高资源的利用率,在保证具有较小目标函数值的任务截止... 在分析了近视算法和节约算法缺点的基础上,提出了一种新的实时多处理器系统的动态调度算法———分组适度算法.分组适度算法包括两个策略:分组策略和适当选取策略.分组策略是为了提高资源的利用率,在保证具有较小目标函数值的任务截止期限的情况下,优先选择可以共享访问资源的任务进行扩展.适当选取策略是为了提高处理器的利用率,当任务不访问资源以及任务所需资源的最早可用时间小于系统中处理器的最小最早可用时间时,选择最早可用时间最小的处理器;否则,选择最早可用时间最接近资源的最早可用时间的处理器.模拟结果表明,分组适度算法的任务接受率高于近视算法和节约算法的任务接受率. 展开更多
关键词 多处理器 实时系统 动态调度 近视算法 最早可用时间
下载PDF
二维三温能量方程组离散求解的两个新预处理技术 被引量:7
10
作者 吴建平 刘兴平 +2 位作者 王正华 戴自换 李晓梅 《计算物理》 EI CSCD 北大核心 2005年第4期283-291,共9页
二维三温能量方程离散后得到的稀疏线性代数方程组中,系数矩阵各行的对角占优性相差十分悬殊,矩阵元素相差也十分大.针对前一问题,提出了改善对角占优性的一个新比例化方法.针对后一问题,利用每次舍弃前计算多个行的技术提出了多行ILUT... 二维三温能量方程离散后得到的稀疏线性代数方程组中,系数矩阵各行的对角占优性相差十分悬殊,矩阵元素相差也十分大.针对前一问题,提出了改善对角占优性的一个新比例化方法.针对后一问题,利用每次舍弃前计算多个行的技术提出了多行ILUT预条件方法.最后,将对角占优性改善技术、多行ILUT与对角元比例化技术、RCM排序联合使用于实际的能量方程离散求解中,取得了较好的加速效果. 展开更多
关键词 二维三温能量方程 预处理 ILUT Krylov子空间迭代
下载PDF
结构网格CFD应用程序在天河超级计算机上的高效并行与优化 被引量:4
11
作者 王勇献 张理论 +3 位作者 车永刚 徐传福 刘巍 程兴华 《电子学报》 EI CAS CSCD 北大核心 2015年第1期36-44,共9页
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能... 对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 展开更多
关键词 计算流体力学 多区结构网格 并行计算 天河计算机 CPU+MIC异构计算
下载PDF
块三对角矩阵的并行局部块分解预条件 被引量:4
12
作者 吴建平 王正华 李晓梅 《计算机学报》 EI CSCD 北大核心 2005年第3期414-419,共6页
该文首先分析了并行局部块分解预条件的特征分布,分析表明其与串行局部块分解预条件的特征分布基本相当,从而从理论上保证了利用该预条件进行并行计算时的高效性.其次分析了利用该预条件进行并行计算时影响加速比的因素,由此说明了当问... 该文首先分析了并行局部块分解预条件的特征分布,分析表明其与串行局部块分解预条件的特征分布基本相当,从而从理论上保证了利用该预条件进行并行计算时的高效性.其次分析了利用该预条件进行并行计算时影响加速比的因素,由此说明了当问题规模不大而处理机台数增加时,计算效率必然逐渐下降的原因.最后在由 6台微机连成的机群系统上将该预条件与利用多分裂技术构造的多种预条件进行了比较,实验结果说明该预条件效率高于其它预条件方法.同时在某巨型机上进行的实验表明对处理机台数比较多时,该预条件也仍然很有效. 展开更多
关键词 局部块分解 预条件 并行算法 多分裂技术
下载PDF
飞腾1500A处理器性能分析工具Likwid研究 被引量:4
13
作者 彭林 方建滨 +3 位作者 杜琦 唐滔 黄春 杨灿群 《计算机工程与科学》 CSCD 北大核心 2018年第7期1147-1154,共8页
在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500... 在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500A处理器的拓扑结构及相关概要信息;编写内核驱动模块使能飞腾1500A处理器的性能监控单元,指定事件类型,通过对应硬件计数器记录目标程序执行过程中事件发生的次数;结合简单代码和模板化的微基准测试程序,使用性能分析工具收集程序执行过程中相关数据,进行性能分析。 展开更多
关键词 飞腾1500A处理器 性能分析工具 PMU
下载PDF
二维不可压流程序在PVM环境下的并行计算 被引量:5
14
作者 王正华 赵文涛 《空气动力学学报》 CSCD 北大核心 2002年第z1期59-63,共5页
本文在PVM环境下进行了二维不可压流的并行数值模拟 ,应用并行虚拟机模型对机器环境和并行程序的特性进行了分析 ,研究了并行程序和并行机器的匹配问题。在MPP环境下的测试表明 ,改进后的并行程序并行效率高。
关键词 不可压流 并行虚拟机模型 并行计算
下载PDF
确定性并行技术 被引量:2
15
作者 周旭 卢凯 陈沉 《计算机学报》 EI CSCD 北大核心 2015年第5期973-986,共14页
由于执行个体之间的同步、竞争和干扰,并行程序的执行存在着不确定性问题,即程序在相同输入下多次执行可能得到不同的结果.不确定性给并行程序在开发、调试、测试、容错和安全等方面都带来了挑战,严重降低了并行程序的可靠性,阻碍了并... 由于执行个体之间的同步、竞争和干扰,并行程序的执行存在着不确定性问题,即程序在相同输入下多次执行可能得到不同的结果.不确定性给并行程序在开发、调试、测试、容错和安全等方面都带来了挑战,严重降低了并行程序的可靠性,阻碍了并行程序的发展.确定性并行技术通过控制并行程序执行个体间的同步、竞争和干扰,使程序的执行结果仅依赖于输入.确定性并行技术能够从根本上解决了目前并行程序存在的诸多问题,提升了并行程序的可靠性,给并行程序的发展带来了新的机遇.文中调查、分析和比较了目前主流的确定性并行技术和方法,分析了弱内存一致性对确定性并行系统的影响,并对未来确定性并行技术的发展趋势做出了展望. 展开更多
关键词 确定性 并行计算 可靠性 数据竞争
下载PDF
大规模并行计算机系统并行性能模拟技术研究 被引量:2
16
作者 徐传福 车永刚 王正华 《计算机科学》 CSCD 北大核心 2009年第9期7-10,35,共5页
性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和... 性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案。 展开更多
关键词 并行模拟 并行计算机 消息传递应用程序
下载PDF
通用微处理器虚存管理子系统设计 被引量:2
17
作者 王斌 邓鵾 周兴铭 《计算机应用》 CSCD 北大核心 2003年第3期33-35,39,共4页
以设计 32位VLIW处理器原型为目标 ,详细分析了虚存管理中软硬件的分工协作 ,深入研究并解决了虚存管理子系统设计的三个核心问题 :处理器工作模式分类、虚地址空间划分以及控制协处理器设计 。
关键词 通用微处理器 虚存管理子系统 设计 控制协处理器 VLIW
下载PDF
火箭发动机两相喷雾燃烧的并行虚拟机仿真 被引量:1
18
作者 赵文涛 王正华 +1 位作者 刘仲 杨晓东 《推进技术》 EI CAS CSCD 北大核心 1999年第4期26-28,共3页
采用计算流体动力学方法对液体火箭发动机内部多维喷雾两相燃烧过程进行了数值模拟。气相控制方程组用欧拉坐标系下的Navier-Stokes方程组描述,液相控制方程组在Lagrangian坐标系下进行描述。气、液两相作用通... 采用计算流体动力学方法对液体火箭发动机内部多维喷雾两相燃烧过程进行了数值模拟。气相控制方程组用欧拉坐标系下的Navier-Stokes方程组描述,液相控制方程组在Lagrangian坐标系下进行描述。气、液两相作用通过方程组的源项互相耦合,编制了串行和并行程序,并在并行虚拟机环境下进行了测试。计算结果显示并行计算的效率较高。 展开更多
关键词 液体火箭发动机 两相燃烧 并行处理 数值仿真
下载PDF
CFD并行应用程序的可扩展性分析 被引量:2
19
作者 陈军 王正华 李晓梅 《空气动力学学报》 CSCD 北大核心 2002年第z1期21-26,共6页
对于CFD等应用领域的问题 ,通常人们采用进一步细分网格 ,以获得更为精确的结果 ,但这样会增大问题规模 ,这就要求应用程序必须具有良好的可扩展性。本文提出了三种可扩展性度量方法 ,即时间可扩展性、效率可扩展性和收敛可扩展性 ,分... 对于CFD等应用领域的问题 ,通常人们采用进一步细分网格 ,以获得更为精确的结果 ,但这样会增大问题规模 ,这就要求应用程序必须具有良好的可扩展性。本文提出了三种可扩展性度量方法 ,即时间可扩展性、效率可扩展性和收敛可扩展性 ,分别对并行应用程序在并行机上的执行时间、效率和收敛速率在扩展过程中的变化进行度量。使用这些方法对三个CFD应用实例进行了可扩展性分析。结果表明 ,这三种新方法克服了以往方法难以衡量由算法实现差别导致的并行系统可扩展性差异的不足 ,并具有易于使用的优点。 展开更多
关键词 可扩展性 并行效率 计算流体动力学
下载PDF
微处理器的现状及发展 被引量:7
20
作者 肖刚 周兴铭 《微处理机》 1998年第3期1-7,共7页
从1971年第1个微处理器芯片4004诞生以来,微处理器走过了26个年头,如今又面临一个转折的关头,未来微处理器如何发展是人们关心的核心问题。本文先对微处理器的现状作一介绍,展望它的未来发展,深入分析微处理器体系结构继超标量技... 从1971年第1个微处理器芯片4004诞生以来,微处理器走过了26个年头,如今又面临一个转折的关头,未来微处理器如何发展是人们关心的核心问题。本文先对微处理器的现状作一介绍,展望它的未来发展,深入分析微处理器体系结构继超标量技术后可能的几个主要发展方向(VLIW、单芯片多处理器、多线程等)的优劣。 展开更多
关键词 微处理器 VLIW 多线程 超标量
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部