期刊文献+
共找到460篇文章
< 1 2 23 >
每页显示 20 50 100
大规模并行计算机系统并行性能模拟技术研究 被引量:2
1
作者 徐传福 车永刚 王正华 《计算机科学》 CSCD 北大核心 2009年第9期7-10,35,共5页
性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和... 性能模拟技术是计算机系统性能评价的重要手段。介绍了面向大规模并行计算机系统以及消息传递应用程序的并行性能模拟技术,总结了相关的关键技术和国内外研究现状。对几个代表性的并行模拟器系统进行了详细介绍。结合并行计算机系统和应用的发展趋势,讨论了未来并行模拟器设计、实现面临的问题和可能的解决方案。 展开更多
关键词 并行模拟 并行计算机 消息传递应用程序
下载PDF
结构网格CFD应用程序在天河超级计算机上的高效并行与优化 被引量:4
2
作者 王勇献 张理论 +3 位作者 车永刚 徐传福 刘巍 程兴华 《电子学报》 EI CAS CSCD 北大核心 2015年第1期36-44,共9页
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能... 对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 展开更多
关键词 计算流体力学 多区结构网格 并行计算 天河计算机 CPU+MIC异构计算
下载PDF
异构并行的高阶散射特征线方法及其在临界实验装置模拟中的应用
3
作者 邹航 陈莹 +5 位作者 张乾 曹巍 张晋超 梁亮 宋佩涛 刘杰 《原子能科学技术》 EI CSCD 北大核心 2024年第1期135-143,共9页
在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并... 在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并行。为确认程序对临界实验装置的物理计算精度,本文选取LCT011临界实验基准进行堆芯物理计算,并与蒙特卡罗程序进行对比验证。各向异性源使得计算量与内存消耗均有显著增加,给异构系统带来较大的显存负担,因此本文进而对高阶散射输运求解器进行性能分析。数值结果表明:在高阶散射计算条件下,程序可达到蒙特卡罗程序的同等精度,且具有较高的计算效率。 展开更多
关键词 特征线方法 高阶散射 临界实验装置 异构并行
下载PDF
云计算环境下的分布存储关键技术 被引量:279
4
作者 王意洁 孙伟东 +2 位作者 周松 裴晓强 李小勇 《软件学报》 EI CSCD 北大核心 2012年第4期962-986,共25页
云计算作为下一代计算模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注.云计算环境下的分布存储主要研究数据在数据中心上的组织和管理,作为云计算环境的核心基础设施,数据中心通常由百万级以上节点组... 云计算作为下一代计算模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注.云计算环境下的分布存储主要研究数据在数据中心上的组织和管理,作为云计算环境的核心基础设施,数据中心通常由百万级以上节点组成,存储其上的数据规模往往达到PB级甚至EB级,导致数据失效成为一种常态行为,极大地限制了云计算的应用和推广,增加了云计算的成本.因此,提高可扩展性和容错性、降低成本,成为云计算环境下分布存储研究的若干关键技术.针对如何提高存储的可扩展性、容错性以及降低存储的能耗等目标,从数据中心网络的设计、数据的存储组织方式等方面对当前分布存储的关键技术进行了综述.首先,介绍并对比了当前典型的数据中心网络结构的优缺点;其次,介绍并对比了当前常用的两种分布存储容错技术,即基于复制的容错技术和基于纠删码的容错技术;第三,介绍了当前典型的分布存储节能技术,并分析了各项技术的优缺点;最后指出了当前技术面临的主要挑战和下一步研究的方向. 展开更多
关键词 云计算 数据中心 分布存储 容错 数据中心网络 复制 纠删码 节能
下载PDF
一种基于分布对象技术的Agent计算框架 被引量:27
5
作者 周健 吴泉源 +2 位作者 腾猛 王怀民 孙海燕 《计算机研究与发展》 EI CSCD 北大核心 2000年第1期45-49,共5页
随着CORBA等分布计算技术的发展,分布式应用开始关注系统的可靠性、可用性、开放性、计算资源共享与可重用等问题.面向Agent的分布计算技术是解决上述问题的有效手段.文中基于面向Agent的计算观点,论述了分布式应用... 随着CORBA等分布计算技术的发展,分布式应用开始关注系统的可靠性、可用性、开放性、计算资源共享与可重用等问题.面向Agent的分布计算技术是解决上述问题的有效手段.文中基于面向Agent的计算观点,论述了分布式应用及其内部分布对象之间的关系,并针对系统可靠性以及可用性的需求,在CORBA平台上实现了一个Agent框架,用于构造面向Agent的分布式应用.最后介绍利用一种Agent通信语言KQML,实现多Agent系统开放互操作的应用实例. 展开更多
关键词 分布对象 CORBA 多AGENT系统 人工智能
下载PDF
复杂系统计算机仿真的研究与设计 被引量:19
6
作者 金士尧 李宏亮 +2 位作者 党岗 王召福 刘晓建 《中国工程科学》 2002年第4期52-57,共6页
复杂系统与复杂性是 2 1世纪的核心科学问题之一 ,并引入国家重点基础研究发展规划。基于复杂系统的复杂性和不确定性 ,很难想像可以采用传统朴素的还原论法进行可行性研究。推崇多智能主体的模糊计算机仿真来研究复杂系统的复杂性 ,并... 复杂系统与复杂性是 2 1世纪的核心科学问题之一 ,并引入国家重点基础研究发展规划。基于复杂系统的复杂性和不确定性 ,很难想像可以采用传统朴素的还原论法进行可行性研究。推崇多智能主体的模糊计算机仿真来研究复杂系统的复杂性 ,并设计了一个基于多智能体的复杂系统分布仿真平台。 展开更多
关键词 复杂性 不确定性 复杂系统 计算机仿真 AGENT HLA/RTI
下载PDF
一个基于高级仿真构架(HLA)的计算机仿真系统的设计 被引量:3
7
作者 凌云翔 史湘宁 +1 位作者 王召福 金士尧 《小型微型计算机系统》 CSCD 北大核心 1999年第11期805-808,共4页
本文结合雷达电子对抗仿真实例,论述了基于HLA 的分布交互式多机仿真系统YH- NI/NR 的体系结构、运行支持系统、仿真应用对象模型、联邦总管和通信网络。
关键词 计算机仿真系统 HLA 雷达电子对抗
下载PDF
高性能计算中的并行I/O技术 被引量:2
8
作者 李东升 卢凯 +1 位作者 李铭 卢锡城 《计算机科学》 CSCD 北大核心 2002年第5期1-3,共3页
1 引言 高性能计算能力已经日益成为一个国家经济、科技与国防实力的重要组成部分.由于科学工程计算和大规模商业事务处理需求的牵引,高性能计算中对I/O处理能力的要求简直是无止境的.大规模多媒体应用要求大容量快速存储系统支持,多用... 1 引言 高性能计算能力已经日益成为一个国家经济、科技与国防实力的重要组成部分.由于科学工程计算和大规模商业事务处理需求的牵引,高性能计算中对I/O处理能力的要求简直是无止境的.大规模多媒体应用要求大容量快速存储系统支持,多用户事务处理环境要求快速I/O支持实时访同,而一些重大挑战性科学计算课题更是追求计算机系统具有3T性能(即要求能提供1 Teraflops计算能力、1 Terabyte主存容量和1 Terabyte/s I/O带宽). 展开更多
关键词 高性能计算 并行I/O技术 并行计算机 体系结构
下载PDF
多核数字信号处理器并行矩阵转置算法优化 被引量:3
9
作者 裴向东 王庆林 +4 位作者 廖林玉 李荣春 梅松竹 刘杰 庞征斌 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强... 矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 展开更多
关键词 多核DSP 矩阵转置 并行算法 算法优化
下载PDF
Internet资源动态分配的分布计算模型及其系统支撑技术
10
作者 彭宇行 吴吉庆 沈锐 《计算机研究与发展》 EI CSCD 北大核心 2011年第9期1580-1588,共9页
Internet资源的动态性使得资源分配问题已成为阻碍Internet资源获得充分利用的一大难题.为方便用户进行Internet应用开发,提出了一个资源动态分配的分布计算模型以及相关的分布处理算法.首先,通过分析Internet资源的动态性,分别从资源... Internet资源的动态性使得资源分配问题已成为阻碍Internet资源获得充分利用的一大难题.为方便用户进行Internet应用开发,提出了一个资源动态分配的分布计算模型以及相关的分布处理算法.首先,通过分析Internet资源的动态性,分别从资源申请者和资源提供者的角度给出了资源分配过程中哪些特性是不变的;然后,基于资源分配过程中的不变特性,定义了资源使用时的接口描述,提出了适应资源动态变化的分布资源的组织模型和动态资源分配计算模型;研究了支持上述模型的系统支撑技术,提出了相应的分布式资源分配算法;另外,定义了优质服务节点并给出了优质服务节点选择算法,并且通过实验证明优质节点选择算法可以有效地降低服务请求被拒绝的比例;基于上述模型和系统支撑技术实现了两类Internet应用,验证了模型和算法的有效性. 展开更多
关键词 分布计算 INTERNET资源 动态资源分配 计算模型 分布算法
下载PDF
计算流动显示的并行处理研究 被引量:2
11
作者 周璐 王正华 李晓梅 《空气动力学学报》 CSCD 北大核心 2002年第z1期106-111,共6页
计算流动显示是研究高温高速气体动力学属性的一种有效手段 ,其缺点是计算过程复杂 ,计算量大。本文在分析其实现原理的基础上 ,提出并讨论了两种并行计算流动显示的处理模式 。
关键词 计算流动显示 可视化 并行绘制 光线投射
下载PDF
分布式存储中的纠删码容错技术研究 被引量:55
12
作者 王意洁 许方亮 裴晓强 《计算机学报》 EI CSCD 北大核心 2017年第1期236-255,共20页
大数据规模上体量大和增长速度快的特点对存储系统的性能和可扩展性提出了严峻挑战.使用普通商用服务器构建的分布式存储系统服务能力强、成本低廉且极易扩展,在大数据的存储管理中得到了极为广泛的应用.分布式存储系统庞大的节点数量... 大数据规模上体量大和增长速度快的特点对存储系统的性能和可扩展性提出了严峻挑战.使用普通商用服务器构建的分布式存储系统服务能力强、成本低廉且极易扩展,在大数据的存储管理中得到了极为广泛的应用.分布式存储系统庞大的节点数量导致节点失效情况频发,必须采用一定的容错技术来保证数据可靠性.常用的容错技术主要包括多副本技术和纠删码技术两种.与多副本容错技术相比,纠删码容错技术能够以低得多的存储开销提供相同甚至更高的数据可靠性.随着近年来数据规模的爆炸式增长,纠删码容错技术受到了业界的广泛关注.该文综述了分布式存储中纠删码容错技术的研究现状.首先,介绍了纠删码容错技术的基本原理和概念,指出了纠删码容错技术在大规模分布式存储中面临的主要技术挑战;然后,从编码实现、纠删码设计、数据修复和数据更新等方面阐述了分布式存储中纠删码容错技术的研究进展,重点研究分析了各项关键技术的特点和局限性,并依据主要评价指标对现有纠删码的编码性能和修复性能进行了对比和分析;最后,基于最新研究动态指出了分布式存储中纠删容错技术未来的研究方向,包括同步编码实现技术、低冗余再生码设计和数据失效预测技术等. 展开更多
关键词 分布式存储 纠删码 编码实现 数据修复 数据更新
下载PDF
一种基于并行度分析模型的GPU功耗优化技术 被引量:13
13
作者 林一松 杨学军 +2 位作者 唐滔 王桂彬 徐新海 《计算机学报》 EI CSCD 北大核心 2011年第4期705-716,共12页
随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU开始被应用于通用计算领域,协助CPU加速程序的运行.为了追求高性能,GPU往往包含成百上千个核心运算单元.高密度的计算资源,使得其在性能远高于CPU的同时功耗也高于CPU.功耗问题已经... 随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU开始被应用于通用计算领域,协助CPU加速程序的运行.为了追求高性能,GPU往往包含成百上千个核心运算单元.高密度的计算资源,使得其在性能远高于CPU的同时功耗也高于CPU.功耗问题已经成为制约GPU发展的重要问题之一.DVFS技术被广泛应用于处理器的低功耗优化,而对GPU进行相应研究的前提是对其程序运行过程进行分析和建模,从而可以根据应用程序的特征来确定优化策略.此外,GPU主要由图形处理器芯片和片外的DRAM组成,有研究指出针对这类系统的功耗优化应当综合考虑处理器和存储器,使二者可以互相协调以达到更好的优化效果.文中在一个已有的基于程序并行度分析的GPU性能模型的基础上,综合考虑计算部件与存储部件的功耗,建立了性能约束条件下的GPU功耗优化模型.对于给定的程序,在满足性能约束的前提下,以功耗最优为目标分别给出处理器和存储器的DVFS优化策略.作者选取了9个测试用例在3种模拟平台上进行了实验验证,结果表明文中的方法可以在满足性能约束条件10%的误差范围内获得最优的GPU能量消耗. 展开更多
关键词 GPU 并行度模型 功耗模型 功耗优化
下载PDF
虚拟计算环境中的可扩展分布式资源信息服务 被引量:10
14
作者 张一鸣 李东升 卢锡城 《软件学报》 EI CSCD 北大核心 2007年第8期1933-1942,共10页
基于网络资源的"成长性"、"自治性"和"多样性",近年来,人们提出以通用DHT(distributed Hash table)信息服务的形式实现网络资源信息的发布和查询.然而,现有的资源信息服务在通用性、易用性和自适应性等... 基于网络资源的"成长性"、"自治性"和"多样性",近年来,人们提出以通用DHT(distributed Hash table)信息服务的形式实现网络资源信息的发布和查询.然而,现有的资源信息服务在通用性、易用性和自适应性等方面仍存在不足.针对虚拟计算环境iVCE(Internet-based virtual computingen vironment)的资源聚合需求,提出构建可扩展的分布式资源信息服务SDIRIS(scalable distributed resource information service).首先,提出采用自适应DHT(adaptive FissionE,简称A-FissionE)底层架构,以对上层应用透明的方式适应不同的系统规模和稳定性;其次,基于自适应DHT提出高效的多属性区间搜索算法(multiple-attribute range FissionE,简称MR-FissionE).理论分析和模拟结果表明,SDIRIS能够高效地实现资源信息的发布与查询功能. 展开更多
关键词 虚拟计算环境 资源信息服务 自适应DHT(distributed HASH table) 多属性区间搜索 ZKT(Z-curve Kautz tree)
下载PDF
基于半连接的并行查询处理算法的研究 被引量:11
15
作者 王意洁 王勇军 卢锡城 《软件学报》 EI CSCD 北大核心 2001年第2期219-224,共6页
多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明... 多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明了其实用性和有效性 . 展开更多
关键词 半连接 并行数据库 并行查询处理算法 面向对象数据库
下载PDF
基于Java技术的Web环境下分布式数据库互操作性的实现 被引量:9
16
作者 莫倩 李炽明 +1 位作者 徐明 周兴铭 《小型微型计算机系统》 CSCD 北大核心 1999年第1期49-53,共5页
本文首先简要介绍了Java技术中JDBC和RMI机制的工作原理,讨论了如何应用JDBC实现在Web环境下对异种数据库进行透明访问,如何采用RMI机制消除Java对Applet程序的安全性限制,实现Web环境下分布式数... 本文首先简要介绍了Java技术中JDBC和RMI机制的工作原理,讨论了如何应用JDBC实现在Web环境下对异种数据库进行透明访问,如何采用RMI机制消除Java对Applet程序的安全性限制,实现Web环境下分布式数据库的互操作。 展开更多
关键词 分布式数据库 互操作性 JAVA语言 WEB
下载PDF
一种改进的适合并行计算的共轭剩余算法 被引量:5
17
作者 刘杰 刘兴平 +1 位作者 迟利华 胡庆丰 《计算机学报》 EI CSCD 北大核心 2006年第3期495-499,共5页
通过改变CR算法的计算次序,提出了一种改进的共轭剩余(ICR)算法.对比CR算法,ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为CR算法的一半,并且所有内积计算以及矩... 通过改变CR算法的计算次序,提出了一种改进的共轭剩余(ICR)算法.对比CR算法,ICR算法的数值稳定性和CR算法相同,几乎没有增加计算量,但考虑了在MIMD并行机上实现时并行算法的性能,其同步开销减少为CR算法的一半,并且所有内积计算以及矩阵向量乘是独立的,没有数据相关性,可以进行计算与通信的重叠.从理论和实验两个角度来讨论ICR算法的性能,当处理机台数较多时ICR算法的计算速度快于CR算法.在64台处理机机群上进行的数值实验表明,并行ICR算法的计算速度大约比CR算法快30%. 展开更多
关键词 共轭剩余算法 同步开销 并行计算 机群 大型对称稀疏线性方程组
下载PDF
二维三温能量方程组离散求解的两个新预处理技术 被引量:7
18
作者 吴建平 刘兴平 +2 位作者 王正华 戴自换 李晓梅 《计算物理》 EI CSCD 北大核心 2005年第4期283-291,共9页
二维三温能量方程离散后得到的稀疏线性代数方程组中,系数矩阵各行的对角占优性相差十分悬殊,矩阵元素相差也十分大.针对前一问题,提出了改善对角占优性的一个新比例化方法.针对后一问题,利用每次舍弃前计算多个行的技术提出了多行ILUT... 二维三温能量方程离散后得到的稀疏线性代数方程组中,系数矩阵各行的对角占优性相差十分悬殊,矩阵元素相差也十分大.针对前一问题,提出了改善对角占优性的一个新比例化方法.针对后一问题,利用每次舍弃前计算多个行的技术提出了多行ILUT预条件方法.最后,将对角占优性改善技术、多行ILUT与对角元比例化技术、RCM排序联合使用于实际的能量方程离散求解中,取得了较好的加速效果. 展开更多
关键词 二维三温能量方程 预处理 ILUT Krylov子空间迭代
下载PDF
一个基于网络并行计算环境的动态负载分配算法 被引量:10
19
作者 肖侬 卢宇彤 卢锡城 《计算机研究与发展》 EI CSCD 北大核心 1999年第2期238-241,共4页
网络并行计算系统具有大量的自主的计算资源,如何充分发挥它们的潜在性能,这正是负载平衡的研究内容.文中描述一个基于网络并行计算环境的动态负载分配算法,该算法能够根据系统的状态和任务之间的通信关系动态地分配系统中的负载,... 网络并行计算系统具有大量的自主的计算资源,如何充分发挥它们的潜在性能,这正是负载平衡的研究内容.文中描述一个基于网络并行计算环境的动态负载分配算法,该算法能够根据系统的状态和任务之间的通信关系动态地分配系统中的负载,以实现系统的动态负载平衡.通过应用实例测试说明该算法在稳定性和性能上。 展开更多
关键词 并行计算 动态负载分配 算法 计算机网络
下载PDF
并行与分布硬实时系统的调度 被引量:11
20
作者 毛羽刚 金士尧 张拥军 《计算机科学》 CSCD 北大核心 1999年第9期51-54,共4页
一、前言实时系统是工作在时间约束下的系统,与一般计算机系统的主要区别是引入了时间概念,这大大地影响了系统的设计、验证和实现。实时系统不但要保证计算结果的逻辑正确性,而且要在规定的时间内完成计算。如果某个实时任务没有按时完... 一、前言实时系统是工作在时间约束下的系统,与一般计算机系统的主要区别是引入了时间概念,这大大地影响了系统的设计、验证和实现。实时系统不但要保证计算结果的逻辑正确性,而且要在规定的时间内完成计算。如果某个实时任务没有按时完成,则可能导致整个系统失败,甚至引起灾难性后果。这类实时系统被称为硬实时(hard real-time)系统。例如,核电厂或导弹控制系统等。 展开更多
关键词 实时系统 调度 硬实时系统 操作系统
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部