期刊文献+
共找到595篇文章
< 1 2 30 >
每页显示 20 50 100
DNA序列拼接的分布式并行处理 被引量:3
1
作者 方小永 骆志刚 《计算机工程与科学》 CSCD 2005年第2期71-73,77,共4页
针对分布式存储环境,本文提出一种DNA序列拼接的并行算法,分别对序列拼接中OVERLAP、LAYOUT 和CONSENSUS阶段的串行处理过程和并行算法进行了描述,并给出了算法复杂性分析。数值试验结果表明,算法是高 效的。
关键词 生物信息学 基因组计划 DNA序列 分布式并行处理
下载PDF
异构并行的高阶散射特征线方法及其在临界实验装置模拟中的应用
2
作者 邹航 陈莹 +5 位作者 张乾 曹巍 张晋超 梁亮 宋佩涛 刘杰 《原子能科学技术》 EI CSCD 北大核心 2024年第1期135-143,共9页
在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并... 在临界实验装置的物理计算中,由于较厚水反射层的存在,中子各向异性散射会对计算结果有重要影响。基于P1各向异性散射特征线方法(MOC),开发了能够处理各向异性散射的特征线输运计算程序,并实现了高阶散射特征线输运计算的高性能异构并行。为确认程序对临界实验装置的物理计算精度,本文选取LCT011临界实验基准进行堆芯物理计算,并与蒙特卡罗程序进行对比验证。各向异性源使得计算量与内存消耗均有显著增加,给异构系统带来较大的显存负担,因此本文进而对高阶散射输运求解器进行性能分析。数值结果表明:在高阶散射计算条件下,程序可达到蒙特卡罗程序的同等精度,且具有较高的计算效率。 展开更多
关键词 特征线方法 高阶散射 临界实验装置 异构并行
下载PDF
基于半连接的并行查询处理算法的研究 被引量:11
3
作者 王意洁 王勇军 卢锡城 《软件学报》 EI CSCD 北大核心 2001年第2期219-224,共6页
多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明... 多元连接查询的并行执行是并行数据库的研究重点 ,传统的并行查询处理算法没有利用面向对象数据库及其查询的特点 ,算法效率较低 .借鉴分布式数据库查询处理中基于半连接的优化思想 ,提出了基于半连接的并行查询处理算法 .性能评价表明了其实用性和有效性 . 展开更多
关键词 半连接 并行数据库 并行查询处理算法 面向对象数据库
下载PDF
块三对角线性方程组的一种分布式并行算法 被引量:19
4
作者 骆志刚 李晓梅 《计算机学报》 EI CSCD 北大核心 2000年第10期1028-1034,共7页
提出了分布式环境下求解块三对角线性方程组的一种并行算法 ,该算法基于对计算量的仔细估算 ,合理地将方程组求解工作分配到各处理机 ,达到负载平衡 ,同时 ,充分地将计算与通信重叠 ,减少处理机空闲时间 ;当块三对角线性方程组的系数矩... 提出了分布式环境下求解块三对角线性方程组的一种并行算法 ,该算法基于对计算量的仔细估算 ,合理地将方程组求解工作分配到各处理机 ,达到负载平衡 ,同时 ,充分地将计算与通信重叠 ,减少处理机空闲时间 ;当块三对角线性方程组的系数矩阵为对角占优时 ,算法在执行过程中不会中断 ;文中分析了算法的复杂性 ,给出了在分布存储多计算机系统上的数值试验结果 ,数值结果表明 ,文中算法的效率较 Chung等的算法有较大的提高 . 展开更多
关键词 块三对角线性方程组 分布式并行算法 矩阵
下载PDF
三对角线性方程组的一种有效分布式并行算法 被引量:7
5
作者 骆志刚 李晓梅 王正华 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期802-806,共5页
提出了分布式存储环境下求解三对角线性方程组的一种并行算法 ,该算法基于“分而治之”的策略 ,高效地形成并求解其缩减方程组 ,避免不必要的冗余计算 .通过对计算量的仔细估计 ,较好地平衡了各处理机的负载 ;同时 ,充分利用了计算与通... 提出了分布式存储环境下求解三对角线性方程组的一种并行算法 ,该算法基于“分而治之”的策略 ,高效地形成并求解其缩减方程组 ,避免不必要的冗余计算 .通过对计算量的仔细估计 ,较好地平衡了各处理机的负载 ;同时 ,充分利用了计算与通信重叠技术 ,减少处理机空闲时间 .分析了算法的复杂性 ,给出了在分布存储多计算机系统上的数值试验结果 .数值结果表明 ,算法的效率较迟利华和李晓梅的 DPP算法有较大的提高 . 展开更多
关键词 分布式存储 三对角线性方程组 并行算法
下载PDF
并行与分布硬实时系统的调度 被引量:11
6
作者 毛羽刚 金士尧 张拥军 《计算机科学》 CSCD 北大核心 1999年第9期51-54,共4页
一、前言实时系统是工作在时间约束下的系统,与一般计算机系统的主要区别是引入了时间概念,这大大地影响了系统的设计、验证和实现。实时系统不但要保证计算结果的逻辑正确性,而且要在规定的时间内完成计算。如果某个实时任务没有按时完... 一、前言实时系统是工作在时间约束下的系统,与一般计算机系统的主要区别是引入了时间概念,这大大地影响了系统的设计、验证和实现。实时系统不但要保证计算结果的逻辑正确性,而且要在规定的时间内完成计算。如果某个实时任务没有按时完成,则可能导致整个系统失败,甚至引起灾难性后果。这类实时系统被称为硬实时(hard real-time)系统。例如,核电厂或导弹控制系统等。 展开更多
关键词 实时系统 调度 硬实时系统 操作系统
下载PDF
面向FT1000微处理器的STREAM并行计算与优化 被引量:4
7
作者 迟利华 胡庆丰 +3 位作者 刘杰 甘新标 蒋杰 晏益慧 《计算机工程与科学》 CSCD 北大核心 2014年第12期2267-2271,共5页
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小... STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。 展开更多
关键词 多线程微处理器 STREAM测试程序 性能优化
下载PDF
并行处理方法在液体火箭发动机三维数值模拟中的应用 被引量:2
8
作者 赵文涛 王正华 +1 位作者 刘仲 杨晓东 《国防科技大学学报》 EI CAS CSCD 1999年第4期9-11,共3页
本文采用预测校正的 M ac Corm ack 格式对液体火箭发动机内的复杂三维流场进行了数值模拟,并在 P V M 的微机网络机群环境下实现了并行计算。从测试结果可以看出, 并行与分布处理技术在液体火箭发动机复杂内流场的数值... 本文采用预测校正的 M ac Corm ack 格式对液体火箭发动机内的复杂三维流场进行了数值模拟,并在 P V M 的微机网络机群环境下实现了并行计算。从测试结果可以看出, 并行与分布处理技术在液体火箭发动机复杂内流场的数值模拟方面能发挥重要作用。 展开更多
关键词 并行处理 PVM 三维数值模拟 火箭发动机
下载PDF
一类Toeplitz循环三对角方程组的一种分布式并行算法 被引量:4
9
作者 骆志刚 李晓梅 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期228-233,共6页
提出一类 Toeplitz循环三对角方程组的一种分布式并行算法 .在求解由一阶线性双曲型方程 (如迁移方程 )在一定边界条件下导出的隐式差分方程组时 ,要重复地求解此类 Toeplitz循环三对角方程组 .算法基于对系数矩阵的分解 ,贯彻并行算法... 提出一类 Toeplitz循环三对角方程组的一种分布式并行算法 .在求解由一阶线性双曲型方程 (如迁移方程 )在一定边界条件下导出的隐式差分方程组时 ,要重复地求解此类 Toeplitz循环三对角方程组 .算法基于对系数矩阵的分解 ,贯彻并行算法设计中“分而治之”的原则 ,充分利用了系数矩阵结构的特殊性 .算法实现中通过秦九韶公式的运用 ,避免了不必要的冗余计算 ;理论分析和数值试验表明 ,算法是数值稳定的 ,且当方程组规模充分大时 ,该算法加速比趋近线性加速比的理想情况 . 展开更多
关键词 Toeplitz循环三对角方程组 分布式并行算法 并行计算机 系数矩阵
下载PDF
循环块三对角线性方程组的一种分布式并行算法 被引量:2
10
作者 骆志刚 李晓梅 王正华 《计算物理》 CSCD 北大核心 2001年第4期360-365,共6页
提出一种分布存储环境下求解循环块三对角方程组的并行算法 ,该算法以矩阵子块运算为基础 ,算法实现调用BLAS3子程序 ;文中分析了算法的复杂性 ,给出了一个保证算法不会在执行过程中中断的充分条件 .
关键词 循环块三对角方程组 线性方程组 分布式并行算法 分布式存储 并行算法 多计算机系统
下载PDF
基于高速网络的广域高性能并行与分布式计算 被引量:6
11
作者 卢锡城 肖侬 刘波 《计算机工程与科学》 CSCD 1998年第3期1-5,共5页
本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集... 本文试图说明以下观点:越来越多的高性能应用要求利用地理上分布的、各式各样的计算和数据资源。这些应用希望能够通过高速网络将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存储系统和可视化、虚拟现实系统等连接并集成起来,形成一个网络虚拟计算机(称为元计算机),来实现应用计算问题。这种元计算实质上就是基于高速网络的广域高性能并行与分布式计算。 展开更多
关键词 广域 元计算 计算机网络 并行计算 分布式计算
下载PDF
三对角线性方程组的分布式并行算法 被引量:4
12
作者 迟利华 李晓梅 《计算机研究与发展》 EI CSCD 北大核心 1998年第11期1004-1007,共4页
文中回顾了Michielse&Vorst算法,分析了影响M&V算法并行效率的主要因素,根据分而治之思想提出一种求解三对角方程组的并行算法,新算法通信建立次数为M&V算法的50%,数据传输量为其33%,最后在工作站网络... 文中回顾了Michielse&Vorst算法,分析了影响M&V算法并行效率的主要因素,根据分而治之思想提出一种求解三对角方程组的并行算法,新算法通信建立次数为M&V算法的50%,数据传输量为其33%,最后在工作站网络环境下实现了新算法,就并行效率与M&V算法进行了比较,结果表明在由6台工作站组成的网络中新算法性能提高可达到40%. 展开更多
关键词 线性方程组 并行算法 工作站机群
下载PDF
一类Toeplitz三对角方程组的一种分布式并行算法 被引量:3
13
作者 骆志刚 李晓梅 《计算机学报》 EI CSCD 北大核心 2001年第2期173-178,共6页
文中提出一类 Toeplitz三对角方程组的一种分布式并行算法 ,该算法以系数矩阵的分解为基础 ,充分利用了系数矩阵结构的特殊性 ,算法因并行化而引入的冗余计算量非常少 ,算法的通信机制简单 ,通信量仅与处理机台数p有关 ,与方程组规模 n... 文中提出一类 Toeplitz三对角方程组的一种分布式并行算法 ,该算法以系数矩阵的分解为基础 ,充分利用了系数矩阵结构的特殊性 ,算法因并行化而引入的冗余计算量非常少 ,算法的通信机制简单 ,通信量仅与处理机台数p有关 ,与方程组规模 n无关 ,算法具有很高的并行效率 ,理论分析和数值试验表明 ,其加速比 Sp(n)→ p(n→ +∞ ) ,此为线性加速比的理想情况 .文中给出了算法在分布存储多计算机系统上的数值试验结果 . 展开更多
关键词 Toeplitz三对角方程组 分布式并行算法 并行计算机 系数矩阵
下载PDF
面向对象数据库的并行查询处理 被引量:2
14
作者 王意洁 王勇军 胡守仁 《计算机科学》 CSCD 北大核心 2000年第2期43-47,共5页
一、引言随着数据库规模日趋庞大,其查询日趋复杂,对数据库系统性能的要求也越来越高。另一方面,并行计算机系统迅速发展,许多商品化的高性能并行计算机系统相继投入市场。许多数据库研究者们认为,在并行计算机系统上实现数据库管理系... 一、引言随着数据库规模日趋庞大,其查询日趋复杂,对数据库系统性能的要求也越来越高。另一方面,并行计算机系统迅速发展,许多商品化的高性能并行计算机系统相继投入市场。许多数据库研究者们认为,在并行计算机系统上实现数据库管理系统能够极大地提高数据库管理系统的性能,并行数据库管理系统有望成为未来的高性能数据库管理系统。 展开更多
关键词 数据库 面向对象 并行查询处理 并行计算机
下载PDF
面向对象数据库中的有环查询及其并行化处理 被引量:1
15
作者 王意洁 王勇军 胡守仁 《电子学报》 EI CAS CSCD 北大核心 1999年第5期18-21,35,共5页
本文针对面向对象数据库及其有环查询的特点,以ODMG93国际标准为基础,提出了一种具有一定普遍性和实用性的有环查询处理策略.在异步并行查询执行策略的基础上,进一步提出了有环查询的并行处理策略.
关键词 面向对象数据库 有环查询 环成分 并行处理
下载PDF
一种高效的不确定数据流并行Skyline查询处理方法 被引量:3
16
作者 赵越 王意洁 +1 位作者 王媛 李小勇 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期132-139,共8页
随着信息技术的不断发展,针对不确定数据流的应用和研究逐步引起学界的广泛关注.目前不确定数据流上Skyline查询的相关研究多关注于单机环境下的查询算法.当用户对查询响应速度要求较高或滑动的窗口规模较大时,基于单机环境进行集中处... 随着信息技术的不断发展,针对不确定数据流的应用和研究逐步引起学界的广泛关注.目前不确定数据流上Skyline查询的相关研究多关注于单机环境下的查询算法.当用户对查询响应速度要求较高或滑动的窗口规模较大时,基于单机环境进行集中处理的查询效率受到计算能力的限制,难以满足查询的实时性需求.当前诸如数据中心等分布式计算环境的兴起和广泛运用,为实现不确定数据流的分布并行Skyline查询处理提供了有利条件.对于高速到达的不确定数据流上的Skyline查询,当前研究的挑战在于如何充分利用分布式计算环境实现并行查询处理,以提高查询处理的效率.文中针对已有基于单机环境的集中式查询处理方法因计算能力不足而难以满足当前用户查询需求的问题,提出了一种针对不确定数据流的分布并行Skyline查询处理的两级并行查询模型TPM.实验表明基于TPM模型对不确定数据流进行分布并行Skyline查询处理的方式在不同滑动窗口规模、数据维度和并行节点数目的条件下,均具有良好的性能. 展开更多
关键词 不确定数据 数据流处理 SKYLINE查询 并行查询模型
下载PDF
多核数字信号处理器并行矩阵转置算法优化 被引量:3
17
作者 裴向东 王庆林 +4 位作者 廖林玉 李荣春 梅松竹 刘杰 庞征斌 《国防科技大学学报》 EI CAS CSCD 北大核心 2023年第1期57-66,共10页
矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强... 矩阵转置是矩阵运算的基本操作,广泛应用于信号处理、科学计算以及深度学习等各种领域。随着国防科技大学自主研制的飞腾异构多核数字信号处理器(digital signal processor, DSP)在各种领域中的推广应用,对高性能矩阵转置实现提出了强烈需求。针对飞腾异构多核DSP的体系结构特征与矩阵转置操作的特点,提出了一种适配不同数据位宽(8 B、4 B以及2 B)矩阵的并行矩阵转置算法ftmMT。该算法基于DSP中向量处理单元的Load/Store部件实现了向量化,同时基于矩阵分块实现了多个DSP核的并行处理,通过隐式乒乓设计实现了片上向量化转置与片外访存的重叠以及访存性能的大幅提升。实验结果表明,ftmMT能够显著加快矩阵转置操作,与CPU上的开源转置库HPTT相比,可获得高达8.99倍的性能加速。 展开更多
关键词 多核DSP 矩阵转置 并行算法 算法优化
下载PDF
计算流动显示的并行处理研究 被引量:2
18
作者 周璐 王正华 李晓梅 《空气动力学学报》 CSCD 北大核心 2002年第z1期106-111,共6页
计算流动显示是研究高温高速气体动力学属性的一种有效手段 ,其缺点是计算过程复杂 ,计算量大。本文在分析其实现原理的基础上 ,提出并讨论了两种并行计算流动显示的处理模式 。
关键词 计算流动显示 可视化 并行绘制 光线投射
下载PDF
LDLT分解协处理器的并行结构研究
19
作者 郭磊 唐玉华 +1 位作者 周杰 董亚卓 《计算机工程》 CAS CSCD 北大核心 2011年第21期241-243,254,共4页
为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结... 为提高LDLT分解协处理器的性能,基于FPGA平台,研究其并行结构。分析循环片间的数据依赖关系,提出LDLT分解细粒度并行算法,并在可扩展一维阵列处理器中加以实现,利用主机、算法加速器组成单精度浮点LDLT分解协处理器的并行结构。实验结果表明,与运行在2.50 GHz Pentium微处理器上的C代码相比,该协处理器可获得32.03倍~43.25倍的性能提升。 展开更多
关键词 LDLT分解 现场可编程门阵列 细粒度并行 协处理器
下载PDF
一种弹性可扩展的并行n-of-N Skyline查询处理算法
20
作者 魏炜 王意洁 +1 位作者 王媛 马行空 《计算机研究与发展》 EI CSCD 北大核心 2015年第S2期184-190,共7页
n-of-N Skyline查询关注于大小为N的滑动窗口上最近任意n(n≤N)个数据对象的Skyline查询结果,为用户的Skyline查询提供了高度的灵活性.在当前大数据的新环境下,数据流呈现出以下2个特征:1)数据流实时大规模高速到达;2)数据流工作负载的... n-of-N Skyline查询关注于大小为N的滑动窗口上最近任意n(n≤N)个数据对象的Skyline查询结果,为用户的Skyline查询提供了高度的灵活性.在当前大数据的新环境下,数据流呈现出以下2个特征:1)数据流实时大规模高速到达;2)数据流工作负载的急剧变化性.这对n-of-N Skyline查询的实时性以及自适应扩展提出了更高的要求.而目前针对n-of-N Skyline查询相关的研究都是关注于单机环境下的集中式查询算法,难以同时满足当前新环境下查询的实时性与自适应扩展需求.为此,提出了一种弹性并行查询模型EPM,并且基于EPM模型提出了一种弹性可扩展的并行n-of-N Skyline查询算法(elastic parallel n-of-N Skylline,EPnNS).实验证明,该算法在并行节点数增加1倍时,查询效率提升接近70%,而且在应对不同程度的负载变化时,该算法具有较好的自适应调整性能. 展开更多
关键词 n-of-N SKYLINE 并行 弹性 可扩展性 数据流处理
下载PDF
上一页 1 2 30 下一页 到第
使用帮助 返回顶部