期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
并行计算模型 被引量:2
1
作者 乔香珍 刘方爱 《计算机科学》 CSCD 北大核心 2002年第7期1-5,共5页
1.引言 为提高系统性能,并行机系统设计者在体系结构上采用了多种新技术,然而目前并行软件(包括系统软件和应用软件)的研究和开发远远落后于体系结构的进步,即体系结构上的进步并未充分反映到并行软件的设计中.
关键词 并行计算模型 程序设计语言 程序设计 计算机
下载PDF
Cache性能与程序优化 被引量:9
2
作者 乔香珍 《计算机学报》 EI CSCD 北大核心 1996年第11期818-823,共6页
超高速缓存(cache)是目前用来提高计算机性能的关键技术之一,而算法和程序优化对cache性能的发挥起着重要作用.文中,我们提出一个提高cache性能的优化方法,基本思想是用“加边”法改变cache映射图象而减少冲... 超高速缓存(cache)是目前用来提高计算机性能的关键技术之一,而算法和程序优化对cache性能的发挥起着重要作用.文中,我们提出一个提高cache性能的优化方法,基本思想是用“加边”法改变cache映射图象而减少冲突以提高cache利用率.文中这一技术应用于一些常用算法,分析了与向量机“加边”法的异同,并在一个共享存储器式并行机系统上验证.实算结果与理论分析一致,对不同算法所获整体性能提高为20%到190%.这一方法的优点是效果好,实现简单,且所需的额外存储空间小. 展开更多
关键词 超高速缓存 计算机性能 程序优化
下载PDF
并行计算时间模型和并行机系统性能 被引量:6
3
作者 乔香珍 《计算机学报》 EI CSCD 北大核心 1998年第5期413-418,共6页
本文重点从共事存储器式并行机系统体系结构中的新技术和并行软件系统的新特点分析了影响并行算法和应用程序性能的各种因素,并提出改进的并行计算时间模型,给出了提高并行算法和应用软件性能的原则和实例.从理论和实践两方面证明并... 本文重点从共事存储器式并行机系统体系结构中的新技术和并行软件系统的新特点分析了影响并行算法和应用程序性能的各种因素,并提出改进的并行计算时间模型,给出了提高并行算法和应用软件性能的原则和实例.从理论和实践两方面证明并行处理性能依赖于算法、体系结构和系统软件等多方面因素. 展开更多
关键词 并行算法 并行计算 时间模型 并行计算机
下载PDF
基于LogP模型的并行计算模拟器
4
作者 乔香珍 杨晔 《计算机研究与发展》 EI CSCD 北大核心 1997年第9期641-645,共5页
本文简述了常用的一些并行计算模型,并重点讨论了LogP模型,提出了一个基于LogP模型的并行计算模拟器.叙述了它的功能、原理、结构、实现和实算测试结果.
关键词 可扩展性 LOGP模型 并行计算模拟器
下载PDF
小巨型机编译系统与整机效率
5
作者 乔香珍 《计算机研究与发展》 EI CSCD 北大核心 1989年第12期1-10,共10页
本文介绍了小巨型机的向量化和并行编译系统的特点、功能和应用,提出了小巨型机系统获得整体高效率的三个要素.
关键词 巨型机 编译系统 整机效率
下载PDF
一类层次环网络的构造及路由算法 被引量:14
6
作者 刘方爱 刘志勇 乔香珍 《计算机学报》 EI CSCD 北大核心 2002年第12期1397-1404,共8页
讨论了一类层次环网络 HRN的构造方法、拓扑性质和路由策略 .重点讨论了 HRN网络的一个子类 ,即RP(P,k1 ,k2 )网络 ,分析了其拓扑性质 ,并和 2 D Torus,3D Torus,Hypercube和 De Bruijn Graph等拓扑结构进行了分析比较 .结果表明 ,RP(P,... 讨论了一类层次环网络 HRN的构造方法、拓扑性质和路由策略 .重点讨论了 HRN网络的一个子类 ,即RP(P,k1 ,k2 )网络 ,分析了其拓扑性质 ,并和 2 D Torus,3D Torus,Hypercube和 De Bruijn Graph等拓扑结构进行了分析比较 .结果表明 ,RP(P,k1 ,k2 )网络的拓扑结构简单 ,路由策略方便 ,是一种实用的互联网络 .接着 ,讨论了RP(P,k1 ,k2 )网络上的路由问题 ,给出了点点路由、Broadcast路由、All- to- all路由和置换路由算法 ,前 3个算法分别需要 k2 / 2 +k1 / 2 +2 ,k2 / 2 +k1 / 2 +2 ,10× k1 × k2 - 4个时间步 ,置换路由需要 4+min{ k2 ,k1 } +(k2 - 1)×(k1 - 1)个路由时间步 .最后 ,提出了两个参数 ,即最优节点分组和最优网络划分 ,用于评价互联网络的效率 ,并据此分析了 RP(P,k1 ,k2 ) ,2 D Torus和 Hypercube网络的性能 . 展开更多
关键词 互联网络 路由算法 最优网络划分 最优节点分组 层次环网络 构造方法 计算机
下载PDF
光RP(k)网络上Hypercube通信模式的波长指派算法 被引量:15
7
作者 刘方爱 刘志勇 乔香珍 《软件学报》 EI CSCD 北大核心 2003年第3期575-581,共7页
波长指派是光网络设计的基本问题,设计波长指派算法是洞察光网络通信能力的基本方法.基于光RP(k)网络,讨论了其波长指派问题. 含有N=2n个节点的Hypercube通信模式,构造了节点间的一种排列次序Xn,并设计了RP(k)网络上的波长指派算法.在... 波长指派是光网络设计的基本问题,设计波长指派算法是洞察光网络通信能力的基本方法.基于光RP(k)网络,讨论了其波长指派问题. 含有N=2n个节点的Hypercube通信模式,构造了节点间的一种排列次序Xn,并设计了RP(k)网络上的波长指派算法.在构造该算法的过程中,得到了在环网络上实现n维Hypercube通信模式的波长指派算法.这两个算法具有较高的嵌入效率.在RP(k)网络上,实现Hypercube通信模式需要max{2,52n-5/3}个波长.而在环网络上,实现该通信模式需要复用N/3+N/12个波长,比已有算法需要复用N/3+N/4个波长有较大的改进.这两个算法对于光网络的设计具有较大的指导价值. 展开更多
关键词 光RP(k)网络 Hypercube通信模式 波长指派算法 计算机互连网络
下载PDF
图像恢复的高效并行算法及关键技术 被引量:6
8
作者 李文 张大鹏 +1 位作者 刘志勇 乔香珍 《计算机研究与发展》 EI CSCD 北大核心 2002年第7期848-854,共7页
首次从并行处理的途径分析了能产生高恢复质量、但具有高计算复杂性的图像恢复算法 BNM的并行性 ,并对影响该算法并行效率的关键问题 ,提出了有效的解决方案 :1采用条状重叠的数据分配方案 ,减少了并行处理中的通信量 ;2给出了不同读取... 首次从并行处理的途径分析了能产生高恢复质量、但具有高计算复杂性的图像恢复算法 BNM的并行性 ,并对影响该算法并行效率的关键问题 ,提出了有效的解决方案 :1采用条状重叠的数据分配方案 ,减少了并行处理中的通信量 ;2给出了不同读取策略的内部实现模型 ,分析了不同读取策略对 I/ O带宽产生的影响 ,提出了能够获得高 I/ O性能的读取策略 ;3提出了降低通信量的“关键位通信”方法 .综合运用上述策略 ,设计并实现了高效的并行 BNM算法 .理论分析和实验表明 ,该并行 BNM算法具有很高的加速比、并行效率及很好的可扩展性 。 展开更多
关键词 块压缩编码 传输错误 图像恢复 并行处理 并行效率
下载PDF
一种异步BSP模型及其程序优化技术 被引量:6
9
作者 刘方爱 刘志勇 乔香珍 《计算机学报》 EI CSCD 北大核心 2002年第4期373-380,共8页
基于 BSP模型 ,该文提出了异步计算模型 (CSA- BSP) .该模型更准确地描述了并行机的性能参数 ,引导用户编写高效率的并行程序 ;在 CSA- BSP模型下 ,两个进程异步执行的位置至多相差 p- 1个超步 ;基于程序的执行时间 ,作者分析了 BSP、A-... 基于 BSP模型 ,该文提出了异步计算模型 (CSA- BSP) .该模型更准确地描述了并行机的性能参数 ,引导用户编写高效率的并行程序 ;在 CSA- BSP模型下 ,两个进程异步执行的位置至多相差 p- 1个超步 ;基于程序的执行时间 ,作者分析了 BSP、A- BSP和 CSA- BSP程序的效率 ,得出 CSA - BSP程序的效率是最高的 .在曙光并行机上 ,用“红黑格法”和“矩阵乘法”进行了验证 ,和 BSP模型相比 ,这两个 CSA- BSP程序的效率分别提高 2 0 %和 37% ;同时 ,其进程执行时间的和最大可以降低 8% .因此 ,按照 CSA- BSP模型编程对于提高程序效率和改善系统的吞吐率 ,都有良好的效果 . 展开更多
关键词 并行计算模型 性能分析 异步BSP模型 程序优化 并行计算机
下载PDF
跳跃与环顾最优匹配的快速图像恢复算法 被引量:4
10
作者 李文 张大鹏 +1 位作者 刘志勇 乔香珍 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2002年第4期351-355,368,共6页
BestNeighborhoodMatching (BNM)是目前对损坏图像进行修复并能产生高质量可接受图像的图像恢复算法 ,然而BNM却具有计算复杂度高的局限性 ,因而限制了其实际应用 .文中从BNM中影响算法计算复杂度的关键环节———为坏块寻找最优匹配块... BestNeighborhoodMatching (BNM)是目前对损坏图像进行修复并能产生高质量可接受图像的图像恢复算法 ,然而BNM却具有计算复杂度高的局限性 ,因而限制了其实际应用 .文中从BNM中影响算法计算复杂度的关键环节———为坏块寻找最优匹配块的搜索路径出发 ,参照人在寻找相似块时的快速智能方法 ,提出跳跃环顾BNM图像恢复算法 (JLBNM ) .同时 ,对于进行匹配的核心步骤 ,提出具有自适应阀值匹配标准的优化方法 .有关的计算复杂度度量分析及模拟实验均证明JLBNM具有计算复杂度低 ,对损坏图像恢复质量高的特点 . 展开更多
关键词 计算复杂度 块压缩编码 快速图像恢复算法 图像处理 最优匹配块
下载PDF
并行计算时间模型研究 被引量:1
11
作者 李晓梅 莫则尧 乔香珍 《计算机工程与科学》 CSCD 1998年第3期18-27,共10页
本文系统地总结和探讨了共享和分布式存储环境下的并行计算时间模型。微观上,结合并行机结构特征和通信机制,揭示了延长算法运行时间的关键因素,并据此提出一些优化原则和效率评价准则,能辅助用户修改并行算法达到最优性能;宏观上... 本文系统地总结和探讨了共享和分布式存储环境下的并行计算时间模型。微观上,结合并行机结构特征和通信机制,揭示了延长算法运行时间的关键因素,并据此提出一些优化原则和效率评价准则,能辅助用户修改并行算法达到最优性能;宏观上,给出了基本消息传递的常用通信原语类型和部分原语操作时间经验公式,能辅助用户选择最优通信原语和问题粒度,正确预测程序的运行时间和性能。 展开更多
关键词 并行计算 时间模型 算法 并行计算机
下载PDF
适合在分布存储大规模并行处理系统上应用的块 ADI 算法
12
作者 张宝琳 徐涛 +1 位作者 杨烨 乔香珍 《高技术通讯》 EI CAS CSCD 1998年第2期13-16,共4页
提出了适合在分布存储的大规模并行处理系统上应用的块ADI算法,实现了计算和通讯的局部化,大大减少了通讯花费。在曙光1000计算机上的数值试验表明,块ADI算法比传统的ADI方法具有更高的并行计算效率。
关键词 大规模 并行计算系统 分布存储 块ADI方法
下载PDF
Cache优化与矩阵特征值计算的高效实现 被引量:1
13
作者 甘奇韬 刘志勇 乔香珍 《计算机学报》 EI CSCD 北大核心 1998年第10期956-960,共5页
关键词 高速缓冲存储器 CACHE 优化 矩阵 特征值 计算
下载PDF
基于HPM模型的CoSMPs系统的算法并行与优化
14
作者 李玉岗 乔香珍 刘志勇 《计算机研究与发展》 EI CSCD 北大核心 2004年第4期621-629,共9页
首先 ,基于并行计算模型HPM ,分析了多机机群系统的体系结构特点 ,从并行性和局部性 (存储与通信特性 )两方面分析影响并行应用软件性能的主要因素 ,讨论应用软件并行与优化的相关问题 ;分析了纯MPI和MPI +SMP(或OMP)制导两种编程模式... 首先 ,基于并行计算模型HPM ,分析了多机机群系统的体系结构特点 ,从并行性和局部性 (存储与通信特性 )两方面分析影响并行应用软件性能的主要因素 ,讨论应用软件并行与优化的相关问题 ;分析了纯MPI和MPI +SMP(或OMP)制导两种编程模式在性能上的优点与不足 然后 ,讨论了在CoSMPs系统上对并行应用软件进行优化的方法 最后 ,对两种不同的通信模式 (循环交换、边界交换 )在CoSMPs系统上的性能进行讨论 ,并在多机机群系统的实例———DW30 0 0超级服务器上进行优化 ;通过计算实例———矩阵乘法和解偏微分方程的五点格式算法加以验证 。 展开更多
关键词 CoSMPs HPM SMP 存储层次结构
下载PDF
并行计算模型的层次分析及性能评价 被引量:4
15
作者 刘方爱 乔香珍 刘志勇 《计算机科学》 CSCD 北大核心 2000年第8期1-4,共4页
1.引言如何分析、评价并行程序的性能是并行计算的一个重要研究问题。RAM模型为串行算法分析提供了理论基础。据此,我们可以用big-O模型来分析其算法的复杂性。但是,在并行环境下,由于处理机之间增加了通信,使得并行程序及算法分析问题... 1.引言如何分析、评价并行程序的性能是并行计算的一个重要研究问题。RAM模型为串行算法分析提供了理论基础。据此,我们可以用big-O模型来分析其算法的复杂性。但是,在并行环境下,由于处理机之间增加了通信,使得并行程序及算法分析问题更加复杂。如何在并行程序和计算机结构之间建立一种联系? 展开更多
关键词 并行计算模型 层次分析 性能评价 并行程序设计
下载PDF
并行计算性能的“双流”分析 被引量:1
16
作者 乔香珍 《计算机科学》 CSCD 北大核心 2001年第10期7-12,共6页
The generalized speed-up is estimated according to the "double-stream" analyses. The term"decreasing ratio" is used to describe the influence of the hierarchical memory and the characteristics of p... The generalized speed-up is estimated according to the "double-stream" analyses. The term"decreasing ratio" is used to describe the influence of the hierarchical memory and the characteristics of parallel application on the performance. The optimization principles for parallel computation are also given. 展开更多
关键词 并行计算机 并行计算性能 双流分析 CPU
下载PDF
一种实用的互联网络拓扑结构RP(k)及路由算法 被引量:19
17
作者 刘方爱 乔香珍 刘志勇 《中国科学(E辑)》 CSCD 北大核心 2002年第3期380-385,共6页
提出了一种基于Petersen图的互联网络RP(k),研究了该互联网络的性质,它具有良好的连接度、短的直径和简单的拓扑结构.在节点小于300的情况下,RP(k)的直径低于Torus的直径,其最优分组的距离小于Torus最优分组的距离,特别是当分组节点... 提出了一种基于Petersen图的互联网络RP(k),研究了该互联网络的性质,它具有良好的连接度、短的直径和简单的拓扑结构.在节点小于300的情况下,RP(k)的直径低于Torus的直径,其最优分组的距离小于Torus最优分组的距离,特别是当分组节点数m满足6≤m≤100时,RP(k)最优分组的距离近似等于Torus最优分组距离的一半.基于Petersen图结构,设计了点点通信、置换路由、广播路由和多对多路由算法,它们的通信效率分别为[k/2]+2,k+5,[k/2]+2和k+5. 展开更多
关键词 拓扑结构 RP(κ)互联网络 最优分组 PETERSEN图 网络直径 路由算法 环结构
原文传递
基于Smith-Waterman算法的并行分而治之生物序列比对算法 被引量:7
18
作者 张法 乔香珍 刘志勇 《中国科学(E辑)》 CSCD 北大核心 2004年第2期190-199,共10页
生物序列比对是生物信息学中最常见的问题之一,基于动态规划思想的Smith-Waterman算法是序列比对中最基本的算法.然而现有的并行Smith—Waterman算法都需要庞大的内存,且无法处理大规模的数据串,随着生物数据的急剧增长,这些并行算法对... 生物序列比对是生物信息学中最常见的问题之一,基于动态规划思想的Smith-Waterman算法是序列比对中最基本的算法.然而现有的并行Smith—Waterman算法都需要庞大的内存,且无法处理大规模的数据串,随着生物数据的急剧增长,这些并行算法对内存空间的需求已成为需要迫切解决的问题.由此提出一种并行生物序列比对算法,PSW—DC算法,该算法采用分而治之的方法把query序列划分为若干片段,并分配给相应的各个处理器,而后并行地按Smith—Waterman算法与目标(subiect)序列进行比对,再通过按一定规则的扩展过程求取序列的优化匹配.与其他并行算法相比,该算法有效地降低了内存空间的需求,并实现了对大规模数据串的并行处理.为实现该算法,给出了一种称作C&E的拓展规则及实现方法.且该方法已经在实际系统中得到实现. 展开更多
关键词 SMITH-WATERMAN算法 生物序列比对 动态规划 分而治之 并行处理 内存空间
原文传递
A practical interconnection network RP(k) and its routing algorithms 被引量:6
19
作者 刘方爱 刘志勇 乔香珍 《Science in China(Series F)》 2001年第6期461-473,共13页
Based on Petersen graph, a new interconnection network, the RP(k) network, is devel-oped and the properties of the RP(k) network are investigated. The diameter of the RP(k) network is [ k/2] + 2 and its degree is 5. W... Based on Petersen graph, a new interconnection network, the RP(k) network, is devel-oped and the properties of the RP(k) network are investigated. The diameter of the RP(k) network is [ k/2] + 2 and its degree is 5. We prove that the diameter of the RP(k) network is much smaller than that of the 2-D Torus network when the number of nodes in interconnection networks is less than or equal to 300. In order to analyze the communication performance in a group of nodes, we propose the concepts of the optimal node groups and the diameter of the optimal node groups. We also show that the diameter of the optimal node groups in the RP(k) network is less than that in the 2-D Torus net-work. Especially when the number of nodes in an optimal node group is between 6 and 100, the diam-eter of the optimal node groups in the RP(k) network is half of that in the 2-D Torus network. Further-more based on the RP(k) network we design a set of routing algorithms which are point-to-point rout-ing, permutation routing, one-to-all routing and all-to-all routing. Their communication efficiencies are [ k/2] +2, k + 5, [k/2] + 2, and k + 5 respectively. The RP(k) network and the routing algorithms can provide efficient communication means for parallel and distributed computer system. 展开更多
关键词 RP(k) interconnection network the optimal node group routing algorithm Petersen graph the network diameter.
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部