期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于序列划分策略的Hmmsearch程序两级并行实现 被引量:2
1
作者 郭华源 骆志刚 +2 位作者 杨泽凡 刘志芳 肖国荣 《计算机应用与软件》 CSCD 北大核心 2006年第11期32-33,87,共3页
Hmm search程序是生物序列分析软件包HMMER中最主要程序之一,采用集中式动态负载平衡方案。为了提高其可扩展性,提出一种基于序列划分策略的两级并行算法,采用分布式动态负载平衡方案。通过增加中间层形成“M aster-subM aster-Slave”... Hmm search程序是生物序列分析软件包HMMER中最主要程序之一,采用集中式动态负载平衡方案。为了提高其可扩展性,提出一种基于序列划分策略的两级并行算法,采用分布式动态负载平衡方案。通过增加中间层形成“M aster-subM aster-Slave”结构,来改善原“M aster-Slave”结构的不足。实验数据表明改进算法比原算法具有更好的可扩展并行性能。 展开更多
关键词 生物信息学 Hmmsearch 两级并行
下载PDF
SMPCluster:如何开发两级并行 被引量:5
2
作者 王韬 李晓明 《计算机工程与科学》 CSCD 2002年第4期78-80,88,共4页
本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用... 本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用性的综合考虑 ,在LinuxSMPCluster上应当直接使用利用共享内存进行通信的MPI进行编程。 展开更多
关键词 SMPCluster 两级并行 操作系统 消息传递 LIUNX
下载PDF
多重链路网络分区与QoS度量两级并行QoSR算法
3
作者 秦勇 梁本来 +2 位作者 叶建锋 蔡昭权 魏文红 《计算机应用与软件》 CSCD 2009年第4期204-207,共4页
在多重链路上联网络环境下,采用并行路由搜索的思想寻找最优路径,能够获得较好的路径寻优结果,并且算法的时间复杂度较低。给出一种两级并行QoSR算法,将多重链路环境按一定规则划分为若干分区,为每个分区分配一定数量的QoS度量并行处理... 在多重链路上联网络环境下,采用并行路由搜索的思想寻找最优路径,能够获得较好的路径寻优结果,并且算法的时间复杂度较低。给出一种两级并行QoSR算法,将多重链路环境按一定规则划分为若干分区,为每个分区分配一定数量的QoS度量并行处理器和1个分区处理器,在各个分区分别采用QPAS算法,由QoS度量并行处理器并行计算出各分区内的QoS度量Pareto最佳路径,最终由分区处理器调用最短路径并行算法完成分区间代价最小路径的计算。 展开更多
关键词 多重链路网络 并行路由搜索 两级并行 QOS度量
下载PDF
面向PMVS算法的自动两级并行翻译方法
4
作者 刘金硕 黄朔 邓娟 《计算机工程》 CAS CSCD 北大核心 2022年第12期16-23,共8页
当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维... 当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维多视角立体视觉(PMVS)算法,提出一种从C到CUDA的自动两级并行翻译方法。使用ANTLR自动解析源C代码,通过分析数据依赖关系和循环数组私有化来识别可并行化的循环结构,将算法翻译成CPU多线程和GPU两级并行结构的代码。在算法执行过程中,将输入图像在CPU和GPU上分别进行处理,降低了算法总执行时间。实验结果表明,该方法的计算加速比随着输入图像分辨率的增加逐渐提高,最高约达到32,相比于PPCG和OpenACC自动并行翻译方法提升明显。 展开更多
关键词 两级并行翻译 图像处理算法 基于面片的三维多视角立体视觉 扩展Backus-Naur范式 抽象语法树
下载PDF
面向科学计算可视化的两级并行数据读取加速方法 被引量:3
5
作者 石刘 肖丽 +1 位作者 曹立强 莫则尧 《计算机研究与发展》 EI CSCD 北大核心 2017年第4期844-854,共11页
为了匹配超级计算机的整体计算能力,超级计算机存储子系统通常具有良好的I/O性能可扩展性,表现为:应用获得存储子系统最佳性能时的I/O访问并发度,与超级计算机系统总计算核数(可达数万至数百万)通常处于同一数量级.然而,科学计算可视化... 为了匹配超级计算机的整体计算能力,超级计算机存储子系统通常具有良好的I/O性能可扩展性,表现为:应用获得存储子系统最佳性能时的I/O访问并发度,与超级计算机系统总计算核数(可达数万至数百万)通常处于同一数量级.然而,科学计算可视化应用通常使用的进程数(等于I/O访问并发度)相对较小(经验上常设为计算进程数的1%,典型值为数个至数百个),因此无法充分发挥超级计算机存储子系统的最佳I/O性能.提出了一种面向科学计算可视化的两级并行数据读取加速方法,在可视化进程内部引入多线程并行数据读取,通过进程间和进程内两级并行,增加超级计算机存储子系统的I/O访问并发度,提升可视化应用数据读取速率.测试结果表明:在不同的可视化进程规模下,两级并行比单级并行峰值数据读取速率提高33.5%~269.5%,均值数据读取速率提高26.6%~232.2%;随着科学计算应用种类以及应用规模的变化,两级并行数据读取可使可视化应用整体峰值运行速度加速19.5%~225.7%,均值运行速度加速15.8%~197.6%. 展开更多
关键词 两级并行数据读取 科学计算可视化 数据访问模式 存储子系统 I/O性能特征
下载PDF
一种自带采/保的10位20兆赫两级并行A/D转换器
6
作者 Toshihiko Shimizu 邓荣祥 《微电子学》 CAS CSCD 1989年第6期9-17,共9页
本文叙述一种用于高清晰度电视机,办公用录像机及数字式视频摄像机等的优质视频系统10位20MHz A/D转换器。这种新开发的LSI A/D转换器使用标准的两级并行结构,具有自动增益调节和二位数据误差校准功能。同时在芯片内含一个采/保电路。... 本文叙述一种用于高清晰度电视机,办公用录像机及数字式视频摄像机等的优质视频系统10位20MHz A/D转换器。这种新开发的LSI A/D转换器使用标准的两级并行结构,具有自动增益调节和二位数据误差校准功能。同时在芯片内含一个采/保电路。它的制作是采用4.5GHz f_T, 3μm标准双极工艺技术。芯片面积为25mm^2,功耗为900mW。如此低功耗水平是至今为止所报导的最低值的一半左右。这个ADC可在20MHz转换频率下对8.5MHz的视频信号进行数字化处理。它的差动增益误差(DC)为 0.5%,差动相位误差(DP) 0.5度。 展开更多
关键词 A/D转换器 电视机 采/保 两级并行
下载PDF
快速并行两级景象匹配方法 被引量:1
7
作者 王洪军 黄爱民 刘建平 《计算机工程与应用》 CSCD 北大核心 2002年第24期118-120,共3页
文章分析了景象匹配系统的性能评价以及影响性能评价的三个主要因素,即实时图大小,参考图大小和匹配算法。分析了实时图大小的选取对匹配时间,匹配率的影响。并且针对巡航导弹的景象匹配制导系统的实时性问题,提出了一种快速并行两级景... 文章分析了景象匹配系统的性能评价以及影响性能评价的三个主要因素,即实时图大小,参考图大小和匹配算法。分析了实时图大小的选取对匹配时间,匹配率的影响。并且针对巡航导弹的景象匹配制导系统的实时性问题,提出了一种快速并行两级景象匹配方法。该方法能够极大地提高匹配效率。试验中利用SAR图像和可见光图像进行景象匹配,每次匹配的时间从原来的约16秒减少到300毫秒左右,匹配率可达到90%以上。而且还具有可扩充性好的特点。 展开更多
关键词 快速并行景象匹配方法 景象匹配 并行处理 相关度量 性能评价 图像处理 计算机
下载PDF
基于多绘制管线的大规模并行体绘制性能优化技术
8
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
天气雷达组网拼图并行处理方法研究 被引量:6
9
作者 王志斌 万玉发 沃伟峰 《计算机技术与发展》 2013年第7期187-190,193,共5页
天气雷达组网拼图并行处理的目的就是为了满足实时业务的需求,通常的串性方法在雷达运行的六分钟周期内不能完成。利用共享存储多核处理器的高性能服务器,研发了高频度实时全国天气雷达资料处理的并行计算系统,根据单部天气雷达处理和... 天气雷达组网拼图并行处理的目的就是为了满足实时业务的需求,通常的串性方法在雷达运行的六分钟周期内不能完成。利用共享存储多核处理器的高性能服务器,研发了高频度实时全国天气雷达资料处理的并行计算系统,根据单部天气雷达处理和多部雷达拼图的特点,提出了进程级别和线程级别细粒度的OpenMP共享内存编程的两级并行方法,给出一个合理的派生线程粒度数,同时利用共享内存文件的方法提高程序的执行效率。实验结果表明,使用两级的并行计算等方法可以满足全国天气雷达实时处理的要求。利用并行计算实现实时性要求高的业务系统是重要的手段。 展开更多
关键词 天气雷达 共享内存编程 两级并行 内存文件共享
下载PDF
并行编程模型的研究与发展 被引量:6
10
作者 董仁举 祝永志 《计算机技术与发展》 2011年第1期92-94,99,共4页
并行编程模型在分布式计算中发挥着很重要的作用,随着人们对高性能计算需求的不断扩大和各种新技术的出现,并行编程模型也处于不断的发展和完善之中。对两种主要的编程模型进行了详细的分析和研究,针对前两种模型的优缺点分析并研究了... 并行编程模型在分布式计算中发挥着很重要的作用,随着人们对高性能计算需求的不断扩大和各种新技术的出现,并行编程模型也处于不断的发展和完善之中。对两种主要的编程模型进行了详细的分析和研究,针对前两种模型的优缺点分析并研究了两级并行模型的使用范围和优势等,最后针对硬件的新发展提出了新的编程模型的发展TBB+MPI。并在基于CMP的集群系统中实现了矩阵相乘的算法。实验结果显示TBB+MPI在多核集群编程方面有明显的优势,因此模型TBB+MPI更适合于多核集群。 展开更多
关键词 并行编程 消息传递 共享变量 两级并行模型 TBB
下载PDF
组合几何Monte Carlo粒子输运支撑软件框架JCOGIN的研发 被引量:6
11
作者 张宝印 李刚 +1 位作者 邓力 莫则尧 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期448-452,共5页
为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适... 为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适应现代高性能计算机体系结构特征的数据结构,在此基础上实现了对粒子并行与区域分解相耦合的两级并行计算的支撑。在JCOGIN框架下研发了JMCT程序,并进行性能测试,在2万个处理器核上并行效率达70%;基于区域分解完成了大亚湾全堆芯pin-by-pin模型模拟,几何体数达千万,粒子数达百亿。 展开更多
关键词 JCOGIN框架 组合几何 两级并行计算 MONTE Carlo粒子输运
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部