期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于序列划分策略的Hmmsearch程序两级并行实现
被引量:
2
1
作者
郭华源
骆志刚
+2 位作者
杨泽凡
刘志芳
肖国荣
《计算机应用与软件》
CSCD
北大核心
2006年第11期32-33,87,共3页
Hmm search程序是生物序列分析软件包HMMER中最主要程序之一,采用集中式动态负载平衡方案。为了提高其可扩展性,提出一种基于序列划分策略的两级并行算法,采用分布式动态负载平衡方案。通过增加中间层形成“M aster-subM aster-Slave”...
Hmm search程序是生物序列分析软件包HMMER中最主要程序之一,采用集中式动态负载平衡方案。为了提高其可扩展性,提出一种基于序列划分策略的两级并行算法,采用分布式动态负载平衡方案。通过增加中间层形成“M aster-subM aster-Slave”结构,来改善原“M aster-Slave”结构的不足。实验数据表明改进算法比原算法具有更好的可扩展并行性能。
展开更多
关键词
生物信息学
Hmmsearch
两级并行
下载PDF
职称材料
SMPCluster:如何开发两级并行
被引量:
5
2
作者
王韬
李晓明
《计算机工程与科学》
CSCD
2002年第4期78-80,88,共4页
本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用...
本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用性的综合考虑 ,在LinuxSMPCluster上应当直接使用利用共享内存进行通信的MPI进行编程。
展开更多
关键词
SMPCluster
两级并行
操作系统
消息传递
LIUNX
下载PDF
职称材料
多重链路网络分区与QoS度量两级并行QoSR算法
3
作者
秦勇
梁本来
+2 位作者
叶建锋
蔡昭权
魏文红
《计算机应用与软件》
CSCD
2009年第4期204-207,共4页
在多重链路上联网络环境下,采用并行路由搜索的思想寻找最优路径,能够获得较好的路径寻优结果,并且算法的时间复杂度较低。给出一种两级并行QoSR算法,将多重链路环境按一定规则划分为若干分区,为每个分区分配一定数量的QoS度量并行处理...
在多重链路上联网络环境下,采用并行路由搜索的思想寻找最优路径,能够获得较好的路径寻优结果,并且算法的时间复杂度较低。给出一种两级并行QoSR算法,将多重链路环境按一定规则划分为若干分区,为每个分区分配一定数量的QoS度量并行处理器和1个分区处理器,在各个分区分别采用QPAS算法,由QoS度量并行处理器并行计算出各分区内的QoS度量Pareto最佳路径,最终由分区处理器调用最短路径并行算法完成分区间代价最小路径的计算。
展开更多
关键词
多重链路网络
并行
路由搜索
两级并行
QOS度量
下载PDF
职称材料
面向PMVS算法的自动两级并行翻译方法
4
作者
刘金硕
黄朔
邓娟
《计算机工程》
CAS
CSCD
北大核心
2022年第12期16-23,共8页
当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维...
当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维多视角立体视觉(PMVS)算法,提出一种从C到CUDA的自动两级并行翻译方法。使用ANTLR自动解析源C代码,通过分析数据依赖关系和循环数组私有化来识别可并行化的循环结构,将算法翻译成CPU多线程和GPU两级并行结构的代码。在算法执行过程中,将输入图像在CPU和GPU上分别进行处理,降低了算法总执行时间。实验结果表明,该方法的计算加速比随着输入图像分辨率的增加逐渐提高,最高约达到32,相比于PPCG和OpenACC自动并行翻译方法提升明显。
展开更多
关键词
两级并行
翻译
图像处理算法
基于面片的三维多视角立体视觉
扩展Backus-Naur范式
抽象语法树
下载PDF
职称材料
面向科学计算可视化的两级并行数据读取加速方法
被引量:
3
5
作者
石刘
肖丽
+1 位作者
曹立强
莫则尧
《计算机研究与发展》
EI
CSCD
北大核心
2017年第4期844-854,共11页
为了匹配超级计算机的整体计算能力,超级计算机存储子系统通常具有良好的I/O性能可扩展性,表现为:应用获得存储子系统最佳性能时的I/O访问并发度,与超级计算机系统总计算核数(可达数万至数百万)通常处于同一数量级.然而,科学计算可视化...
为了匹配超级计算机的整体计算能力,超级计算机存储子系统通常具有良好的I/O性能可扩展性,表现为:应用获得存储子系统最佳性能时的I/O访问并发度,与超级计算机系统总计算核数(可达数万至数百万)通常处于同一数量级.然而,科学计算可视化应用通常使用的进程数(等于I/O访问并发度)相对较小(经验上常设为计算进程数的1%,典型值为数个至数百个),因此无法充分发挥超级计算机存储子系统的最佳I/O性能.提出了一种面向科学计算可视化的两级并行数据读取加速方法,在可视化进程内部引入多线程并行数据读取,通过进程间和进程内两级并行,增加超级计算机存储子系统的I/O访问并发度,提升可视化应用数据读取速率.测试结果表明:在不同的可视化进程规模下,两级并行比单级并行峰值数据读取速率提高33.5%~269.5%,均值数据读取速率提高26.6%~232.2%;随着科学计算应用种类以及应用规模的变化,两级并行数据读取可使可视化应用整体峰值运行速度加速19.5%~225.7%,均值运行速度加速15.8%~197.6%.
展开更多
关键词
两级并行
数据读取
科学计算可视化
数据访问模式
存储子系统
I/O性能特征
下载PDF
职称材料
一种自带采/保的10位20兆赫两级并行A/D转换器
6
作者
Toshihiko Shimizu
邓荣祥
《微电子学》
CAS
CSCD
1989年第6期9-17,共9页
本文叙述一种用于高清晰度电视机,办公用录像机及数字式视频摄像机等的优质视频系统10位20MHz A/D转换器。这种新开发的LSI A/D转换器使用标准的两级并行结构,具有自动增益调节和二位数据误差校准功能。同时在芯片内含一个采/保电路。...
本文叙述一种用于高清晰度电视机,办公用录像机及数字式视频摄像机等的优质视频系统10位20MHz A/D转换器。这种新开发的LSI A/D转换器使用标准的两级并行结构,具有自动增益调节和二位数据误差校准功能。同时在芯片内含一个采/保电路。它的制作是采用4.5GHz f_T, 3μm标准双极工艺技术。芯片面积为25mm^2,功耗为900mW。如此低功耗水平是至今为止所报导的最低值的一半左右。这个ADC可在20MHz转换频率下对8.5MHz的视频信号进行数字化处理。它的差动增益误差(DC)为 0.5%,差动相位误差(DP) 0.5度。
展开更多
关键词
A/D转换器
电视机
采/保
两级并行
下载PDF
职称材料
快速并行两级景象匹配方法
被引量:
1
7
作者
王洪军
黄爱民
刘建平
《计算机工程与应用》
CSCD
北大核心
2002年第24期118-120,共3页
文章分析了景象匹配系统的性能评价以及影响性能评价的三个主要因素,即实时图大小,参考图大小和匹配算法。分析了实时图大小的选取对匹配时间,匹配率的影响。并且针对巡航导弹的景象匹配制导系统的实时性问题,提出了一种快速并行两级景...
文章分析了景象匹配系统的性能评价以及影响性能评价的三个主要因素,即实时图大小,参考图大小和匹配算法。分析了实时图大小的选取对匹配时间,匹配率的影响。并且针对巡航导弹的景象匹配制导系统的实时性问题,提出了一种快速并行两级景象匹配方法。该方法能够极大地提高匹配效率。试验中利用SAR图像和可见光图像进行景象匹配,每次匹配的时间从原来的约16秒减少到300毫秒左右,匹配率可达到90%以上。而且还具有可扩充性好的特点。
展开更多
关键词
快速
并行
两
级
景象匹配方法
景象匹配
并行
处理
相关度量
性能评价
图像处理
计算机
下载PDF
职称材料
基于多绘制管线的大规模并行体绘制性能优化技术
8
作者
王华维
刘若妍
+1 位作者
艾志玮
曹轶
《计算机工程》
CAS
CSCD
北大核心
2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担...
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。
展开更多
关键词
体绘制
多管线
两级并行
并行
可扩展性
性能优化
下载PDF
职称材料
天气雷达组网拼图并行处理方法研究
被引量:
6
9
作者
王志斌
万玉发
沃伟峰
《计算机技术与发展》
2013年第7期187-190,193,共5页
天气雷达组网拼图并行处理的目的就是为了满足实时业务的需求,通常的串性方法在雷达运行的六分钟周期内不能完成。利用共享存储多核处理器的高性能服务器,研发了高频度实时全国天气雷达资料处理的并行计算系统,根据单部天气雷达处理和...
天气雷达组网拼图并行处理的目的就是为了满足实时业务的需求,通常的串性方法在雷达运行的六分钟周期内不能完成。利用共享存储多核处理器的高性能服务器,研发了高频度实时全国天气雷达资料处理的并行计算系统,根据单部天气雷达处理和多部雷达拼图的特点,提出了进程级别和线程级别细粒度的OpenMP共享内存编程的两级并行方法,给出一个合理的派生线程粒度数,同时利用共享内存文件的方法提高程序的执行效率。实验结果表明,使用两级的并行计算等方法可以满足全国天气雷达实时处理的要求。利用并行计算实现实时性要求高的业务系统是重要的手段。
展开更多
关键词
天气雷达
共享内存编程
两级并行
内存文件共享
下载PDF
职称材料
并行编程模型的研究与发展
被引量:
6
10
作者
董仁举
祝永志
《计算机技术与发展》
2011年第1期92-94,99,共4页
并行编程模型在分布式计算中发挥着很重要的作用,随着人们对高性能计算需求的不断扩大和各种新技术的出现,并行编程模型也处于不断的发展和完善之中。对两种主要的编程模型进行了详细的分析和研究,针对前两种模型的优缺点分析并研究了...
并行编程模型在分布式计算中发挥着很重要的作用,随着人们对高性能计算需求的不断扩大和各种新技术的出现,并行编程模型也处于不断的发展和完善之中。对两种主要的编程模型进行了详细的分析和研究,针对前两种模型的优缺点分析并研究了两级并行模型的使用范围和优势等,最后针对硬件的新发展提出了新的编程模型的发展TBB+MPI。并在基于CMP的集群系统中实现了矩阵相乘的算法。实验结果显示TBB+MPI在多核集群编程方面有明显的优势,因此模型TBB+MPI更适合于多核集群。
展开更多
关键词
并行
编程
消息传递
共享变量
两级并行
模型
TBB
下载PDF
职称材料
组合几何Monte Carlo粒子输运支撑软件框架JCOGIN的研发
被引量:
6
11
作者
张宝印
李刚
+1 位作者
邓力
莫则尧
《原子能科学技术》
EI
CAS
CSCD
北大核心
2013年第B12期448-452,共5页
为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适...
为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适应现代高性能计算机体系结构特征的数据结构,在此基础上实现了对粒子并行与区域分解相耦合的两级并行计算的支撑。在JCOGIN框架下研发了JMCT程序,并进行性能测试,在2万个处理器核上并行效率达70%;基于区域分解完成了大亚湾全堆芯pin-by-pin模型模拟,几何体数达千万,粒子数达百亿。
展开更多
关键词
JCOGIN框架
组合几何
两级并行
计算
MONTE
Carlo粒子输运
下载PDF
职称材料
题名
基于序列划分策略的Hmmsearch程序两级并行实现
被引量:
2
1
作者
郭华源
骆志刚
杨泽凡
刘志芳
肖国荣
机构
国防科技大学计算机学院并行与分布处理国家重点实验室
湖南工程学院计算机科学与技术系
出处
《计算机应用与软件》
CSCD
北大核心
2006年第11期32-33,87,共3页
文摘
Hmm search程序是生物序列分析软件包HMMER中最主要程序之一,采用集中式动态负载平衡方案。为了提高其可扩展性,提出一种基于序列划分策略的两级并行算法,采用分布式动态负载平衡方案。通过增加中间层形成“M aster-subM aster-Slave”结构,来改善原“M aster-Slave”结构的不足。实验数据表明改进算法比原算法具有更好的可扩展并行性能。
关键词
生物信息学
Hmmsearch
两级并行
Keywords
Bioinformatics Hmmsearch Two-level parallel
分类号
TP311.12 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
SMPCluster:如何开发两级并行
被引量:
5
2
作者
王韬
李晓明
机构
北京大学计算机科学技术系
出处
《计算机工程与科学》
CSCD
2002年第4期78-80,88,共4页
基金
国家自然科学基金资助项目 (6993 3 0 2 0
69873 0 0 4)
教育部跨世纪人才项目资助
文摘
本文由基础的Linux操作系统入手 ,考察在一个SMP系统内部的两种不同的并行实现机制 :代表共享存储模型的线程模型 (和OpenMP模型 )和代表消息传递模型的MPI模型。然后 ,通过分析应当如何结合节点间和节点内两级并行得出 :从效率和易用性的综合考虑 ,在LinuxSMPCluster上应当直接使用利用共享内存进行通信的MPI进行编程。
关键词
SMPCluster
两级并行
操作系统
消息传递
LIUNX
Keywords
SMP
thread
MPI
cluster
分类号
TP316.81 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
多重链路网络分区与QoS度量两级并行QoSR算法
3
作者
秦勇
梁本来
叶建锋
蔡昭权
魏文红
机构
茂名学院信息与网络中心
太原理工大学计算机与软件学院
惠州学院网络中心
清华大学计算机科学与技术系
华南理工大学计算机科学与工程学院
出处
《计算机应用与软件》
CSCD
2009年第4期204-207,共4页
基金
广东省自然科学基金(05011896)
广东省高校自然科学研究项目(Z03080)
文摘
在多重链路上联网络环境下,采用并行路由搜索的思想寻找最优路径,能够获得较好的路径寻优结果,并且算法的时间复杂度较低。给出一种两级并行QoSR算法,将多重链路环境按一定规则划分为若干分区,为每个分区分配一定数量的QoS度量并行处理器和1个分区处理器,在各个分区分别采用QPAS算法,由QoS度量并行处理器并行计算出各分区内的QoS度量Pareto最佳路径,最终由分区处理器调用最短路径并行算法完成分区间代价最小路径的计算。
关键词
多重链路网络
并行
路由搜索
两级并行
QOS度量
Keywords
Network partition Pareto route searching Tow level parallel QoS route
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
TP393.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向PMVS算法的自动两级并行翻译方法
4
作者
刘金硕
黄朔
邓娟
机构
武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室
武汉大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第12期16-23,共8页
基金
国家自然科学基金(61672393,U1936107)。
文摘
当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式。面向基于面片的三维多视角立体视觉(PMVS)算法,提出一种从C到CUDA的自动两级并行翻译方法。使用ANTLR自动解析源C代码,通过分析数据依赖关系和循环数组私有化来识别可并行化的循环结构,将算法翻译成CPU多线程和GPU两级并行结构的代码。在算法执行过程中,将输入图像在CPU和GPU上分别进行处理,降低了算法总执行时间。实验结果表明,该方法的计算加速比随着输入图像分辨率的增加逐渐提高,最高约达到32,相比于PPCG和OpenACC自动并行翻译方法提升明显。
关键词
两级并行
翻译
图像处理算法
基于面片的三维多视角立体视觉
扩展Backus-Naur范式
抽象语法树
Keywords
two-level parallel translation
image processing algorithm
Patch-based Multiple View Stereo (PMVS)
Extended Backus-Naur Form (EBNF)
Abstract Syntax Tree (AST)
分类号
TP31 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
面向科学计算可视化的两级并行数据读取加速方法
被引量:
3
5
作者
石刘
肖丽
曹立强
莫则尧
机构
中国舰船研究院
北京应用物理与计算数学研究所
中物院高性能数值模拟软件中心
出处
《计算机研究与发展》
EI
CSCD
北大核心
2017年第4期844-854,共11页
基金
国家自然科学基金重点项目(61232012)
国家重点基础研究专项经费(2011CB309702)
国家"八六三"高技术研究发展计划基金项目(2012AA01A309)~~
文摘
为了匹配超级计算机的整体计算能力,超级计算机存储子系统通常具有良好的I/O性能可扩展性,表现为:应用获得存储子系统最佳性能时的I/O访问并发度,与超级计算机系统总计算核数(可达数万至数百万)通常处于同一数量级.然而,科学计算可视化应用通常使用的进程数(等于I/O访问并发度)相对较小(经验上常设为计算进程数的1%,典型值为数个至数百个),因此无法充分发挥超级计算机存储子系统的最佳I/O性能.提出了一种面向科学计算可视化的两级并行数据读取加速方法,在可视化进程内部引入多线程并行数据读取,通过进程间和进程内两级并行,增加超级计算机存储子系统的I/O访问并发度,提升可视化应用数据读取速率.测试结果表明:在不同的可视化进程规模下,两级并行比单级并行峰值数据读取速率提高33.5%~269.5%,均值数据读取速率提高26.6%~232.2%;随着科学计算应用种类以及应用规模的变化,两级并行数据读取可使可视化应用整体峰值运行速度加速19.5%~225.7%,均值运行速度加速15.8%~197.6%.
关键词
两级并行
数据读取
科学计算可视化
数据访问模式
存储子系统
I/O性能特征
Keywords
two level parallel data read
visualization in scientific computing
data access pattern
storage subsystem
I/O performance characteristics
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种自带采/保的10位20兆赫两级并行A/D转换器
6
作者
Toshihiko Shimizu
邓荣祥
出处
《微电子学》
CAS
CSCD
1989年第6期9-17,共9页
文摘
本文叙述一种用于高清晰度电视机,办公用录像机及数字式视频摄像机等的优质视频系统10位20MHz A/D转换器。这种新开发的LSI A/D转换器使用标准的两级并行结构,具有自动增益调节和二位数据误差校准功能。同时在芯片内含一个采/保电路。它的制作是采用4.5GHz f_T, 3μm标准双极工艺技术。芯片面积为25mm^2,功耗为900mW。如此低功耗水平是至今为止所报导的最低值的一半左右。这个ADC可在20MHz转换频率下对8.5MHz的视频信号进行数字化处理。它的差动增益误差(DC)为 0.5%,差动相位误差(DP) 0.5度。
关键词
A/D转换器
电视机
采/保
两级并行
分类号
TP335.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
快速并行两级景象匹配方法
被引量:
1
7
作者
王洪军
黄爱民
刘建平
机构
国防科技大学自动控制系
出处
《计算机工程与应用》
CSCD
北大核心
2002年第24期118-120,共3页
文摘
文章分析了景象匹配系统的性能评价以及影响性能评价的三个主要因素,即实时图大小,参考图大小和匹配算法。分析了实时图大小的选取对匹配时间,匹配率的影响。并且针对巡航导弹的景象匹配制导系统的实时性问题,提出了一种快速并行两级景象匹配方法。该方法能够极大地提高匹配效率。试验中利用SAR图像和可见光图像进行景象匹配,每次匹配的时间从原来的约16秒减少到300毫秒左右,匹配率可达到90%以上。而且还具有可扩充性好的特点。
关键词
快速
并行
两
级
景象匹配方法
景象匹配
并行
处理
相关度量
性能评价
图像处理
计算机
Keywords
Image matching,Parallel processing,Correlation measure,Performance estimate
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多绘制管线的大规模并行体绘制性能优化技术
8
作者
王华维
刘若妍
艾志玮
曹轶
机构
北京应用物理与计算数学研究所计算物理重点实验室
中物院高性能数值模拟软件中心
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第8期207-215,共9页
基金
国家重点研发计划(2017YFB0202203)。
文摘
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。
关键词
体绘制
多管线
两级并行
并行
可扩展性
性能优化
Keywords
volume rendering
multiple pipelines
two-level parallelism
parallel scalability
performance optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
天气雷达组网拼图并行处理方法研究
被引量:
6
9
作者
王志斌
万玉发
沃伟峰
机构
中国气象局武汉暴雨研究所
国家气象中心
出处
《计算机技术与发展》
2013年第7期187-190,193,共5页
基金
国家自然科学基金资助项目(41205086)
国家气象局业务项目
+1 种基金
科技部行业专项(GYHY201006002)
科技部业务专项
文摘
天气雷达组网拼图并行处理的目的就是为了满足实时业务的需求,通常的串性方法在雷达运行的六分钟周期内不能完成。利用共享存储多核处理器的高性能服务器,研发了高频度实时全国天气雷达资料处理的并行计算系统,根据单部天气雷达处理和多部雷达拼图的特点,提出了进程级别和线程级别细粒度的OpenMP共享内存编程的两级并行方法,给出一个合理的派生线程粒度数,同时利用共享内存文件的方法提高程序的执行效率。实验结果表明,使用两级的并行计算等方法可以满足全国天气雷达实时处理的要求。利用并行计算实现实时性要求高的业务系统是重要的手段。
关键词
天气雷达
共享内存编程
两级并行
内存文件共享
Keywords
weather radar
OpenMP
two levels parallel
memory file share
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
并行编程模型的研究与发展
被引量:
6
10
作者
董仁举
祝永志
机构
曲阜师范大学计算机科学学院
出处
《计算机技术与发展》
2011年第1期92-94,99,共4页
基金
山东省高等学校实验研究项目基金(2005-400)
曲阜师范大学校级科研项目(XJ0734)
文摘
并行编程模型在分布式计算中发挥着很重要的作用,随着人们对高性能计算需求的不断扩大和各种新技术的出现,并行编程模型也处于不断的发展和完善之中。对两种主要的编程模型进行了详细的分析和研究,针对前两种模型的优缺点分析并研究了两级并行模型的使用范围和优势等,最后针对硬件的新发展提出了新的编程模型的发展TBB+MPI。并在基于CMP的集群系统中实现了矩阵相乘的算法。实验结果显示TBB+MPI在多核集群编程方面有明显的优势,因此模型TBB+MPI更适合于多核集群。
关键词
并行
编程
消息传递
共享变量
两级并行
模型
TBB
Keywords
parallel-programming
message-passing
shared memory
two-level parallel model
TBB
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
组合几何Monte Carlo粒子输运支撑软件框架JCOGIN的研发
被引量:
6
11
作者
张宝印
李刚
邓力
莫则尧
机构
北京应用物理与计算数学研究所
出处
《原子能科学技术》
EI
CAS
CSCD
北大核心
2013年第B12期448-452,共5页
基金
国家自然科学基金重点资助项目(91118001
61033009)
+2 种基金
国家重点基础研究发展计划资助项目(2011CB309702)
国家高技术研究发展计划资助项目(2012AA01A309)
中国工程物理研究院科学技术发展基金资助项目(2011A0103006)
文摘
为实现核反应堆pin-by-pin精细Monte Carlo粒子输运模拟,研发了组合几何Monte Carlo粒子输运支撑软件框架JCOGIN以支撑千万个几何体、百亿个粒子的Monte Carlo粒子输运大规模并行计算。JCOGIN框架采用层次式、模块化的体系结构设计了适应现代高性能计算机体系结构特征的数据结构,在此基础上实现了对粒子并行与区域分解相耦合的两级并行计算的支撑。在JCOGIN框架下研发了JMCT程序,并进行性能测试,在2万个处理器核上并行效率达70%;基于区域分解完成了大亚湾全堆芯pin-by-pin模型模拟,几何体数达千万,粒子数达百亿。
关键词
JCOGIN框架
组合几何
两级并行
计算
MONTE
Carlo粒子输运
Keywords
JCOGIN infrastructure
combinatorial geometry~ two level parallel compution Monte Carlo particle transport
分类号
O571.51 [理学—粒子物理与原子核物理]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于序列划分策略的Hmmsearch程序两级并行实现
郭华源
骆志刚
杨泽凡
刘志芳
肖国荣
《计算机应用与软件》
CSCD
北大核心
2006
2
下载PDF
职称材料
2
SMPCluster:如何开发两级并行
王韬
李晓明
《计算机工程与科学》
CSCD
2002
5
下载PDF
职称材料
3
多重链路网络分区与QoS度量两级并行QoSR算法
秦勇
梁本来
叶建锋
蔡昭权
魏文红
《计算机应用与软件》
CSCD
2009
0
下载PDF
职称材料
4
面向PMVS算法的自动两级并行翻译方法
刘金硕
黄朔
邓娟
《计算机工程》
CAS
CSCD
北大核心
2022
0
下载PDF
职称材料
5
面向科学计算可视化的两级并行数据读取加速方法
石刘
肖丽
曹立强
莫则尧
《计算机研究与发展》
EI
CSCD
北大核心
2017
3
下载PDF
职称材料
6
一种自带采/保的10位20兆赫两级并行A/D转换器
Toshihiko Shimizu
邓荣祥
《微电子学》
CAS
CSCD
1989
0
下载PDF
职称材料
7
快速并行两级景象匹配方法
王洪军
黄爱民
刘建平
《计算机工程与应用》
CSCD
北大核心
2002
1
下载PDF
职称材料
8
基于多绘制管线的大规模并行体绘制性能优化技术
王华维
刘若妍
艾志玮
曹轶
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
9
天气雷达组网拼图并行处理方法研究
王志斌
万玉发
沃伟峰
《计算机技术与发展》
2013
6
下载PDF
职称材料
10
并行编程模型的研究与发展
董仁举
祝永志
《计算机技术与发展》
2011
6
下载PDF
职称材料
11
组合几何Monte Carlo粒子输运支撑软件框架JCOGIN的研发
张宝印
李刚
邓力
莫则尧
《原子能科学技术》
EI
CAS
CSCD
北大核心
2013
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部