期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
宽带RAM模型在对称多处理器集群上的并行设计 被引量:1
1
作者 王光旭 彭朝晖 王鲁军 《声学技术》 CSCD 2011年第3期284-288,共5页
为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Ra... 为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Range-dependent Acoustic Model)进行并行编程,构建了并行计算平台,实现了RAM模型在对称多处理器集群系统上节点间和节点内两级并行,并通过实验对该平台的性能进行了测试。实验结果表明,RAM模型适用于并行计算,该并行计算方法具有很高的并行效率,可以大幅度提高声场计算速度。 展开更多
关键词 RAM 消息传递 共享存储 对称多处理器集群 并行计算 加速比
下载PDF
一种针对处理器集群的源代码级调试系统实现方案 被引量:1
2
作者 林广栋 朱艳 +1 位作者 黄光红 耿锐 《中国集成电路》 2018年第5期43-50,54,共9页
本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层... 本文提出一种针对处理器集群的源代码级调试系统实现方案,支持同时对处理器集群中的所有计算核心进行源代码级调试。该调试系统还支持同时对系统中的不同类型的芯片进行源代码级调试。该调试系统使用一种统一的调试通信协议屏蔽了底层硬件的差异。该调试系统使用命令行接口作为用户接口,通过网关来管理不同的底层硬件。该调试系统支持集成到可视化开发环境中,以图形化的方式进行调试。 展开更多
关键词 处理器集群 源代码级调试 魂芯 MCCD
下载PDF
嵌入式Quartz混合调度的多处理器平台任务分配设计 被引量:2
3
作者 杨志文 程志平 《科技通报》 北大核心 2014年第6期100-102,106,共4页
传统的多GPU处理器集群任务调度分配方法采用时间间隙分配的方法,不考虑各个任务的执行要求和每个计算机节点的实际运算能力,整体的执行效率低。提出一种基于嵌入式Quartz混合调度的多GPU处理器平台任务分配设计方法,采用多处理器模拟... 传统的多GPU处理器集群任务调度分配方法采用时间间隙分配的方法,不考虑各个任务的执行要求和每个计算机节点的实际运算能力,整体的执行效率低。提出一种基于嵌入式Quartz混合调度的多GPU处理器平台任务分配设计方法,采用多处理器模拟计算机系统中的多个运算节点,对不同的任务,根据任务的运算量需求和分配到计算机的实际运算能力,实现动态的任务分配,采用混合任务调度,系统具有很好的鲁棒性,采用一组实际任务进行测试实验,结果显示,采用基于嵌入式Quartz混合调度的方法,任务的执行时间大大减少,具有很好的效率改善结果。 展开更多
关键词 混合调度 处理器集群 任务分配
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
4
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 OPENMP MPI+OPENMP HL-2A高性能计算系统
下载PDF
基于传感器的GPU集群功耗收集监控系统 被引量:7
5
作者 李超凡 陈庆奎 《计算机工程》 CAS CSCD 北大核心 2019年第3期65-72,共8页
图像处理器(GPU)集群因其高性能的特性而被广泛应用,但随着GPU规模的增大,其高功耗问题会降低系统的可靠性。为此,提出一种GPU集群功耗收集系统,并设计基于ZigBee无线传感器网络的GPU集群功耗收集监控网络,同时构建收集通信协议和数据... 图像处理器(GPU)集群因其高性能的特性而被广泛应用,但随着GPU规模的增大,其高功耗问题会降低系统的可靠性。为此,提出一种GPU集群功耗收集系统,并设计基于ZigBee无线传感器网络的GPU集群功耗收集监控网络,同时构建收集通信协议和数据库存储系统,通过运行该系统可有效避免通信冲突。实验结果表明,该监控系统可以精确地测量集群中各个GPU的功耗,系统测量误差和丢包率分别低于1%和0.005%。 展开更多
关键词 图像处理器集群 ZIGBEE无线传感器网络 通信协议 数据库存储 低误差低丢包率
下载PDF
基于ROACH2-GPU的集群相关器研究——X-engine模块的设计与实现 被引量:1
6
作者 汪群雄 牛晨辉 +4 位作者 田海俊 吴锋泉 李吉夏 陈学雷 蒿杰 《天文研究与技术》 CSCD 2016年第2期219-227,共9页
随着射电干涉技术的不断提升,干涉阵列规模越来越大,观测能力逐渐增强,但随之而来的是超大数据的实时处理问题。针对该问题,结合射电干涉仪相关器在数据运算和传输等方面的需求以及射电干涉阵列信号的特征,研制了一套基于图形处理器集... 随着射电干涉技术的不断提升,干涉阵列规模越来越大,观测能力逐渐增强,但随之而来的是超大数据的实时处理问题。针对该问题,结合射电干涉仪相关器在数据运算和传输等方面的需求以及射电干涉阵列信号的特征,研制了一套基于图形处理器集群的通用相关器并用于"天籁计划"的数据处理:首先根据射电信号的关联计算特性,按频段将计算任务分配到不同图形处理器节点,并合理均衡各节点网络负载;然后由不同图形处理器节点独立完成各自的计算任务并将计算结果实时送往存储节点;最后按图形处理器集群通用相关器的设计方案成功安装部署系统并根据"天籁计划"一期的需求进行了性能测试。该图形处理器集群相关器计算性能约为理论峰值性能的46%;相对于传统方案的相关器,基于图形处理器集群的相关器具有开发周期短、可扩展性强、部署简单等优势。 展开更多
关键词 射电干涉仪 图形处理器相关器 图形处理器集群 数据实时处理 分频式计算
下载PDF
TBB多核编程及其混合编程模型的研究 被引量:17
7
作者 胡斌 袁道华 《计算机技术与发展》 2009年第2期98-101,104,共5页
多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上... 多核处理器越来越普及,如何通过软件技术最大提升CPU每个核心的使用率,成为热点问题。引入多核并行编程模型Threading Building Blocks,并与raw threads、Open MP进行各方面详细比较,分析了其优劣。并研究了TBB结合MPI在SMP集群系统上实现高效的混合并行计算应用的方法。最终发现TBB在多核编程方面有显著的优势。TTB和MPI的结合,又为多核处理器结点集群提供了并行层次化结构,大大优化集群的性能。 展开更多
关键词 TBB 多核处理器 多核并行编程 RAW THREADS OPENMP 对称多处理器集群 MPI
下载PDF
GPU-Hi:GPU RTL平台实现及效率分析
8
作者 张立志 赵士彭 章隆兵 《高技术通讯》 CAS 2022年第5期484-492,共9页
实现了寄存器传输级(RTL)图形处理器(GPU)研究平台——GPU-Hi。GPU-Hi支持OpenGL 2.0 API,支持统一着色器渲染架构,使用专用集成电路(ASIC)完成图形流水线的固定功能算法,使用单指令多线程(SIMT)架构流处理器完成图形流水线的可编程着... 实现了寄存器传输级(RTL)图形处理器(GPU)研究平台——GPU-Hi。GPU-Hi支持OpenGL 2.0 API,支持统一着色器渲染架构,使用专用集成电路(ASIC)完成图形流水线的固定功能算法,使用单指令多线程(SIMT)架构流处理器完成图形流水线的可编程着色器模块。在使用28 nm工艺的情况下,该平台的物理设计面积为7.9μm^(2)。使用glmark2的测试集作为性能测试程序,完成了该平台的功能正确性验证,同时使用该测试集研究了3D图形应用的计算特性,并进行了GPU微结构级的性能分析。测试结果表明,图形应用的光栅化任务与像素着色任务不随图形应用分辨率等比例增大;同时GPU硬件的光栅化模块性能受着色程序处理能力与显存访问能力的影响。本平台的实现对GPU RTL平台的研究发展有重要的借鉴价值,本文中得到的结论对GPU性能优化具有重要参考意义,有力支持了GPU硬件研究的发展。 展开更多
关键词 图形处理器(GPU) 性能分析 glmark2 处理器集群
下载PDF
一种运算簇间互连通信单元的设计
9
作者 李斌 谢憬 毛志刚 《计算机工程》 CAS CSCD 2013年第9期153-156,共4页
在高性能并行处理器设计中,权衡通信效率与硬件设计开销是一个关键的问题。基于此,在基于簇状处理单元的线性阵列处理器架构前提下,提出一种基于多运算簇处理器结构的运算簇间互连通信设计方案,包括通信单元结构和典型数字信号处理数据... 在高性能并行处理器设计中,权衡通信效率与硬件设计开销是一个关键的问题。基于此,在基于簇状处理单元的线性阵列处理器架构前提下,提出一种基于多运算簇处理器结构的运算簇间互连通信设计方案,包括通信单元结构和典型数字信号处理数据传输的应用案例分析。实验结果表明,与传统线性阵列处理器结构相比,该方案可使互连通信单元的相应性能提升30%以上。 展开更多
关键词 互连通信 并行运算 处理器结构 运算簇 线性阵列 通信块
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部