期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
统一渲染架构GPU中可配置二级Cache设计 被引量:2
1
作者 杜慧敏 康浩然 王可 《西安邮电大学学报》 2020年第6期67-72,共6页
针对统一渲染架构图形处理器(graphics processing unit,GPU)在不同应用场景下的缓存需求,提出了一种大小及数目可配置的二级高速缓存(L2 Cache)设计方案。单一L2 Cache设计采用4路组相联结构,使用改进的伪最近最少使用PLRU-0(modified ... 针对统一渲染架构图形处理器(graphics processing unit,GPU)在不同应用场景下的缓存需求,提出了一种大小及数目可配置的二级高速缓存(L2 Cache)设计方案。单一L2 Cache设计采用4路组相联结构,使用改进的伪最近最少使用PLRU-0(modified pseudo-LRU-0)算法作为替换算法,利用哈希选择算法控制不同配置模式的切换,最终实现了128 kB、256 kB、512 kB三种L2 Cache大小及数目的配置模式。实验结果表明,与不可配置L2 Cache的方案相比,所提设计方案的GPU中缓存结构性能较好。 展开更多
关键词 统一渲染架构gpu L2 Cache 可配置架构
下载PDF
图形处理器协同运算的视频处理架构 被引量:2
2
作者 张磊 王广生 《现代电子技术》 2008年第20期134-138,共5页
多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,... 多媒体视频处理的任务繁重,计算量大,很多算法无法在仅使用一颗CPU的条件下达到实时处理的速度。设计一套图形处理器协同运算的视频处理架构,它采用图形处理器与中央处理器配合,共同完成视频计算的任务。这种架构可以大大加速处理速度,并减轻中央处理器的负担。 展开更多
关键词 图形处理器 gpu通用计算 视频处理 gpu架构
下载PDF
A GPU-Accelerated Discontinuous Galerkin Method for Solving Two-Dimensional Laminar Flows 被引量:2
3
作者 GAO Huanqin CHEN Hongquan +2 位作者 ZHANG Jiale XU Shengguan GAO Yukun 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI CSCD 2022年第4期450-466,共17页
A graphics processing unit(GPU)-accelerated discontinuous Galerkin(DG)method is presented for solving two-dimensional laminar flows.The DG method is ported from central processing unit to GPU in a way of achieving GPU... A graphics processing unit(GPU)-accelerated discontinuous Galerkin(DG)method is presented for solving two-dimensional laminar flows.The DG method is ported from central processing unit to GPU in a way of achieving GPU speedup through programming under the compute unified device architecture(CUDA)model.The CUDA kernel subroutines are designed to meet with the requirement of high order computing of DG method.The corresponding data structures are constructed in component-wised manners and the thread hierarchy is manipulated in cell-wised or edge-wised manners associated with related integrals involved in solving laminar Navier-Stokes equations,in which the inviscid and viscous flux terms are computed by the local lax-Friedrichs scheme and the second scheme of Bassi&Rebay,respectively.A strong stability preserving Runge-Kutta scheme is then used for time marching of numerical solutions.The resulting GPU-accelerated DG method is first validated by the traditional Couette flow problems with different mesh sizes associated with different orders of approximation,which shows that the orders of convergence,as expected,can be achieved.The numerical simulations of the typical flows over a circular cylinder or a NACA 0012 airfoil are then carried out,and the results are further compared with the analytical solutions or available experimental and numerical values reported in the literature,as well as with a performance analysis of the developed code in terms of GPU speedups.This shows that the costs of computing time of the presented test cases are significantly reduced without losing accuracy,while impressive speedups up to 69.7 times are achieved by the present method in comparison to its CPU counterpart. 展开更多
关键词 discontinuous Galerkin gpu compute unified device architecture(CUDA) Navier-Stokes equation laminar flows
下载PDF
基于IP-SAN的电视节目非线性制作网络的设计与建设
4
作者 经农 罗斌 马健 《广播与电视技术》 北大核心 2007年第11期55-61,58+60-61,共7页
本文介绍了扬州广播电视总台基于IP-SAN的电视节目非线性制作网络的设计与建设。重点介绍了网络组建方案对比与选型。提出了系统安全性方面的一些设计方案。对以后其他单位采用IP-SAN网络搭建中等规模的非线性制作网有一定的借鉴作用。
关键词 CPU+gpu+I/O架构 FC-SAN SAN+NAS IP-SAN
下载PDF
华硕V9999 Deluxe显卡
5
《电脑自做》 2004年第6期14-14,共1页
关键词 华硕公司 V9999 Deluxe显卡 gpu架构 单槽散热系统 散热片 散热管 摄像头
下载PDF
类天宫飞行器轨道衰降过程空气动力特性一体化建模并行优化设计 被引量:1
6
作者 张子彬 李志辉 +1 位作者 白智勇 彭傲平 《载人航天》 CSCD 北大核心 2020年第4期418-428,共11页
针对天宫一号目标飞行器无控飞行轨道衰降数值预报需要快速确定轨道积分高精度计算模型中的空气动力,在发展基于修正Boettcher/Legge非对称桥函数的天宫一号空气动力特性当地化算法基础上,对当地化算法的运算流程及对应程序代码进行了... 针对天宫一号目标飞行器无控飞行轨道衰降数值预报需要快速确定轨道积分高精度计算模型中的空气动力,在发展基于修正Boettcher/Legge非对称桥函数的天宫一号空气动力特性当地化算法基础上,对当地化算法的运算流程及对应程序代码进行了整体分析,根据原程序热点代码集中、数据独立性强及传输需求少等特点,发展了多核处理单元的并行优化方法。引入CUDA架构的GPU设备同时,开展了系统、算法以及语句三个层次的并行优化,设计了GPU内存对齐访问方案,使用数据传输函数,将算法求解部分内循环经过展开与合并,整理为整体移植入核函数的一个循环,利用GPU较强的并行计算能力提升运算效率,对函数、循环、指令等代码语句进行级别优化。使用设计的并行计算方案对类天宫飞行器空气动力特性当地化串行算法程序进行CPU+GPU移植优化,达到了近5倍的并行加速比,且使单次求解中GPU数据传输时间缩减为原来的23%,证实了并行方案和优化设计手段的高效实用性。在类天宫飞行器空气动力特性GPU并行算法程序验证基础上,使用GPU并行程序对天宫飞行器轨道衰降飞行340~120 km过程的气动特性进行了不同迎角、侧滑角等飞行姿态计算分析,提供了大量可供轨道飞行力学数值预报的空气动力计算数据。 展开更多
关键词 天宫一号目标飞行器 空气动力特性 当地化桥函数 CPU+gpu 并行移植优化 CUDA架构gpu 并行计算
下载PDF
电视台新闻制作网络的更新构建
7
作者 张巧云 《广播与电视技术》 2009年第8期77-79,共3页
本文介绍服务器的配置和选型、SCSI存储技术及使用心得。
关键词 宽频多码流 新闻制作网络 地级市电视台全台网 CPU+gpu+IO架构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部