期刊文献+
共找到338篇文章
< 1 2 17 >
每页显示 20 50 100
图形处理器(GPU)加速时域有限元的二维辐射计算 被引量:5
1
作者 刘昆 王晓斌 廖成 《电波科学学报》 EI CSCD 北大核心 2008年第1期111-114,共4页
时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的... 时域有限元方法是在电磁场与微波工程领域广泛应用的方法之一。然而,时域有限元在大型机上运行时都是相当缓慢的。对时域有限元计算的硬件加速的研究已经开始进行。与同一代技术的CPU比较,目前一般用户的图形加速卡(GPU)对时域有限元的加速可以达到CPU的近4倍左右。以OpenGL作为应用编程接口(API),使用一个标准的商业图形卡编程解决二维时域有限元的辐射问题。 展开更多
关键词 图形加速卡(gpu) 时域有限元(TD-FEM) 通用计算图形处理单元 (GPgpu)
下载PDF
统一渲染架构GPU图形处理量化性能模型研究 被引量:3
2
作者 马城城 田泽 +1 位作者 黎小玉 孙琳娜 《电子技术应用》 2019年第2期27-32,36,共7页
统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行性能设计和优化,针对统一渲染架构实现的GPU提出一种量化的图形处理性能模型,在深入研究统一渲染架构GPU架构和工作原理基础上,分析... 统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行性能设计和优化,针对统一渲染架构实现的GPU提出一种量化的图形处理性能模型,在深入研究统一渲染架构GPU架构和工作原理基础上,分析影响图形处理的各种因素:图形指令生成、主机接口数据传输、图形指令解析、图形处理流水数据吞吐和统一染色阵列处理能力。通过仿真验证表明,在研制自主知识产权GPU过程中,采用本方法设计各部分性能指标,评估统一染色GPU图形处理性能与实测相比,误差小于7.5%。 展开更多
关键词 gpu 图形处理 统一渲染架构 性能模型
下载PDF
舰船磁特征磁矩量法的图形处理单元加速计算研究 被引量:11
3
作者 郭成豹 刘大明 《兵工学报》 EI CAS CSCD 北大核心 2014年第10期1638-1643,共6页
磁矩量法(MMM)非常适合用于舰船等铁磁目标的磁场特征建模,因为这种方法不需要对空气等非铁磁区域进行网格划分,然而这种方法需要存储和处理稠密的满阵,计算时间很长,矩阵存储需要非常大的存储空间。联合采用MMM和多层自适应交叉近似(ML... 磁矩量法(MMM)非常适合用于舰船等铁磁目标的磁场特征建模,因为这种方法不需要对空气等非铁磁区域进行网格划分,然而这种方法需要存储和处理稠密的满阵,计算时间很长,矩阵存储需要非常大的存储空间。联合采用MMM和多层自适应交叉近似(MLACA)法虽然可以显著缩减内存需求和计算时间,但对于求解精细划分网格的问题,计算时间还是太长。将具有强大并行计算能力的图形处理单元(GPU)用于加速具有天然良好并行特性的MLACA法,并给出了相应的并行计算格式,实现了舰船磁特征MMM的大规模并行加速计算。典型算例结果表明,GPU并行计算的加速比超过120倍,对于精细划分为100 000薄壳单元的舰船壳体,其计算时间也仅有约4.3 min.采用该方法的计算结果与商业有限元软件相比差别小于1%,为舰船磁场的大规模建模提供了一种快速、精确、简便的数值计算工具。 展开更多
关键词 电磁学 舰船磁场 磁矩量法 多层自适应交叉近似 图形处理单元
下载PDF
CIMS中制造单元的几何造型和图形处理
4
作者 李大生 刘欣 +1 位作者 周济 余俊 《华中理工大学学报》 CSCD 北大核心 1992年第3期6-12,共7页
本文通过考察CIMS中制造单元几何模型的物理相关性,基于凸包理论和形态分析方法,提出了用于CIMS中制造单元几何造型和图形处理的算法及关键技术,包括:三维几何造型,组合体交互式拼装,隐藏线和面的快速消除.算法和关键技术在IBM-PC机上实... 本文通过考察CIMS中制造单元几何模型的物理相关性,基于凸包理论和形态分析方法,提出了用于CIMS中制造单元几何造型和图形处理的算法及关键技术,包括:三维几何造型,组合体交互式拼装,隐藏线和面的快速消除.算法和关键技术在IBM-PC机上实现.文中给出了实例. 展开更多
关键词 CIMS 制造单元 几何造型 图形处理
下载PDF
图形处理中GPU固定渲染管线的研究 被引量:2
5
作者 孟晓宁 王宝华 《集成电路应用》 2018年第2期90-94,共5页
图形渲染管道被认为是实时图形渲染的核心,简称为管道。管道的主要功能是由给定的虚拟摄像机、三维物体、灯源、光照模型、纹理贴图或其他来产生或渲染一个二维图像。由此可见,渲染管线是实时渲染技术的底层工具。图像中物体的位置及形... 图形渲染管道被认为是实时图形渲染的核心,简称为管道。管道的主要功能是由给定的虚拟摄像机、三维物体、灯源、光照模型、纹理贴图或其他来产生或渲染一个二维图像。由此可见,渲染管线是实时渲染技术的底层工具。图像中物体的位置及形状是通过它们的几何描述、环境特征、以及该环境中虚拟摄像机的摆放位置来决定的。物体的外观受到了材质属性、灯源、贴图以及渲染模式(sharding modles)的影响。 展开更多
关键词 图形处理 渲染管道 渲染模式 gpu
下载PDF
卷积神经网络在图形处理GPU芯片上的优化 被引量:2
6
作者 沈恬 胡飞 《集成电路应用》 2017年第6期18-22,共5页
深度学习是人工智能AI的一个重要研究方向。目前,卷积神经网络CNN大量应用于图像分类和识别方面;在图形处理芯片GPU上具有大量的应用场景和加速空间。作者分析了卷积神经网络的算法特点,结合图形处理芯片的硬件特点,进行特定图形处理芯... 深度学习是人工智能AI的一个重要研究方向。目前,卷积神经网络CNN大量应用于图像分类和识别方面;在图形处理芯片GPU上具有大量的应用场景和加速空间。作者分析了卷积神经网络的算法特点,结合图形处理芯片的硬件特点,进行特定图形处理芯片上的优化,比较该So C搭载的CPU,取得了70倍以上的优化。 展开更多
关键词 图形处理芯片 gpu 深度学习 卷积神经网络
下载PDF
“基于GPU的图形处理及其通用计算”专辑征文通知
7
《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2009年第3期375-375,共1页
关键词 通用计算 图形处理 gpu 专辑
下载PDF
时域有限差分法的图形处理单元的加速
8
作者 潘东旭 《山东工业技术》 2014年第24期225-226,238,共3页
时域有限差分法,即FDTD(Finite Difference Time Domain),是计算电磁学的一种重要方法。作为一种天然的并行算法,它的计算过程可以划分为多个同时进行相似计算的子计算。这个方法主要是把麦克斯韦方程在时间上和空间上进行差分化,并且... 时域有限差分法,即FDTD(Finite Difference Time Domain),是计算电磁学的一种重要方法。作为一种天然的并行算法,它的计算过程可以划分为多个同时进行相似计算的子计算。这个方法主要是把麦克斯韦方程在时间上和空间上进行差分化,并且通过时间领域上的更新来模仿电磁场的变化来计算问题,因而有利于解决很多电磁场问题。而图形处理单元即GPU(Graphic Processing Unit)相对于CPU的高性能计算速度以及NVIDA公司生产的GPU特有的高并行结构,为时域有限差分的加速提供了可能。 展开更多
关键词 时域有限差分法 图形处理单元 麦克斯韦方程 并行算法
下载PDF
ARM Mali-300:图形处理单元
9
《世界电子元器件》 2011年第1期31-31,共1页
ARM推出ARM Mall-300图形处理单元(GPU),支持Open GLES2.0,为入门级和中端消费电子设备带来高清(HD)图形性能,适合游戏和高清1080p用户界面。
关键词 图形处理单元 ARM OPEN 图形性能 电子设备 用户界面 入门级
下载PDF
高清移动媒体与娱乐需求增长ARM MALI图形处理单元授权势头不减
10
《信息化纵横》 2009年第16期85-85,共1页
2009年7月30日,ARM公司(伦敦证交所:ARM;纳斯达克:ARMH)宣布与亚洲地区移动技术供应商瑞芯微电子(RockchiD)和Telechips签订了2项ARMMaliTM图形处理单元(GPU)的授权协议。于此同时,ARM也看到在亚洲地区,对于在移动设备上提... 2009年7月30日,ARM公司(伦敦证交所:ARM;纳斯达克:ARMH)宣布与亚洲地区移动技术供应商瑞芯微电子(RockchiD)和Telechips签订了2项ARMMaliTM图形处理单元(GPU)的授权协议。于此同时,ARM也看到在亚洲地区,对于在移动设备上提供高清娱乐以及浏览体验的需求正在快速增长。 展开更多
关键词 图形处理单元 授权协议 需求增长 移动媒体 娱乐 ARM公司 亚洲地区 移动技术
下载PDF
基于可编程图形处理器的实时烟雾控制模拟 被引量:3
11
作者 湛永松 杨明浩 +1 位作者 石民勇 费广正 《工程图学学报》 CSCD 北大核心 2008年第4期60-64,共5页
提出一种基于可编程图形处理器(GPU)有效控制烟雾模拟过程的实时算法。对于给定的烟雾当前状态和目标状态,该算法以自然的烟雾流动方式实现状态之间的转换。根据Navier-Stokes方程定义烟雾流体场的物理模型,通过调整方程中的风力项以达... 提出一种基于可编程图形处理器(GPU)有效控制烟雾模拟过程的实时算法。对于给定的烟雾当前状态和目标状态,该算法以自然的烟雾流动方式实现状态之间的转换。根据Navier-Stokes方程定义烟雾流体场的物理模型,通过调整方程中的风力项以达到控制目的。风力项由驱动力和聚合力组成,驱动力促使烟朝着目标密度分布运动,聚合力则用于抵消烟的扩散现象。烟雾的速度和密度参量被整合为纹理颜色通道,并传送到像素程序中由GPU完成计算。该算法无需保证两状态之间转移为最优,从而消除了非线性优化所带来的计算成本。实验表明该算法能实时高效地模拟两种烟雾状态之间的转换。 展开更多
关键词 计算机应用 烟雾控制模拟 流体力学 纳维-斯托克斯方程 图形处理单元
下载PDF
面向GPU的5G新型无线电的高吞吐率LDPC译码器
12
作者 李荣春 周鑫 +1 位作者 乔鹏 王庆林 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期141-148,共8页
提出了一种基于图形处理单元(graphic processing unit,GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的... 提出了一种基于图形处理单元(graphic processing unit,GPU)的5G软件无线电准循环低密度奇偶校验(low density parity check,LDPC)码译码器,为了节省片上和片下带宽,采用码字缩短和打孔技术、两级量化和数据打包方案,以提升数据带宽的利用率。实验基于Nvidia RTX 2080Ti GPU平台实现了高码率情况下的最小和近似译码算法的并行译码,通过分析GPU上的最优线程设置,将码率为5/6的(2080,1760)LDPC算法的译码吞吐率提升至1.38 Gbit/s,译码吞吐率性能优于现有其他基于GPU的LDPC译码器。 展开更多
关键词 低密度奇偶校验 5G 图形处理单元 软件无线电
下载PDF
基于通用图形处理器的大规模Costas信号脉压处理
13
作者 周斌 叶春茂 +1 位作者 李文雯 宋苗苗 《山东科学》 CAS 2012年第6期47-53,共7页
本文分析了并行Costas信号脉压方法,设计了基于"通用图形处理单元(GPGPU)"的处理模型,并基于"铺路爪"雷达参数实现了Costas信号的方案。该方案在8片Nvidia tesla C1060的异构系统上对5418个通道脉压处理耗时514.3ms... 本文分析了并行Costas信号脉压方法,设计了基于"通用图形处理单元(GPGPU)"的处理模型,并基于"铺路爪"雷达参数实现了Costas信号的方案。该方案在8片Nvidia tesla C1060的异构系统上对5418个通道脉压处理耗时514.3ms,比通用CPU处理系统速度提升574倍。研究结果对新一代异构高性能雷达信号处理系统的设计具有很好的参考意义。 展开更多
关键词 高速雷达信号处理 Costas信号 多速度通道处理 通用图形处理单元
下载PDF
GPU异构计算环境中长短时记忆网络模型的应用及优化
14
作者 梁桂才 梁思成 陆莹 《计算机应用文摘》 2024年第10期37-41,共5页
随着深度学习的广泛应用及算力资源的异构化,在GPU异构计算环境下的深度学习加速成为又一研究热点。文章探讨了在GPU异构计算环境中如何应用长短时记忆网络模型,并通过优化策略提高其性能。首先,介绍了长短时记忆网络模型的基本结构(包... 随着深度学习的广泛应用及算力资源的异构化,在GPU异构计算环境下的深度学习加速成为又一研究热点。文章探讨了在GPU异构计算环境中如何应用长短时记忆网络模型,并通过优化策略提高其性能。首先,介绍了长短时记忆网络模型的基本结构(包括门控循环单元、丢弃法、Adam与双向长短时记忆网络等);其次,提出了在GPU上执行的一系列优化方法,如CuDNN库的应用及并行计算的设计等。最终,通过实验分析了以上优化方法在训练时间、验证集性能、测试集性能、超参数和硬件资源使用等方面的差异。 展开更多
关键词 gpu异构 长短时记忆网络 门控循环单元 ADAM DROPOUT CuDNN
下载PDF
基于GPU和角正交投影视图的多视角投影全息图
15
作者 曹雪梅 张春晓 +4 位作者 管明祥 夏林中 郭丽丽 苗玉虎 曹士平 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第5期536-541,共6页
针对多视角投影全息图生成速度慢的问题,提出一种基于计算机图形处理单元(graphics processing unit,GPU)的多视角投影计算全息图合成方法.获取多个角正交投影视图,充分利用GPU强大的并行计算能力,同时计算多幅投影视图对全息图的作用,... 针对多视角投影全息图生成速度慢的问题,提出一种基于计算机图形处理单元(graphics processing unit,GPU)的多视角投影计算全息图合成方法.获取多个角正交投影视图,充分利用GPU强大的并行计算能力,同时计算多幅投影视图对全息图的作用,即在计算过程中同时将沿着投影方向移位后的一系列角正交投影视图乘以其相应的常数相位因子.其中,每个投影图像的投影角决定了其移位的距离和常数相位因子.将所有并行计算结果累加,可以得到一个包含物体三维信息的二维复矩阵,即菲涅尔全息图.相较于使用计算机中央处理器(central processing unit,CPU)进行计算,本方法显著提升了计算速度,将计算效率提高了30~40倍,为多视角投影全息图的高效生成提供一种可行途径. 展开更多
关键词 信息处理技术 计算全息 全息显示 图形处理单元 角正交投影视图 多视角投影全息
下载PDF
GPU任务调度研究综述
16
作者 李来文 胡韬 邓庆绪 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2800-2807,共8页
本文针对运行在GPU上的任务的管理和调度研究进行了综述,并且把讨论重点放在针对单GPU上的相关研究工作.随着人工智能技术的发展以及相关应用的普及,使得GPU成为加速计算的关键工具.本文首先介绍了GPU的架构和编程模型,然后按照调度粒度... 本文针对运行在GPU上的任务的管理和调度研究进行了综述,并且把讨论重点放在针对单GPU上的相关研究工作.随着人工智能技术的发展以及相关应用的普及,使得GPU成为加速计算的关键工具.本文首先介绍了GPU的架构和编程模型,然后按照调度粒度,从stream级到warp级介绍了多种调度方法的相关研究工作.每个级别的调度方法都旨在提高GPU的性能、资源利用率、可靠性或降低能耗.此外,本文还指出了GPU任务调度面临的挑战以及未来的研究方向,如保障GPU执行时间确定性的软硬件机制研究、结合机器学习的GPU任务调度研究、GPU新架构探索研究以及追求GPU性能和能耗平衡的调度技术研究.本文旨在为研究者们提供一个全面的视角,帮助他们了解GPU任务调度的研究动态和未来的发展方向. 展开更多
关键词 图形处理单元 CUDA gpu多任务 gpu调度
下载PDF
间断Galerkin有限元隐式算法GPU并行化研究
17
作者 高缓钦 陈红全 +1 位作者 贾雪松 徐圣冠 《空气动力学学报》 CSCD 北大核心 2024年第2期21-33,I0001,共14页
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题... 为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel,LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture,CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得的计算结果能与现有的文献或实验数据接近。 展开更多
关键词 间断伽辽金方法 LU-SGS隐式格式 gpu并行化 单元着色分组 EULER方程
下载PDF
无人机载MiniSAR实时成像处理GPU异步优化
18
作者 袁溆东 雒梅逸香 +2 位作者 王智超 谭佳伟 王峰 《上海航天(中英文)》 CSCD 2023年第4期15-24,共10页
合成孔径雷达(SAR)以其全天候、全天时的工作特性及其分辨率不随平台高度变化的成像特性,已成为航天遥感、目标检测领域重要的传感器之一。SAR算法复杂度往往与成像分辨率呈正相关,其中计算量问题成为雷达成像实时性的一大挑战。无人机... 合成孔径雷达(SAR)以其全天候、全天时的工作特性及其分辨率不随平台高度变化的成像特性,已成为航天遥感、目标检测领域重要的传感器之一。SAR算法复杂度往往与成像分辨率呈正相关,其中计算量问题成为雷达成像实时性的一大挑战。无人机载MiniSAR具有小型化、低功耗、灵活性强和隐蔽性强等优点,其小型化使设备计算能力受限,加剧了复杂度与分辨率之间的矛盾。图形处理单元(GPU)和多线程技术发展迅速,为无人机载MiniSAR实时成像提供了平台。本文根据实时处理机数据流和GPU异构系统的特点,提出了一种GPU异步优化方案,该方案可明显提高中央处理单元(CPU)与GPU之间的并行工作效率,节约大部分的数据存取开销。实验结果证明:GPU的成像效率是单CPU系统的12倍左右,在此基础上,使用GPU异步优化方案后效率可继续提升15%左右。本文提出的设计思路可显著缓解无人机载MiniSAR的实时成像计算压力。 展开更多
关键词 合成孔径雷达(SAR) 无人机(UAV) 实时处理 图形处理单元(gpu) 异步优化
下载PDF
3D模型均匀细分算法及其GPU实现方法研究
19
作者 刘轩 黄海于 《电脑知识与技术》 2024年第13期27-30,共4页
3D模型的细分是计算机图形学重要的研究内容,在对较为复杂的3D模型进行高精度细分时,需要进行大量的计算,CPU并不能很好地完成该任务,GPU具有并行架构,计算能力十分强大,因此选择使用GPU对细分算法进行加速,可以极大地提高模型细分的速... 3D模型的细分是计算机图形学重要的研究内容,在对较为复杂的3D模型进行高精度细分时,需要进行大量的计算,CPU并不能很好地完成该任务,GPU具有并行架构,计算能力十分强大,因此选择使用GPU对细分算法进行加速,可以极大地提高模型细分的速度。文章设计了一种3D模型的均匀细分算法:扫描线-栅格填充法。对存储模型信息的文件进行预处理,提取出细分所需要的数据,把对模型的均匀细分转化为对三维空间中若干封闭图形的均匀细分,将整个填充区域栅格化,利用扫描线算法对每个栅格进行填充。文章讨论了该算法在GPU上的实现方法,展示了细分后的网格化3D模型,对比评估了该算法在CPU和GPU上的性能表现,探讨了如何在GPU上获得更好性能的方法。 展开更多
关键词 图形处理 模型细分 gpu并行处理 扫描线-栅格法 网格化模型
下载PDF
基于GPU加速的石墨烯水基分散液的分子动力学模拟
20
作者 黄天浩 万茜 《科技资讯》 2024年第13期87-90,共4页
随着GROMACS软件版本的更新,图形处理单元(Graphics Processing Unit,GPU)对分子动力学模拟的性能影响越来越大。通过比较中央处理器(Central Processing Unit,CPU)和GPU在两种不同硬件设置中的性能,清楚地显示了GPU具有更快、更高效的... 随着GROMACS软件版本的更新,图形处理单元(Graphics Processing Unit,GPU)对分子动力学模拟的性能影响越来越大。通过比较中央处理器(Central Processing Unit,CPU)和GPU在两种不同硬件设置中的性能,清楚地显示了GPU具有更快、更高效的计算优势。采用芘磺酸钠盐(一种小分子分散剂)制备了石墨烯水基分散液,并采用GPU加速进行了高效率的分子动力学模拟。同时,还利用NVT(常数、体积、温度)系综进行初始系统平衡,节省了达到总体平衡的时间。研究结果是通过对分子如何运动以及它们所经历的平均力详细分析得出的,这些分析通过牵引模拟和伞形采样等特定模拟技术获得。这些发现揭示了各种分散剂在石墨烯液相剥离中,特别是在潜在动能陷阱的情况下的独特行为。 展开更多
关键词 分子动力学模拟 图形处理单元 石墨烯水溶液 芘磺酸钠盐
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部