期刊文献+
共找到139篇文章
< 1 2 7 >
每页显示 20 50 100
用图形处理器(GPU)实现矩阵乘法的方法 被引量:1
1
作者 张经宇 《职大学报》 2007年第4期27-29,15,共4页
随着计算机图形处理器(GPU)性能的大幅度提高以及编程接口的发展,人们开始关注通过GPU处理通用计算。通用计算在近年米也成为GPU的应用的发展方向之一。本文将讨论如何使用图形处理器(GPU),通过OPENGL来完成矩阵乘法,并结合实践探讨其... 随着计算机图形处理器(GPU)性能的大幅度提高以及编程接口的发展,人们开始关注通过GPU处理通用计算。通用计算在近年米也成为GPU的应用的发展方向之一。本文将讨论如何使用图形处理器(GPU),通过OPENGL来完成矩阵乘法,并结合实践探讨其发展前景。 展开更多
关键词 图形处理器(gpu) 矩阵乘法 0PENGL
下载PDF
基于平均化理论的PWM变流器电磁暂态快速仿真方法 (三)适用于图像处理器的改进EMTP并行仿真算法 被引量:8
2
作者 高海翔 陈颖 +2 位作者 于智同 许寅 陈来军 《电力系统自动化》 EI CSCD 北大核心 2014年第6期43-48,79,共7页
智能电网技术的发展需要快速电磁暂态程序(EMTP),而日益广泛应用的图像处理器(GPU)为电磁暂态仿真提供了高效的仿真环境和平台。文中首先提出了细粒度并行算法的运算级并行策略,即基于单指令多数据流(SIMD)的运算级并行策略和基于共享... 智能电网技术的发展需要快速电磁暂态程序(EMTP),而日益广泛应用的图像处理器(GPU)为电磁暂态仿真提供了高效的仿真环境和平台。文中首先提出了细粒度并行算法的运算级并行策略,即基于单指令多数据流(SIMD)的运算级并行策略和基于共享内存的运算级并行策略。随后,设计了应用这两种并行策略的改进电磁暂态细粒度并行算法。三相脉宽调制(PWM)变流器仿真测试表明,适用于GPU的细粒度并行算法能够在保证仿真正确性的同时,显著提高仿真效率,从而验证了基于GPU的细粒度并行仿真算法适用于带有开关过程和复杂控制的大规模电力系统快速电磁暂态仿真应用的可行性。 展开更多
关键词 脉宽调制变流器 电磁暂态 细粒度并行 图像处理器(gpu)
下载PDF
计算机图形处理器加速的光学航空影像正射校正 被引量:3
3
作者 全吉成 王平 王宏伟 《光学精密工程》 EI CAS CSCD 北大核心 2016年第11期2863-2871,共9页
提出了计算机图形处理器(GPU)加速的光学航空影像正射校正并行算法,以满足获取光学航空影像对实时性的要求并提高对海量影像数据在CPU上串行正射校正的效率。介绍了光学影像正射校正算法原理以及正射校正算法的并行化处理。为减少GPU执... 提出了计算机图形处理器(GPU)加速的光学航空影像正射校正并行算法,以满足获取光学航空影像对实时性的要求并提高对海量影像数据在CPU上串行正射校正的效率。介绍了光学影像正射校正算法原理以及正射校正算法的并行化处理。为减少GPU执行的计算负载,引入"有效像素区域"概念,设计了改进的GPU并行校正算法。通过配置选择以及存储器访问优化进一步提高了算法的执行效率。最后,分析了GPU并行算法的精度,并验证了噪声干扰对算法的影响。实验结果表明,优化的改进GPU并行算法显著提高了正射校正的速度,影像大小为5 000×5 000时,加速比最高可达CPU串行算法的223倍以上。虽然GPU单精度计算和噪声干扰会使影像校正精度有所下降,但尚在误差允许范围之内。该算法能够快速实现光学航空影像的正射校正,校正后的影像满足实际应用需要。 展开更多
关键词 航空影像 正射校正 计算机图形处理器(gpu) 并行算法 有效像素区域
下载PDF
基于图形处理器的格子Boltzmann方法计算
4
作者 封卫兵 杨晓玲 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第1期66-70,共5页
由于图形处理器(GPU)最近几年迅速发展,基于GPU的计算作为一个新的研究方向已经引起越来越多人的关注.在综述国内外最新文献的基础上,从介绍GPU的高性能开始,分析GPU本身的特性,介绍GPU的计算模型并分析其流水线结构,阐述如何对GPU进行... 由于图形处理器(GPU)最近几年迅速发展,基于GPU的计算作为一个新的研究方向已经引起越来越多人的关注.在综述国内外最新文献的基础上,从介绍GPU的高性能开始,分析GPU本身的特性,介绍GPU的计算模型并分析其流水线结构,阐述如何对GPU进行编程,并初步实现基于GPU的格子Boltzmann方法(LBM)计算. 展开更多
关键词 图形硬件 图形处理器(gpu) 图形流水线 CG
下载PDF
TEB:GPU上矩阵分解重构的高效SpMV存储格式
5
作者 王宇华 张宇琪 +2 位作者 何俊飞 徐悦竹 崔环宇 《计算机科学与探索》 CSCD 北大核心 2024年第4期1094-1108,共15页
稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的... 稀疏矩阵向量乘法(SpMV)是科学与工程领域中一个至关重要的计算过程,CSR(compressed sparse row)格式是最常用的稀疏矩阵存储格式之一,在图形处理器(GPU)平台上实现并行SpMV的过程中,其只存储稀疏矩阵的非零元,避免零元素填充所带来的计算冗余,节约存储空间,但存在着负载不均衡的问题,浪费了计算资源。针对上述问题,对近年来效果良好的存储格式进行了研究,提出了一种逐行分解重组存储格式——TEB(threshold-exchangeorder block)格式。该格式采用启发式阈值选择算法确定合适分割阈值,并结合基于重排序的行归并算法,对稀疏矩阵进行重构分解,使得块与块之间非零元个数尽可能得相近,其次结合CUDA(computer unified device architecture)线程技术,提出了基于TEB存储格式的子块间并行SpMV算法,能够合理分配计算资源,解决负载不均衡问题,从而提高SpMV并行计算效率。为了验证TEB存储格式的有效性,在NVIDIA Tesla V100平台上进行实验,结果表明TEB相较于PBC(partition-block-CSR)、AMF-CSR(adaptive multi-row folding of CSR)、CSR-Scalar(compressed sparse row-scalar)和CSR5(compressed sparse row 5)存储格式,在SpMV的时间性能方面平均可提升3.23、5.83、2.33和2.21倍;在浮点计算性能方面,平均可提高3.36、5.95、2.29和2.13倍。 展开更多
关键词 稀疏矩阵向量乘法(SpMV) 重新排序 CSR格式 负载均衡 存储格式 图形处理器(gpu)
下载PDF
图形处理器通用计算的实现与验证 被引量:3
6
作者 齐记 杨孔庆 杨磊 《计算机工程与应用》 CSCD 北大核心 2009年第33期67-69,共3页
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提... 讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。 展开更多
关键词 图形处理器(gpu) 图形处理器通用计算技术(GPgpu) 中央处理器(CPU)
下载PDF
CPU-GPU协同高性能卫星数传预处理方法
7
作者 张鑫宇 杨甲森 +3 位作者 徐聪 陈志敏 智佳 陈托 《上海航天(中英文)》 CSCD 2023年第4期38-45,共8页
空间数据系统咨询委员会(CCSDS)协议的分层特征对数传预处理的完全并行提出挑战,虚拟信道、应用过程的多路复用为并行处理提供契机。本文面向高性能数传预处理需求,在分析处理性能瓶颈的基础上,提出一种层间流程中央处理器(CPU)控制、... 空间数据系统咨询委员会(CCSDS)协议的分层特征对数传预处理的完全并行提出挑战,虚拟信道、应用过程的多路复用为并行处理提供契机。本文面向高性能数传预处理需求,在分析处理性能瓶颈的基础上,提出一种层间流程中央处理器(CPU)控制、层内瓶颈步骤GPU加速的协同处理新方法。以高级在轨系统(AOS)帧循环冗余校验(CRC)、工程参数提取与物理量转换算法为研究对象,对图形处理器(GPU)线程分配、CPU-GPU协同任务划分进行设计。实验结果表明:方法可实现CRC校验11.4496 GB·s^(-1)、工程参数提取与物理量转换0.9024GB·s^(-1)的处理速率,性能较传统CPU架构提升显著。 展开更多
关键词 卫星 并行处理 数传数据预处理 中央处理器(gpu) 统一计算设备架构(CUDA)
下载PDF
一种基于图形处理器压缩结构的预取结构设计
8
作者 赵士彭 张立志 章隆兵 《高技术通讯》 CAS 2022年第4期351-357,共7页
图形处理器(GPU)访存利用率已经成为影响其性能的关键瓶颈之一。在处理器设计中,访存的预取结构设计成为了提高访存利用率的主要方法之一。结合图形处理器的访存密集的特点,在提高预取性能的前提下,减小影响图形流水线正常效率成为热门... 图形处理器(GPU)访存利用率已经成为影响其性能的关键瓶颈之一。在处理器设计中,访存的预取结构设计成为了提高访存利用率的主要方法之一。结合图形处理器的访存密集的特点,在提高预取性能的前提下,减小影响图形流水线正常效率成为热门的研究方向。本文基于一种图形处理器无损压缩的结构,提出了一套图形处理器的预取结构设计。本预取结构设计可在访存密集型的图形流水线中有效提高访存利用率,并不影响当前图形流水线的效率。实验结果表明,在Godson GPU图形处理器平台上,与传统预取结构相比,针对访存密集型测试程序,cache命中率可以提高15%以上。针对访存空闲的测试程序,该设计不会对流水线产生负面影响。 展开更多
关键词 图形处理器(gpu) 访存子系统 预取结构 压缩结构
下载PDF
一种面向嵌入式图形处理器的访存子系统结构设计
9
作者 赵士彭 张立志 章隆兵 《高技术通讯》 CAS 2022年第2期152-160,共9页
嵌入式图形处理器(GPU)随着访存数据量越来越大,访存子系统在性能、面积及功耗等方面的瓶颈已经日益凸显。针对图形处理器的数据特点及访存需求,考虑到嵌入式图形处理器面积及功耗的约束,结合Godson GPU架构平台,提出了一种面向嵌入式... 嵌入式图形处理器(GPU)随着访存数据量越来越大,访存子系统在性能、面积及功耗等方面的瓶颈已经日益凸显。针对图形处理器的数据特点及访存需求,考虑到嵌入式图形处理器面积及功耗的约束,结合Godson GPU架构平台,提出了一种面向嵌入式图形处理器的访存子系统结构设计。该设计主要针对图形处理流水线的访存特点,对cache的结构进行了优化,并提出了一种基于链表方式的结构,提高了访存的效率,减少了面积且降低了功耗。为了使访存子系统适配并行图形流水线,提出了一种屏幕分区方法,可以在消除cache的一致性问题的同时,使访存子系统的负载更加均衡。该设计为嵌入式图形处理器的访存子系统设计提供了借鉴。 展开更多
关键词 图形处理器(gpu) 访存子系统 嵌入式处理器 链表设计
下载PDF
基于NVIDIA GPU的机载SAR实时成像处理算法CUDA设计与实现 被引量:16
10
作者 孟大地 胡玉新 +2 位作者 石涛 孙蕊 李晓波 《雷达学报(中英文)》 CSCD 2013年第4期481-491,共11页
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SA... 合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR成像处理算法实现方案。该方案解决了GPU显存不足以容纳一景SAR数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C和INTEL E5645上的测试表明,与传统基于GPU的SAR成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。 展开更多
关键词 SAR 实时成像 图形处理器(gpu) 通用并行计算架构(CUDA)
下载PDF
基于GPU的数字图象处理 被引量:6
11
作者 谭久宏 周维超 吴钦章 《科教文汇》 2006年第4X期178-179,共2页
图形处理器(GPU)的飞速发展和革新成为计算机硬件发展的一大亮点。当前的GPU具有一定的并行性和可编程性,在诸如数字图象处理的通用计算领域的应用有着巨大的潜力。本文介绍了GPU发展的一些技术特点,分析和总结了用其实现数字图象处理... 图形处理器(GPU)的飞速发展和革新成为计算机硬件发展的一大亮点。当前的GPU具有一定的并行性和可编程性,在诸如数字图象处理的通用计算领域的应用有着巨大的潜力。本文介绍了GPU发展的一些技术特点,分析和总结了用其实现数字图象处理算法的一些基本途径。 展开更多
关键词 图形处理器(gpu) 可编程性 实时性
下载PDF
EAST运动斯塔克效应诊断数据处理中GPU并行化加速算法的研究 被引量:1
12
作者 智玉琴 黄耀 +7 位作者 符佳 陈颖 王枫 余青江 李颖颖 吴振伟 万宝年 吕波 《核聚变与等离子体物理》 CAS CSCD 北大核心 2020年第1期23-27,共5页
在EAST装置单道运动斯塔克效应(MSE)诊断系统数据处理中,采用CPU(中央处理器)+GPU(图形处理器)异构化模型,实现了数字谐波分析(DHA)算法的并行化加速计算。由CPU完成数据的加载及简单的数学计算,由GPU实现DHA算法的傅里叶正、逆变换及... 在EAST装置单道运动斯塔克效应(MSE)诊断系统数据处理中,采用CPU(中央处理器)+GPU(图形处理器)异构化模型,实现了数字谐波分析(DHA)算法的并行化加速计算。由CPU完成数据的加载及简单的数学计算,由GPU实现DHA算法的傅里叶正、逆变换及滤波等并行化计算,与串行算法相比,获得了2000倍以上的加速,可以满足MSE诊断实验期间及时数据处理的要求。 展开更多
关键词 EAST装置 运动斯塔克效应(MSE)诊断 图形处理器(gpu)计算 并行化加速
下载PDF
GPU上的查询算子的设计与优化
13
作者 冷芳玲 刘军 +1 位作者 吴莹莹 鲍玉斌 《计算机工程与应用》 CSCD 北大核心 2023年第8期81-88,共8页
选择、连接、投影和聚集等是传统关系型数据库中的基本操作。为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子。借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层。数据查询处理过程中存... 选择、连接、投影和聚集等是传统关系型数据库中的基本操作。为了实现关系型数据库在GPU上的查询优化,必须使用相应的GPU算法实现对应的关系算子。借鉴GDB分而治之的分层设计思想将关系代数拆分成算子层和原语层。数据查询处理过程中存在着一些难点问题,如数据传输时延、过度使用共享内存、活跃线程数减少和线程之间数据通信产生的通信时延。针对这些问题,基于较新的Pascal架构实现了查询优化算法,在原有的连接、聚集和条件选择算法原理基础上,对相应的算法进行了设计与优化。提高了每个工作线程的工作负载,实现了内核计算与数据传输之间的延迟隐藏,解决了连接操作中的数据倾斜问题。 展开更多
关键词 图形处理器(gpu) Pascal架构 查询算子 原语操作
下载PDF
基于GPU的子图匹配优化技术
14
作者 李安腾 崔鹏杰 +1 位作者 袁野 王国仁 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第9期1856-1864,共9页
提出高效的基于图形处理器(GPU)的子图匹配算法GpSI,针对主流算法的过滤阶段和连接阶段分别设计优化方案.提出基于复合签名的过滤算法,在过滤阶段利用结点所处局部的数量特征和结构特征提升候选集过滤能力.采用基于候选点的连接策略,在... 提出高效的基于图形处理器(GPU)的子图匹配算法GpSI,针对主流算法的过滤阶段和连接阶段分别设计优化方案.提出基于复合签名的过滤算法,在过滤阶段利用结点所处局部的数量特征和结构特征提升候选集过滤能力.采用基于候选点的连接策略,在连接阶段以最小邻居数为粒度预分配空间,设计高效的集合运算,避免传统方法重复连接的额外开销.多个数据集测试结果表明GpSI较主流GPU子图匹配算法在候选集过滤能力、执行用时、GPU内存占用和稳定性上均有明显优势.在真实数据集测试中,相比GPU友好子图匹配算法,GpSI的执行用时加速2~10倍. 展开更多
关键词 子图同构 数据挖掘 图形处理器(gpu) 并行计算 高性能计算
下载PDF
基于NVIDIA GPU后向投影FFBP算法的加速研究
15
作者 潘丰 高伟 +3 位作者 罗俊 刘文冬 周春元 张慧 《电子测量技术》 北大核心 2023年第22期148-152,共5页
后向投影(BP)算法,在计算成像过程中未采用近似,成像质量高,任何阵列构型成像均适合。近年来在雷达成像技术领域广泛应用。但在毫米波三维全息成像中,计算效率较低,影响了实时成像的实现。在三维极坐标条件下,快速因式分解后向投影(FFBP... 后向投影(BP)算法,在计算成像过程中未采用近似,成像质量高,任何阵列构型成像均适合。近年来在雷达成像技术领域广泛应用。但在毫米波三维全息成像中,计算效率较低,影响了实时成像的实现。在三维极坐标条件下,快速因式分解后向投影(FFBP)算法,利用子孔径划分的方式进行成像,一定程度上解决了实时成像的问题。本文利用四线程CPU与GPU加速CUDA平台实现FFBP算法,并对比分析了多点目标成像,结果基本一致,进而验证加速算法的有效性。进一步,通过电磁仿真软件,对分辨力板建模和仿真,模拟真实目标,并进行GPU加速成像,计算时间比四线程CPU提高33.97倍,适用于三维近场实时成像系统,更好的应用于人体安检领域。 展开更多
关键词 三维极坐标系 FFBP算法 图像处理器(gpu) 子孔径划分
下载PDF
混沌线程池与GPU优化的批量图像加密算法
16
作者 潘明华 王一涵 +1 位作者 谷盛民 孙绍华 《科学技术与工程》 北大核心 2023年第34期14618-14626,共9页
数据量大且冗余度高是数字图像显著的特征,这对大批量图像快速实时加密提出了挑战。为了解决此问题,基于Lorenz混沌加密技术,设计了一种采用线程池与图形处理器(graphics processing unit,GPU)组合优化的批量图像加密算法。该算法通过... 数据量大且冗余度高是数字图像显著的特征,这对大批量图像快速实时加密提出了挑战。为了解决此问题,基于Lorenz混沌加密技术,设计了一种采用线程池与图形处理器(graphics processing unit,GPU)组合优化的批量图像加密算法。该算法通过线程池改进图像的读写,并进行图像镜像变换;利用Lorenz混沌系统生成加密序列,结合图像分块混沌序列进行加密;然后对批量图像数据进行打包,通过GPU进行大批量的异步计算;最后重组图像矩阵得到批量加密图像。实验测试表明,该算法能够有效抵御常见的攻击手段,经过性能优化后的批量数字图像加密算法,可以保证图像安全性;同时,在批量图像读取速率和加解密处理效率方面有显著的提高。 展开更多
关键词 图像加密 混沌系统 并行计算 线程池 图形处理器(graphics processing unit gpu)
下载PDF
大幅宽SAR图像嵌入式舰船实时检测系统设计 被引量:2
17
作者 陆天宇 徐湛 +2 位作者 崔红元 龚昊 王琤 《计算机工程与应用》 CSCD 北大核心 2024年第1期301-309,共9页
针对星载或机载高分辨率合成孔径雷达(synthetic aperture radar,SAR)实时成像后的大幅宽SAR图像舰船实时检测的应用需求,传统的基于FPGA+DSP的嵌入式系统很难同时实现SAR成像处理和基于人工智能技术的大幅宽SAR图像舰船实时检测,为此... 针对星载或机载高分辨率合成孔径雷达(synthetic aperture radar,SAR)实时成像后的大幅宽SAR图像舰船实时检测的应用需求,传统的基于FPGA+DSP的嵌入式系统很难同时实现SAR成像处理和基于人工智能技术的大幅宽SAR图像舰船实时检测,为此设计了一种基于3U VPX FPGA+GPU架构的大幅宽SAR图像嵌入式舰船实时检测系统;提出了一种基于YOLOv5s的舰船检测模型,采用基于L2-范数稀疏性惩罚的缩放因子控制法进行轻量化,轻量化舰船检测模型的参数量减小了47.39%,计算量减少了18.67%,平均检测精度为0.968;将轻量化舰船检测模型应用于大幅宽SAR图像嵌入式舰船实时检测系统,并针对典型的10 km×10 km的大幅宽图像应用场景,设计开发基于多线程技术和基于GPU的众核并行计算技术的大幅宽SAR图像嵌入式实时检测系统软件;通过公开的SAR数据集进行功能验证和性能评估,该系统能够满足不同分辨率的大幅宽SAR图像舰船实时检测需求。 展开更多
关键词 合成孔径雷达(SAR) YOLOv5s 轻量化 图形处理器(gpu) 实时舰船检测
下载PDF
基于GPU的现代并行优化算法 被引量:27
18
作者 张庆科 杨波 +1 位作者 王琳 朱福祥 《计算机科学》 CSCD 北大核心 2012年第4期304-310,F0003,共8页
针对现代优化算法在处理相对复杂问题中所面临的求解时间复杂度较高的问题,引入基于GPU的并行处理解决方法。首先从宏观角度阐释了基于计算统一设备架构CUDA的并行编程模型,然后在GPU环境下给出了基于CUDA架构的5种典型现代优化算法(模... 针对现代优化算法在处理相对复杂问题中所面临的求解时间复杂度较高的问题,引入基于GPU的并行处理解决方法。首先从宏观角度阐释了基于计算统一设备架构CUDA的并行编程模型,然后在GPU环境下给出了基于CUDA架构的5种典型现代优化算法(模拟退火算法、禁忌搜索算法、遗传算法、粒子群算法以及人工神经网络)的并行实现过程。通过对比分析在不同环境下测试的实验案例统计结果,指出基于GPU的单指令多线程并行优化策略的优势及其未来发展趋势。 展开更多
关键词 现代优化算法 图形处理器(gpu) 计算统一设备架构(CUDA) 组合优化 并行计算
下载PDF
基于GPU的液晶自适应光学波前重构计算 被引量:5
19
作者 李大禹 胡立发 +1 位作者 穆全全 宣丽 《光子学报》 EI CAS CSCD 北大核心 2008年第8期1643-1647,共5页
利用GPU进行液晶自适应光学波前重构的加速计算.介绍了液晶自适应光学的Zernike模式波前重构算法,详细论述了GPU的通用架构和GPU实现波前重构的方法,给出了GPU与CPU的实验对比结果.结果表明,GPU计算波前重构不但可以准确无误地计算出液... 利用GPU进行液晶自适应光学波前重构的加速计算.介绍了液晶自适应光学的Zernike模式波前重构算法,详细论述了GPU的通用架构和GPU实现波前重构的方法,给出了GPU与CPU的实验对比结果.结果表明,GPU计算波前重构不但可以准确无误地计算出液晶波前校正器的灰度级分布,计算速度更是传统CPU波前计算的几十倍. 展开更多
关键词 图形处理器(gpu) 液晶 自适应光学
下载PDF
面向指数积分方法的电磁暂态仿真GPU并行算法 被引量:9
20
作者 赵金利 刘君陶 +3 位作者 李鹏 富晓鹏 王成山 宋毅 《电力系统自动化》 EI CSCD 北大核心 2018年第6期113-119,共7页
为满足对大规模可再生能源接入的电力系统进行快速电磁暂态仿真的需求,提出了一种面向指数积分方法的电力系统电磁暂态仿真图形处理器(GPU)并行算法。首先,分析了矩阵指数积分算法求解过程所具有的高度数据并行性,进而将该特性与GPU计... 为满足对大规模可再生能源接入的电力系统进行快速电磁暂态仿真的需求,提出了一种面向指数积分方法的电力系统电磁暂态仿真图形处理器(GPU)并行算法。首先,分析了矩阵指数积分算法求解过程所具有的高度数据并行性,进而将该特性与GPU计算资源相结合;利用GPU处理指数积分方法求解时所需的大规模矩阵运算,而将较为复杂的系统状态判别与更新保留在CPU中完成,有效提升了仿真计算速度。最后,分别针对17台和100台风机的风电场算例进行了测试,验证了所提并行算法的正确性和有效性,同时也说明了算法的加速效果会随着系统规模的增加而愈发明显。 展开更多
关键词 指数积分 电磁暂态仿真 图形处理器(gpu) 并行计算
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部