期刊文献+
共找到857篇文章
< 1 2 43 >
每页显示 20 50 100
新时期“GPU并行计算”课程体系与教学模式设计
1
作者 谭立湘 李斌 郑重 《信息系统工程》 2024年第8期147-150,共4页
为满足新时期人工智能交叉方向人才培养需求,对“GPU并行计算”课程体系与教学模式进行了积极的探索和实践。理论教学方面,夯实并行计算基本理论,强化并行算法设计、GPU并行编程技巧及优化方法。实践教学方面,通过渐进式实验项目的反复... 为满足新时期人工智能交叉方向人才培养需求,对“GPU并行计算”课程体系与教学模式进行了积极的探索和实践。理论教学方面,夯实并行计算基本理论,强化并行算法设计、GPU并行编程技巧及优化方法。实践教学方面,通过渐进式实验项目的反复迭代,帮助学生建立实践经验和应用信心。新体系通过多样的教学模式使学生紧跟并行计算研究的前沿技术。通过鼓励不断创新和探索的课程评价体系使学生能够自觉、自愿地将并行计算应用于科学研究。 展开更多
关键词 gpu并行计算 体系设计 教学模式 评价体系
下载PDF
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
2
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 gpu并行计算 列车-轨道-地基土耦合模型
下载PDF
电力系统全纯嵌入潮流的并行计算
3
作者 李雪 高翔 +2 位作者 姜涛 王长江 李国庆 《电工技术学报》 EI CSCD 北大核心 2024年第18期5839-5854,共16页
潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的... 潮流计算是电力系统规划和运行的基础,全纯嵌入潮流计算方法(HELM)因无需初值且具有全局收敛性,因而在电力系统潮流计算中受到极大关注。然而,采用HELM求解大规模电力系统潮流时,高维幂级数系数线性方程组求解和节点电压的幂级数有理的逼近计算量大、耗时久,是制约HELM计算效率提升的关键。为此,该文提出一种基于稳定双正交共轭梯度(BICGSTAB)和Aitken差分的电力系统全纯嵌入潮流并行计算方法,该方法首先采用近似逆预处理的BICGSTAB法并行迭代求解HELM的高维幂级数系数线性方程组,以快速计算节点电压的各阶幂级数系数;其次,借助Aitken差分法实现所有节点电压幂级数有理逼近值的并行计算;然后,基于CPU-GPU异构平台设计所提算法的并行流程,以实现大规模电力系统潮流的快速求解;最后,通过节点在1 354~13 802的不同规模测试系统对所提方法进行分析、验证。结果表明,所提电力系统潮流全纯嵌入并行计算方法可实现电力系统潮流的准确、快速求解。 展开更多
关键词 全纯嵌入法 潮流计算 Aitken差分法 cpu-gpu异构运算平台 预处理器
下载PDF
任意起伏地形下重力异常三维正演及并行计算
4
作者 戴世坤 朱德祥 +4 位作者 张莹 李昆 陈轻蕊 凌嘉宣 田红军 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期768-780,共13页
为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转... 为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转化为两个一维傅里叶变换,一维傅里叶变换积分离散为多个单元积分累加和,离散单元中原函数采用二次插值形函数拟合,求出单元积分的解析表达式.相比现有的傅里叶变换算法,新方法具有采样灵活、积分精度高、计算速度快和傅里叶变换的截断效应小等优势.利用空间-波数域算法的高度并行性,采用CPU并行求解常微分方程,GPU并行计算任意傅里叶变换,实现了CPU-GPU并行加速方案,进一步提升了本文算法效率.利用常密度模型,对比数值解和解析解,结果表明本文算法正确;利用变密度模型对比了任意傅里叶变换算法与高斯快速傅里叶变换算法的计算效率与精度,在相近的数值精度下,本文算法波数选取少,效率高;测试CPU-GPU并行效果,结果表明相比CPU串行算法,CPU-GPU并行算法的计算效率大大提升,千万数量级节点数模型正演仅耗时数秒.最后利用实际地形数据进行三维重力异常场数值模拟,证明了新方法的高效性与实用性,对实现大规模复杂条件下重力异常精细化反演成像与综合解释有重要意义. 展开更多
关键词 空间-波数域 任意傅里叶变换 三维重力异常正演 cpu-gpu并行
下载PDF
三维连续-非连续并行计算方法及其在岩爆过程模拟中的应用
5
作者 王学滨 杜轩 +3 位作者 薛承宇 陈双印 廖裴彬 余保健 《水资源与水工程学报》 CSCD 北大核心 2024年第1期177-185,共9页
随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方... 随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方法进行了GPU并行加速。为了探索岩爆的机理和过程,模拟了不同静水压力、侧压系数和单元数目(最多达100×10^(4))条件下圆形洞室围岩V形坑的演化规律和单元弹射现象。考察了洞室围岩中裂纹的定量演化规律。研究表明:当静水压力较大时,基于芬纳公式的支护设计偏于不安全。由于V形坑的位置发生改变,V形坑的平均最大深度随着静水压力的增加先缓慢增加后快速增加。关于洞室围岩V形坑的模拟结果能与有关的实验结果、数值结果和现场观测结果吻合。上述研究很好地体现了岩爆并行计算较串行计算和商业软件计算的优势。 展开更多
关键词 岩爆 gpu并行计算 三维连续-非连续方法 V形坑 静水压力 侧压系数 洞室
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
6
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
CPU/GPU协同并行计算研究综述 被引量:95
7
作者 卢风顺 宋君强 +1 位作者 银福康 张理论 《计算机科学》 CSCD 北大核心 2011年第3期5-9,46,共6页
CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GP... CPU/GPU异构混合并行系统以其强劲计算能力、高性价比和低能耗等特点成为新型高性能计算平台,但其复杂体系结构为并行计算研究提出了巨大挑战。CPU/GPU协同并行计算属于新兴研究领域,是一个开放的课题。根据所用计算资源的规模将CPU/GPU协同并行计算研究划分为三类,尔后从立项依据、研究内容和研究方法等方面重点介绍了几个混合计算项目,并指出了可进一步研究的方向,以期为领域科学家进行协同并行计算研究提供一定参考。 展开更多
关键词 异构混合 协同并行计算 gpu计算 性能优化 可扩展
下载PDF
基于GPU的分布式并行CFD计算方法
8
作者 丁一丹 吴之南 +2 位作者 范志君 潘雅欣 汪龙飞 《民用飞机设计与研究》 2024年第2期33-43,共11页
计算流体力学(computational fluid dynamic,简称CFD)是一种通过数值求解控制方程来模拟流体的流动和热传导的方法。在民用飞机设计中,CFD被广泛应用于翼型设计优化、风洞试验验证、全机气动布局优化和燃油消耗评估等领域。这些问题涉... 计算流体力学(computational fluid dynamic,简称CFD)是一种通过数值求解控制方程来模拟流体的流动和热传导的方法。在民用飞机设计中,CFD被广泛应用于翼型设计优化、风洞试验验证、全机气动布局优化和燃油消耗评估等领域。这些问题涉及复杂的湍流、反应流和多相流,涉及到大网格量级计算和大批量状态计算,因此需要大量的计算资源。为了提高计算效率,提出了一种基于图形处理单元(graphic processing unit,简称GPU)的分布式并行计算方法。该方法利用统一计算设备架构(compute unified device architecture,简称CUDA)和消息传递接口技术(message passing interface,简称MPI),在GPU上进行并行计算,并使用MPI在多GPU之间进行通信。该方法实现了计算任务和数据传输的并行化,并进行了多流并行优化和非阻塞通信优化,实现了GPU之间的负载均衡。同时将该方法应用于超音速平板流这个典型的CFD案例中,与CPU串行计算相比,单GPU获取了204倍的加速比,4GPU实现了近640倍的加速比,两节点8GPU获得了900倍以上的加速比。这表明该方法具有较好的并行效率和计算性能,在一定程度上解决了CFD应用的计算资源需求问题。 展开更多
关键词 CFD gpu并行计算 CUDA MPI 分布式
下载PDF
GPU/CPU协同粗粒度并行计算及在城市区域震害模拟中的应用 被引量:4
9
作者 韩博 熊琛 +1 位作者 陆新征 叶列平 《地震工程学报》 CSCD 北大核心 2013年第3期582-589,共8页
采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,... 采用精细结构模型和动力时程分析以提高城市区域建筑震害预测精度已经成为一重要研究方向,而传统的CPU计算平台成本过高,难以推广。本文提出采用基于GPU/CPU协同粗粒度并行计算的方法来实现城市区域建筑震害的高效精细化动力时程计算,可以显著提高效率并降低成本。简述了所采用的程序架构、计算模型、参数选取,对并行计算的效率进行了详细的讨论,并通过一个中等大小城市的案例展示了该方法的优势。 展开更多
关键词 区域震害预测 gpu 集中质量剪切模型 粗粒度并行计算 协同计算
下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:5
10
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
下载PDF
三维精确power图的GPU并行计算
11
作者 肖艳阳 李渭 徐少平 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2023年第12期1958-1965,共8页
power图(加权Voronoi图)的计算是计算机图形学和计算几何等领域的一项基础任务.针对求解三维power图的传统串行方法所需的时间成本较高,且现有并行算法所得结果为近似解,提出一种新颖的GPU并行计算方法.首先给出power图与高一维受限Voro... power图(加权Voronoi图)的计算是计算机图形学和计算几何等领域的一项基础任务.针对求解三维power图的传统串行方法所需的时间成本较高,且现有并行算法所得结果为近似解,提出一种新颖的GPU并行计算方法.首先给出power图与高一维受限Voronoi图的等价构造方法,将Voronoi图的无网格方法直接推广到power图的计算.因此,给定的加权种子点被置于更高一维空间中的一组方格内,据此快速搜索每个种子点的邻居关系,进而使用各个种子点与其若干个邻居的中垂面对各自的power胞元进行并行裁剪,以快速地获取三维空间中的精确power图.对比不同求解域下和5万个种子点的计算耗时,比现有方法具有超过3倍的加速比. 展开更多
关键词 power图 加权Voronoi图 精确计算 并行计算 gpu
下载PDF
列车-轨道-地基土耦合系统三维随机振动的多GPU并行计算方法
12
作者 朱志辉 杨啸 +2 位作者 李昊 徐海坤 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2023年第5期1722-1736,共15页
针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GP... 针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GPU上,采用基于CUDA的预处理共轭梯度法(PCG)并行求解对称正定的等效静力平衡方程。针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(CSR)格式存储大型稀疏矩阵以节省内存空间。最终通过MATLAB-CUDA混合平台开发并行计算程序,解决了随机振动分析中多个线性方程组串行求解效率低的难题。数值算例表明,基于四GPU节点的多GPU并行算法和单GPU加速PCG算法的计算效率是串行多点同步算法(MPSA)计算效率的22.59倍和3.75倍。 展开更多
关键词 随机振动 并行计算 gpu 三维有限元法 列车-轨道-地基土耦合模型
下载PDF
面向多核CPU与GPU平台的图处理系统关键技术综述
13
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核cpu与gpu平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
下载PDF
海量地震数据叠前逆时偏移的多GPU联合并行计算策略 被引量:9
14
作者 孔祥宁 张慧宇 +1 位作者 刘守伟 李晶晶 《石油物探》 EI CSCD 北大核心 2013年第3期288-293,共6页
叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场... 叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场重构的策略降低了存储需求;针对其计算量巨大的问题,利用了图形处理器(Graphic Processing Unit,GPU)进行并行计算,并与中央处理器(Central Processing Unit,CPU)结合实现协同并行处理;同时采用GPU多卡联合策略解决GPU显存不足的瓶颈。实际资料试验处理结果表明,上述技术措施能够在保证RTM高精度成像优势的基础上极大地提高计算效率,为应用RTM处理海量地震数据提供了良好的技术支持。 展开更多
关键词 叠前逆时深度偏移 计算效率 gpu cpu 并行计算 实用性
下载PDF
CPU/GPU异构混合并行的栅格数据空间分析研究——以地形因子计算为例 被引量:9
15
作者 卢敏 王金茵 +2 位作者 卢刚 陶伟东 王结臣 《计算机工程与应用》 CSCD 北大核心 2017年第1期172-177,共6页
海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的... 海量数据背景下传统GIS栅格数据空间分析计算效率已经不能满足快速计算的需求,为此以地形因子计算为例,分析并测试了基于共享内存模型的CPU多核并行模式与基于流处理器模型的GPU众核并行模式的计算性能,在此基础上详细实现了负载均衡的设备间任务划分,进行CPU与GPU异构混合的并行技术改良研究。实验结果表明,基于相同的单机硬件环境,与多核共享内存模型或众核流处理器的单一计算平台并行方案相比,CPU/GPU异构混合并行计算方法对于栅格数据分析具有更好的加速效果。 展开更多
关键词 GIS栅格数据分析 共享内存模型 流处理器模型 cpu/gpu异构混合并行
下载PDF
基于GPU并行计算的浅水波运动数值模拟 被引量:13
16
作者 许栋 徐彬 +2 位作者 David PAyet 白玉川 及春宁 《计算力学学报》 CAS CSCD 北大核心 2016年第1期113-120,共8页
利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相... 利用有限体积法求解描述水流运动的二维浅水方程组,模拟洪水波运动传播过程,并通过GPU并行计算技术对程序进行加速,建立了浅水运动高效模拟方法。数值模拟结果表明,基于本文提出的GPU并行策略以及通用并行计算架构(CUDA)支持,能够实现相比CPU单核心最高112倍的加速比,为利用单机实现快速洪水预测以及防灾减灾决策提供有效支撑。此外,对基于GPU并行计算的浅水模拟计算精度进行了论证,并对并行性能优化进行了分析。利用所建模型模拟了溃坝洪水在三维障碍物间的传播过程。 展开更多
关键词 洪水波 二维浅水方程组 gpu并行计算 CUDA
下载PDF
GPU并行计算加速的实时可视外壳三维重建及其虚实交互 被引量:13
17
作者 邵绪强 聂霄 王保义 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第1期52-61,共10页
针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建... 针对现有的基于图像的三维重建方法难以实现真实物体的快速三维重建,无法满足虚实交互等应用需求的问题,提出一种基于GPU并行计算的实时三维重建及其虚实交互方法.首先把物体所在空间剖分成具有数据独立性的体素集合,结合可视外壳重建算法和精确行进立方体算法并行遍历每个体素得到体素状态序列;然后并行压缩体素状态序列得到非空体素集合,对非空体素进行并行三角形网格化,并利用图形硬件的多重纹理映射和可编程功能进行基于像素的纹理映射;最后假定虚拟物体的粒子为运动受限的拉格朗日流体粒子,重建物体网格顶点为流体边界,通过流体动力学方程的并行光滑粒子动力学方法求解来计算虚实交互.实验结果表明,该方法在GPU上进行完全并行求解,在32×32×32的空间剖分精度下,实现了实时三维重建和20帧/s左右的虚实交互计算,适用于计算机图形学和虚拟现实等领域中的虚实交互应用. 展开更多
关键词 可视外壳 三维重建 gpu并行计算 虚实交互 实时模拟
下载PDF
CPU-OpenMP和GPU-CUDA并行计算技术对矩阵乘法运算的加速效果分析 被引量:1
18
作者 张岩 《科技视界》 2017年第26期45-47,共3页
本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,... 本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差。结果表明,GPUCUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算。 展开更多
关键词 矩阵乘法 并行计算 cpu-OpenMP gpu-CUDA
下载PDF
虚拟化环境下多GPU并行计算研究 被引量:5
19
作者 闵芳 张志先 张玉洁 《微电子学与计算机》 CSCD 北大核心 2016年第3期69-75,共7页
针对大规模计算任务场景,提出在虚拟化环境下多GPU并行计算的实现方案,使用多线程或流处理的方式实现多GPU并行计算,并分析GPU多层次存储结构、传输等方面内容,采用经典的蒙特卡罗方法这一具有代表性的科学计算实例进行实验验证.
关键词 gpu通用计算 虚拟化 并行计算 蒙特卡罗
下载PDF
一种基于GPU并行计算的无人机影像快速镶嵌方法 被引量:2
20
作者 李朋龙 丁忆 +3 位作者 胡艳 罗鼎 段松江 舒文强 《国土资源遥感》 CSCD 北大核心 2017年第4期57-63,共7页
提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人... 提出了一种从匀光后无人机影像出发,以Voronoi图为镶嵌线网络,基于GPU并行计算的无人机影像快速镶嵌方法。首先,通过Wallis滤波处理影像间色彩不一致问题;然后,以测区影像位置自动生成Voronoi图镶嵌线网络;最后,基于GPU并行计算将无人机影像快速正射纠正并镶嵌。通过对230张空间分辨率为0.1 m的无人机影像进行快速纠正镶嵌,实验结果表明,该方法较传统方法效率有很大提升。 展开更多
关键词 影像匀光 无人机影像 正射纠正 影像镶嵌 gpu并行计算
下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部