期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
1
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 gpu并行计算 列车-轨道-地基土耦合模型
下载PDF
列车-轨道-地基土耦合系统三维随机振动的多GPU并行计算方法
2
作者 朱志辉 杨啸 +2 位作者 李昊 徐海坤 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2023年第5期1722-1736,共15页
针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GP... 针对列车-轨道-地基土耦合系统随机计算效率低的问题,本文提出了基于多GPU的列车-轨道-地基土随机振动方程的高效并行计算方法。基于OpenMP-CUDA混编技术将虚拟激励法不同频点下的多个线性方程组求解任务分配给多个GPU并行执行;在每块GPU上,采用基于CUDA的预处理共轭梯度法(PCG)并行求解对称正定的等效静力平衡方程。针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(CSR)格式存储大型稀疏矩阵以节省内存空间。最终通过MATLAB-CUDA混合平台开发并行计算程序,解决了随机振动分析中多个线性方程组串行求解效率低的难题。数值算例表明,基于四GPU节点的多GPU并行算法和单GPU加速PCG算法的计算效率是串行多点同步算法(MPSA)计算效率的22.59倍和3.75倍。 展开更多
关键词 随机振动 并行计算 gpu 三维有限元法 列车-轨道-地基土耦合模型
下载PDF
CPU/GPU协同计算在频率域二维全波形反演中的应用 被引量:2
3
作者 王小青 谭捍东 许自龙 《CT理论与应用研究(中英文)》 2016年第1期23-32,共10页
全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并... 全波形反演利用波场的运动学和动力学信息重建地下物理参数,是建立高精度速度模型的有效手段,巨大的计算量是制约其实用化的瓶颈之一。本文针对全波形反演中频率域正演的复杂计算问题,采用粗细结合的并行策略,将MPI技术应用于多炮间并行计算,同时利用GPU技术加速正演过程中大型稀疏线性代数方程组的求解,以提高频率域全波形反演的计算效率。通过理论模型验证本文方法的正确性和有效性,给出不同数据量与GPU计算效率的相关分析结论,提出频率域全波形反演CPU/GPU协同并行计算的制约瓶颈和发展方向。 展开更多
关键词 频率域正演 稀疏矩阵 BI-CGSTAB cpu/gpu协同计算
下载PDF
基于GPU的车辆-轨道-地基土耦合系统3D随机振动并行计算方法 被引量:2
4
作者 朱志辉 夏禹涛 +1 位作者 王力东 刘禹兵 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第7期79-88,共10页
针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理... 针对轨道不平顺随机特征导致车辆-轨道-地基土耦合系统随机分析计算效率低的问题,采用虚拟激励法降低大样本分析的计算量;针对耦合系统等效刚度矩阵的稀疏特性,采用行压缩(Compressed Sparse Row,CSR)格式存储大型稀疏矩阵,采用预处理共轭梯度法(Preconditioned Conjugate Gradient,PCG)求解对称正定的等效静力平衡方程,最后通过MATLAB-CUDA(Compute Unified Device Architecture)混合平台开发基于GPU的并行计算程序.数值算例表明:基于MATLAB-CUDA混合平台求解等效静力平衡方程的效率是串行多点同步算法的86.13倍,大大缩短了随机振动分析的总计算时间,且内存占用小、易于在个人计算机上实施;采用PCG法求解车辆-轨道-地基土耦合系统形成的大型稀疏线性方程组时,建议以加速度指标作为迭代收敛精度的控制指标;可通过选取适当的迭代收敛精度,以达到计算精度和计算效率的平衡. 展开更多
关键词 随机振动 gpu并行计算 3D有限元法 虚拟激励法 车辆-轨道-地基土耦合模型
下载PDF
一种CPU-GPU协同计算的三维地形实时渲染算法 被引量:9
5
作者 郭向坤 林浒 +1 位作者 刘继申 王鸿亮 《小型微型计算机系统》 CSCD 北大核心 2018年第4期825-829,共5页
提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模... 提出一种基于Open CL的CPU-GPU协同计算的大规模地形实时渲染算法,该算法侧重于把批LOD模型的构建从CPU移植到GPU.CPU主要负责把外存中的数据块实时调度到内存中,并把相应的地形块载入GPU中的显存.GPU负责利用Open CL平台并行构建LOD模型.为了避免相邻LOD模型出现裂缝,利用地形块的裂缝检测和删除顶点的方法消除裂缝;为了解决两个LOD层次的转换过程中出现地表突跳现象,采用morphing方法实现地形的平滑过渡.实验结果表明,该算法将大量的几何计算移植到GPU上并行计算,降低了CPU的计算负载,提高了LOD模型的构建效率,加快了场景的渲染速度. 展开更多
关键词 OPENCL cpu—gpu协同计算 LOD模型 平滑过渡
下载PDF
支持CPU+GPU协同计算的C源程序预处理划分策略
6
作者 姚鼎 曾国荪 丁春玲 《计算机应用》 CSCD 北大核心 2013年第A02期67-72,76,共7页
GPU技术的兴起为构建高性能异构协调计算平台提供了一个新的有效途径,针对如何在CPU+GPU并存的环境下,设计高效的应用程序以更好地发挥GPU技术,开展支持CPU+GPU协同计算的C源程序预处理划分策略研究。从计算任务的C语言源程序出发,分析... GPU技术的兴起为构建高性能异构协调计算平台提供了一个新的有效途径,针对如何在CPU+GPU并存的环境下,设计高效的应用程序以更好地发挥GPU技术,开展支持CPU+GPU协同计算的C源程序预处理划分策略研究。从计算任务的C语言源程序出发,分析程序的内存访问、运算密度、流程控制结构、数据并行性等各种特征,同时考虑CPU和GPU的特点和差异,以此作为关键依据,对C源程序进行预处理,给出划分和标识程序段适合CPU或GPU执行的策略和算法。此外,以传统典型程序为测试用例开展实验。实验结果表明,策略和算法具有一定的有效性,在一定程度上提升了计算的效率。 展开更多
关键词 协调计算 cpu+gpu C源程序 划分策略
下载PDF
关于CPU+GPU异构计算的研究与分析 被引量:5
7
作者 许桢 《科技信息》 2010年第17期I0097-I0097,I0014,共2页
在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是... 在PC技术领域,CPU和GPU始终是相辅相成,在二者已经发展到出现新的瓶颈时,"结合"也许是明智的解决方案,而关于整合CPU和GPU的方案就一直被人们所津津乐道。本文研究了CPU+GPU的异构化计算算法的优势和未来应用的可能性,特别是随着通用计算程序接口(OpenCL)的发布,CPU+GPU的异构化计算这种看起来像是CPU和GPU混合体的出现,相信这将使计算机处理器又将迈上一个新台阶,这种异构化成就的是更加高性能,更加高性价比的处理器,而这必将掀起GPU和CPU革命的高潮。 展开更多
关键词 中央处理器(cpu) 图形处理器(gpu) 整合 异构计算
下载PDF
松耦合组件式GPU生态迁移适配系统研究
8
作者 邓玲 《通信世界》 2023年第23期41-43,共3页
在英伟达GPU芯片进口受限的大环境下,AI-GPU算力芯片及其他算力芯片的国产化替代,是当前我国AI产业发展的必经之路。虽然当前国内各大厂商都推出了各具特色的GPU芯片,但英伟达公司在长期发展过程中构建了除算力芯片外的CUDA(Compute Uni... 在英伟达GPU芯片进口受限的大环境下,AI-GPU算力芯片及其他算力芯片的国产化替代,是当前我国AI产业发展的必经之路。虽然当前国内各大厂商都推出了各具特色的GPU芯片,但英伟达公司在长期发展过程中构建了除算力芯片外的CUDA(Compute Unified Device Architecture,统一计算架构)软件生态,这也构成了英伟达GPU芯片的核心竞争力。 展开更多
关键词 统一计算架构 gpu 组件式 国产化替代 耦合 核心竞争力 适配系统 AI
下载PDF
关于CPU+GPU异构计算模式程序开发中编程方法研究 被引量:1
9
作者 石林 《科学大众(智慧教育)》 2014年第10期149-149,共1页
与传统的单纯以CPU作为计算部位的同构计算系统相比,CPU+GPU异构计算模式程序优势更加明显,本文主要研究CPU+GPU异构计算模式程序开发中编程方法,总结各种方法的优缺点,希望能为相关人员带来一些帮助。
关键词 异构计算 编程 cpu gpu
下载PDF
CPU/GPU异构计算应用于核电模拟机的可行性 被引量:1
10
作者 王旭 吴帆 +1 位作者 章旋 骆邦其 《计算机应用》 CSCD 北大核心 2014年第A02期73-77,共5页
根据ANSI/ANS-3.5-1998规定以及核电厂建模精度的提高,对核电模拟机仿真速度提出了更高的要求。但是目前已难以通过提升中央处理器(CPU)频率的方式来提升现有模拟机的运算速度。与此同时,CPU/GPU异构计算融合了串行/并行计算,利用显卡(G... 根据ANSI/ANS-3.5-1998规定以及核电厂建模精度的提高,对核电模拟机仿真速度提出了更高的要求。但是目前已难以通过提升中央处理器(CPU)频率的方式来提升现有模拟机的运算速度。与此同时,CPU/GPU异构计算融合了串行/并行计算,利用显卡(GPU)的并行计算能力可极大提升现有桌面电脑的运算能力,目前已经广泛应用于科学研究。英伟达公司的CUDA平台被用于开发CPU/GPU异构计算应用程序,来提升核电厂全范围模拟机的仿真计算。通过核电厂全范围模拟机运行测试对比,证实使用CPU/GPU异构计算程序,能有效提升模拟机运行速度。 展开更多
关键词 cpu/gpu异构计算 核电 仿真 可行性 模拟机
下载PDF
基于GPU高性能计算的AIS大数据分析应用研究
11
作者 毛新健 吕旭炜 《航海》 2023年第5期25-28,共4页
AIS作为目前航行船舶应用最为普及的导助航系统,针对AIS大数据进行分析无疑是航运数据研究的重要方向。然而基于传统的CPU大数据计算,存在着效率低下的缺陷,使得AIS大数据应用受限。近年来,GPU图形处理技术因其强大的并行计算能力和较... AIS作为目前航行船舶应用最为普及的导助航系统,针对AIS大数据进行分析无疑是航运数据研究的重要方向。然而基于传统的CPU大数据计算,存在着效率低下的缺陷,使得AIS大数据应用受限。近年来,GPU图形处理技术因其强大的并行计算能力和较为低廉的价格优势,在大数据计算领域得到了快速推广。本文研究基于GPU替代CPU对AIS大数据进行计算,从而实现AIS大数据的高效能应用。 展开更多
关键词 gpu cpu AIS 计算
下载PDF
CPU+GPU的异构计算系统在石油勘探中的应用研究 被引量:1
12
作者 王永胜 《电脑知识与技术(过刊)》 2017年第10X期250-251,254,共3页
在计算机技术领域中,CPU和GPU两者是相辅相成的,在CPU和GPU发展过程中遇到了各种瓶颈,要相对该种瓶颈进行解决,就要将两者相互结合进行实现,并且关于CPU和GPU两者相互结合的方案一直被相关人员所重视和研究。基于此,该文就对CPU和GPU两... 在计算机技术领域中,CPU和GPU两者是相辅相成的,在CPU和GPU发展过程中遇到了各种瓶颈,要相对该种瓶颈进行解决,就要将两者相互结合进行实现,并且关于CPU和GPU两者相互结合的方案一直被相关人员所重视和研究。基于此,该文就对CPU和GPU两者的联合异构计算系统进行分析,两者的结合能够有效提高处理器的性能,并且还能够提高处理器的性价比,促进计算机处理器能够迈向全新的台阶,之后对CPU+GPU异构计算系统在石油勘探中的应用进行了研究。 展开更多
关键词 cpu gpu 异构计算机系统 石油勘探
下载PDF
CPU被淘汰?GPU未来将用于通用计算处理
13
《系统工程与电子技术》 EI CSCD 北大核心 2007年第6期949-949,共1页
关键词 gpu cpu NVIDIA 计算 通用 运算能力 X86架构 价格比
下载PDF
基于CPU+GPU异构计算编程研究
14
作者 邱浩淼 《科学技术创新》 2020年第1期74-75,共2页
本文分析了CPU+GPU异构编程方式及其在计算系统编程上的困境,需要考虑CPU模式中的X86编程习惯,双精度性能有限,提出了目前采用的程序开发方式,包括底层图形API的开发方式,低层次抽象的轻量级编程工具,高层次抽象函数库与模板库等,分析... 本文分析了CPU+GPU异构编程方式及其在计算系统编程上的困境,需要考虑CPU模式中的X86编程习惯,双精度性能有限,提出了目前采用的程序开发方式,包括底层图形API的开发方式,低层次抽象的轻量级编程工具,高层次抽象函数库与模板库等,分析目前编程方法运用的适用场合及其中的局限性,为CPU+GPU异构计算的编程方法研究提供了一定的参考意见。 展开更多
关键词 cpu+gpu异构 计算编程 底层图形API 函数库
下载PDF
巴塞隆纳超级运算中心建置全球首款ARM架构CPU/GPU混合型超级计算机
15
《电子与电脑》 2011年第12期104-104,共1页
NVIDIA宣布,巴塞隆纳超级运算中心(BSC)现正开发一款全新的混合型超级计算机,将是有史以来第一次运用节能、低功耗的NVIDIATegraARMCPU,加上高效能NVIDIACUDA绘图处理器所建置的超级计算机。
关键词 超级计算 混合型 运算 gpu cpu ARM 架构 NVIDIA
下载PDF
融合CPU、GPU特点,MVP满足并行计算和移动计算需求
16
作者 梅思行 《集成电路应用》 2011年第1期39-41,共3页
MVP处理器在一个真正集成的架构上,灵活地将CPU、GPU与GPGPU实行动态分配运作,从本质上将此两种核心处理器融于一种崭新的并行计算处理器中,从而满足移动互联网终端的性能要求。
关键词 并行计算 cpu gpu MVP 移动计算 核心处理器 移动互联网 动态分配
下载PDF
基于CPU/GPU异构并行计算优化的3D实时渲染
17
作者 张大勇 陈绍瑜 《中国传媒科技》 2016年第2期118-121,共4页
1.引言 随着半导体工艺、功耗、大规模集成电路技术的不断进步,单个芯片上集成了越来越多的晶体管(可达10亿),但受到CMOS制造工艺特征的限制,单个芯片的主频已无过大的提升空间(仅有少数芯片可达5GHz以上的时钟速率)。换句话说,除... 1.引言 随着半导体工艺、功耗、大规模集成电路技术的不断进步,单个芯片上集成了越来越多的晶体管(可达10亿),但受到CMOS制造工艺特征的限制,单个芯片的主频已无过大的提升空间(仅有少数芯片可达5GHz以上的时钟速率)。换句话说,除非芯片制造工艺有所突破,否则单个芯片的主频不会再有提高。随着晶体管集成工艺进入瓶颈,多核、众核并行计算逐渐成为计算性能提升的主要途径; 展开更多
关键词 并行计算 cpu/gpu 半导体工艺 实时渲染 纹理贴图 异构系统 时钟速率 流处理器 反锯齿 多分辨率
下载PDF
基于GPU/CPU叠前逆时偏移研究及应用 被引量:14
18
作者 刘文卿 王宇超 +4 位作者 雍学善 王孝 邵喜春 高厚强 刘秋良 《石油地球物理勘探》 EI CSCD 北大核心 2012年第5期712-716,844+676,共5页
本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协... 本文基于GPU/CPU协同系统,将计算量最大的波场逆时外推通过GPU实现,并利用随机速度边界的思路提高波场外推算法的并行性,解决了大规模存储的I/O问题。通过优化拉普拉斯算子压制由互相关成像条件引入的低频噪声。数值试验表明,GPU/CPU协同系统的计算效率非常高,在实际应用中取得良好的成像效果和时效比。理论模型试算和实际盐丘数据的处理验证了算法的正确性。 展开更多
关键词 逆时偏移 波动方程 成像条件 gpu/cpu协同计算 随机速度边界
下载PDF
海量地震数据叠前逆时偏移的多GPU联合并行计算策略 被引量:9
19
作者 孔祥宁 张慧宇 +1 位作者 刘守伟 李晶晶 《石油物探》 EI CSCD 北大核心 2013年第3期288-293,共6页
叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场... 叠前逆时深度偏移(Pre-stack Reverse-time Depth Migration,RTM)是一种全波场成像方法。由于其实现过程存在着存储量、计算量庞大以及成像噪声等问题,难以适应实际生产的需求,使得该方法一直没有在工业界得到广泛的应用。采用震源波场重构的策略降低了存储需求;针对其计算量巨大的问题,利用了图形处理器(Graphic Processing Unit,GPU)进行并行计算,并与中央处理器(Central Processing Unit,CPU)结合实现协同并行处理;同时采用GPU多卡联合策略解决GPU显存不足的瓶颈。实际资料试验处理结果表明,上述技术措施能够在保证RTM高精度成像优势的基础上极大地提高计算效率,为应用RTM处理海量地震数据提供了良好的技术支持。 展开更多
关键词 叠前逆时深度偏移 计算效率 gpu cpu 并行计算 实用性
下载PDF
基于CPU与GPU/CUDA的数字图像处理程序的性能比较 被引量:4
20
作者 岳俊 邹进贵 何豫航 《地理空间信息》 2012年第4期45-47,180,共3页
测绘系统通常有大量图像处理工作,而户外图像采集系统更需要极高的实时性。通过对GPU与CPU分别进行数字图像处理性能测试,结果表明GPU并行计算可以大幅提高图像处理性能:可优化图像预处理、后处理速度,使测绘系统更加实时高效。
关键词 cpu gpu CUDA 并行计算 数字图像处理
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部