期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于图形处理器加速光线投射算法的多功能体绘制技术 被引量:2
1
作者 吕晓琪 张传亭 +1 位作者 侯贺 张宝华 《计算机应用》 CSCD 北大核心 2014年第1期135-138,178,共5页
为克服传统算法中体绘制交互速度不流畅、重建耗时长、绘制效果单一的不足,实现了基于图形处理器(GPU)的光线投射算法用于医学层析图像实时体绘制,并能快速切换不同组织器官的绘制效果。首先,读入医学层析图像到计算机内存,构造体素;然... 为克服传统算法中体绘制交互速度不流畅、重建耗时长、绘制效果单一的不足,实现了基于图形处理器(GPU)的光线投射算法用于医学层析图像实时体绘制,并能快速切换不同组织器官的绘制效果。首先,读入医学层析图像到计算机内存,构造体素;然后,设置相应体素属性(如插值方式、着色处理、光照参数)等,设计显示不同组织器官的颜色及不透明度传输函数;最后,GPU加载体素据并进行光线投射算法的计算。实验结果表明,在绘制速度上,GPU加速光线投射算法实现的多功能体绘制技术的绘制速度能达到每秒40帧以上,完全满足临床应用需求。在绘制质量上,用户交互中由于重采样而产生的锯齿现象明显低于CPU端实现的光线投射算法,GPU端与CPU端绘制时间的加速比在9倍左右。 展开更多
关键词 图形处理器加速 层析图像 光线投射 体绘制 传输函数
下载PDF
基于DSMI算法和GPU加速的大规模视频检索系统 被引量:1
2
作者 钟煜 朱敏 +1 位作者 陈雪 高宇 《计算机应用研究》 CSCD 北大核心 2011年第11期4373-4375,共3页
本视频检索系统围绕如何处理大规模数据和在线实时检索来展开研究。基于互信息量的镜头边界检测算法检索性能较好,但计算量较大,针对此问题,提出了一种基于动态滑动窗口算法与互信息量相结合的分割算法(DSMI算法),系统运用GPU的并行计... 本视频检索系统围绕如何处理大规模数据和在线实时检索来展开研究。基于互信息量的镜头边界检测算法检索性能较好,但计算量较大,针对此问题,提出了一种基于动态滑动窗口算法与互信息量相结合的分割算法(DSMI算法),系统运用GPU的并行计算能力来实现加速检索。实验结果表明,DSMI算法能够加快系统中镜头边界检测的运行效率;同时GPU加速使用户在线检索时间成功达到20倍加速比,满足了项目的实时性要求,具有较高的可扩展性。 展开更多
关键词 大规模视频检索 动态滑动窗口 互信息量 图形处理器加速
下载PDF
异构系统结构力学计算GPU加速性能分析与应用
3
作者 郭培卿 陈小龙 《计算机应用》 CSCD 北大核心 2014年第A01期78-81,共4页
高性能计算领域利用GPU加速计算已逐渐发展成为主流应用的普遍功能之一。主流结构力学应用ABAQUS支持GPU通用计算,充分发挥GPU的高性能浮点运算能力与访存带宽,提高软件求解效率。介绍了ABAQUS软件对GPU加速应用的发展历程,在上海超级... 高性能计算领域利用GPU加速计算已逐渐发展成为主流应用的普遍功能之一。主流结构力学应用ABAQUS支持GPU通用计算,充分发挥GPU的高性能浮点运算能力与访存带宽,提高软件求解效率。介绍了ABAQUS软件对GPU加速应用的发展历程,在上海超级计算中心三种不同的异构环境下,针对实际算例的GPU加速性能进行了测试,建立计算效率分析方法,分析GPU加速对求解时间、系统资源调用、软件并行效率的影响,并针对采用隐式方法求解百万量级自由度问题时资源的合理使用提出建议。 展开更多
关键词 计算机辅助工程 结构力学 ABAQUS 图形处理器加速 高性能计算
下载PDF
基于预处理共轭梯度迭代法的电力系统状态估计算法 被引量:7
4
作者 李建斌 王鹏程 +2 位作者 傅侃 方睿 董树锋 《电力系统自动化》 EI CSCD 北大核心 2021年第14期90-96,共7页
随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代... 随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代过程中矩阵乘法和线性方程组求解耗时较长的特点,根据Krylov子空间方法中共轭梯度法的思想,设计了一种基于预处理共轭梯度迭代法的电力系统状态估计算法。该方法采用不完全LU分解法对原始线性方程组进行预处理,并采用图形处理器(GPU)并行加速技术对矩阵乘法、线性方程预处理和共轭梯度法迭代进行加速。算例分析表明了文中方法加速效果明显,内存和显存占用较低,经过不完全LU分解法预处理的线性方程组迭代次数少,能够满足大规模电力系统状态估计的实时性要求。 展开更多
关键词 状态估计 共轭梯度法 不完全LU分解 图形处理器并行加速
下载PDF
GPU加速的傅里叶变换轮廓术并行计算方法 被引量:1
5
作者 赵小敏 周波 +1 位作者 刘春媛 陶金 《机械制造与自动化》 2013年第2期141-144,共4页
傅里叶变换轮廓术需要在高分辨率图像上进行相位计算,其耗时较长,不能满足实时处理的要求。相位计算时其待处理的和已处理的数据都是相对独立的图像像素,且计算密度极大,适于并行计算。因此,利用图形处理器的多线程并行处理能力,在GPU... 傅里叶变换轮廓术需要在高分辨率图像上进行相位计算,其耗时较长,不能满足实时处理的要求。相位计算时其待处理的和已处理的数据都是相对独立的图像像素,且计算密度极大,适于并行计算。因此,利用图形处理器的多线程并行处理能力,在GPU上实现了相位的并行计算,解决了在CPU上相位计算速度较慢的问题。实验表明在相位计算质量相同的情况下,经过GPU加速获得了相对于CPU一到两个数量级的加速比,为将傅里叶变换轮廓术应用于实时三维测量奠定了坚实的基础。 展开更多
关键词 图形处理器加速 并行计算 傅里叶变换轮廓术 统一计算设备架构 计算相位
下载PDF
大规模输配一体化系统牛顿法潮流计算性能分析及改进方法 被引量:16
6
作者 唐坤杰 董树锋 +1 位作者 朱炳铨 宋永华 《电力系统自动化》 EI CSCD 北大核心 2019年第6期92-101,共10页
为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不... 为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不完全三角分解法预处理雅可比矩阵,有效地保证了数值稳定性,提高了牛顿法的收敛性能。针对输配电网一体化后规模庞大、计算效率低等问题,利用图形处理器并行加速技术对算法中的一些计算量密集的步骤,包括雅可比矩阵的生成、矩阵—向量运算等进行加速处理。算例测试表明,该算法能够显著提高大规模输配电网一体化潮流计算的速度和精度,对于多配电网区域、环网、分布式电源、病态系统等多种情形具有较强的普适性。 展开更多
关键词 输配电网一体化 牛顿法 潮流计算 收敛性能 图形处理器并行加速
下载PDF
换新机 小平板GoGo购
7
《计算机应用文摘》 2011年第33期42-42,共1页
如果前面几招都还不足以救我们的小平板于水火,就不得不出动最后一招——换新机了!结合优化、提升的方法细细调教,全新的小平板自然就能带出“飞”一般的体验。
关键词 平板电脑 图形加速处理器 应用程序 存储容量 操作系统
下载PDF
基于GPU的芯片热分析方法研究 被引量:1
8
作者 马骏 徐宁 《计算机应用研究》 CSCD 北大核心 2018年第3期773-776,共4页
针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只计算热源附近的点,从而大幅减少计算量。首先对金字塔型非规则热分析模型进行了研究,然后提出了一种预先保存概率表的加速策略;将随机行走... 针对大规模IC芯片中局部高温热效应问题,提出基于网格的随机行走方法分析稳态温度分布。该算法只计算热源附近的点,从而大幅减少计算量。首先对金字塔型非规则热分析模型进行了研究,然后提出了一种预先保存概率表的加速策略;将随机行走算法在CUDA上实现了并行,得出了最大限度使用GPU资源并保证最大加速比的最优配置。实验结果表明,提出的并行随机行走算法使总体计算性能提升了7~10倍。 展开更多
关键词 统一计算设备架构 图形处理器加速 随机行走 金字塔模型 IC 热分析
下载PDF
基于二阶平滑先验的图像保边平滑快速算法
9
作者 王颢星 孟维亮 张晓鹏 《高技术通讯》 CAS CSCD 北大核心 2014年第7期732-738,共7页
研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平... 研究了计算机图形处理与计算视觉处理中的图像保边平滑(保持图像边缘平滑)处理。考虑到基于优化方法的保边平滑算法多使用一阶平滑先验作为能量函数的正则项,但它会使平滑结果产生阶梯状的平滑效果,提出了一种基于二阶平滑先验的保边平滑算法,该算法能够避免一阶平滑先验存在的阶梯状平滑偏差,同时锋利地保持图像中显著的边缘。针对该算法的连续变量与0-1变量的混合优化问题,使用了一种快速的求解方法,该方法在使用图形处理器(GPU)并行加速的情况下能够快速获取平滑结果。通过实验验证了该算法在深度图保边平滑处理、JPEG卡通图像压缩瑕疵恢复以及边缘提取问题中的应用效果。 展开更多
关键词 二阶平滑先验 保边平滑 优化 图形处理器(GPU)加速 深度图处理
下载PDF
并行化的双轮廓算法
10
作者 李一鹏 贾世宇 +1 位作者 潘振宽 王吉强 《计算机仿真》 北大核心 2020年第6期262-267,共6页
提出一种新颖的适用于GPU且支持化简的并行化的双轮廓方法。通过使用新的GPU八叉树生成算法,克服了传统的八叉树数据结构难以完全在GPU端并行生成与存储的困难,适用于对三维离散点云、数据场及三角网格模型构建(包含等值面或原模型的)... 提出一种新颖的适用于GPU且支持化简的并行化的双轮廓方法。通过使用新的GPU八叉树生成算法,克服了传统的八叉树数据结构难以完全在GPU端并行生成与存储的困难,适用于对三维离散点云、数据场及三角网格模型构建(包含等值面或原模型的)八叉树。上述方法逐层并行生成八叉树结点,线性存储每层结点信息同时避免存储空结点信息,有效节约了存储空间并且便于后续对各层结点并行处理。以并行八叉树生成方法为基础,提出了对原始双轮廓算法的GPU加速实现。与在CPU上单线程执行的算法相比,速度可以提高1个数量级。 展开更多
关键词 八叉树 图形处理器加速 双轮廓 表面重构
下载PDF
3D图形芯片G450横空出世
11
《多媒体世界》 2000年第7期50-52,共3页
在3D图形加速卡领域我们始终习惯于把Matrox公司制造的3D加速卡归入另类,皆因为其具有单独的处理芯片技术核心,自产自销,完全不同于3dfx的VOODOO系列、nVidia的TNT2/GeForce256、S3的Savage系列等运作模式,Matrox公司的产品始终处于技... 在3D图形加速卡领域我们始终习惯于把Matrox公司制造的3D加速卡归入另类,皆因为其具有单独的处理芯片技术核心,自产自销,完全不同于3dfx的VOODOO系列、nVidia的TNT2/GeForce256、S3的Savage系列等运作模式,Matrox公司的产品始终处于技术的巅峰。不过。 展开更多
关键词 3D图形芯片 G450 图象显示 图形加速处理器
原文传递
基于总变分最小化模型的异步并行GPU加速算法 被引量:1
12
作者 路万里 蔡爱龙 +3 位作者 郑治中 王林元 李磊 闫镔 《光学学报》 EI CAS CSCD 北大核心 2018年第4期153-160,共8页
相比于传统同步并行计算策略,在异步并行计算框架下,针对最常用的总变分(TV)最小化重建模型,通过将其转化为不动点迭代问题,并利用异步交替方向法(ADM)进行求解,推导出基于TV最小化模型的异步ADM迭代重建算法,即异步交替方向总变分最小... 相比于传统同步并行计算策略,在异步并行计算框架下,针对最常用的总变分(TV)最小化重建模型,通过将其转化为不动点迭代问题,并利用异步交替方向法(ADM)进行求解,推导出基于TV最小化模型的异步ADM迭代重建算法,即异步交替方向总变分最小化算法(Async-ADTVM)。利用消息传递接口技术将该算法在图形处理器(GPU)集群上进行测试,进一步提高了原始基于TV最小化模型的迭代重建算法的计算效率。实验表明,该算法在计算求解精度上略优于ADTVM算法,同时在GPU性能存在差异的条件下相比传统多GPU加速策略可获得更高的加速比。 展开更多
关键词 成像系统 优化类重建算法 异步并行迭代 总变分最小化模型 图形处理器加速
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部