期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
时域有限差分法的图形处理单元的加速
1
作者 潘东旭 《山东工业技术》 2014年第24期225-226,238,共3页
时域有限差分法,即FDTD(Finite Difference Time Domain),是计算电磁学的一种重要方法。作为一种天然的并行算法,它的计算过程可以划分为多个同时进行相似计算的子计算。这个方法主要是把麦克斯韦方程在时间上和空间上进行差分化,并且... 时域有限差分法,即FDTD(Finite Difference Time Domain),是计算电磁学的一种重要方法。作为一种天然的并行算法,它的计算过程可以划分为多个同时进行相似计算的子计算。这个方法主要是把麦克斯韦方程在时间上和空间上进行差分化,并且通过时间领域上的更新来模仿电磁场的变化来计算问题,因而有利于解决很多电磁场问题。而图形处理单元即GPU(Graphic Processing Unit)相对于CPU的高性能计算速度以及NVIDA公司生产的GPU特有的高并行结构,为时域有限差分的加速提供了可能。 展开更多
关键词 时域有限差分法 图形处理单元 麦克斯韦方程 并行算法
下载PDF
单元级别并行有限元法求解工程涡流场的关键问题研究 被引量:7
2
作者 唐任远 吴东阳 谢德馨 《电工技术学报》 EI CSCD 北大核心 2014年第5期1-8,共8页
单元级别并行有限元方法(EBE-PFEM)目前尚未在工程涡流场求解中得到应用。由于含有不同导电媒质的工程涡流问题经有限元离散化得到的方程组呈现病态性质,给EBE-PFEM这一有效方法的应用造成了困难。本文从数学模型选择与算法实施两方面... 单元级别并行有限元方法(EBE-PFEM)目前尚未在工程涡流场求解中得到应用。由于含有不同导电媒质的工程涡流问题经有限元离散化得到的方程组呈现病态性质,给EBE-PFEM这一有效方法的应用造成了困难。本文从数学模型选择与算法实施两方面出发对此提出了解决方案。将修正矢量磁位法及二阶矢量位法应用于涡流问题的数学模型中,能够简化问题的数学模型并改善涡流场离散化方程组的性质;而采用EBE-PFEM法求解该方程组,可以解决工程涡流场分析的存储规模庞大、求解困难的问题。文中并给出了EBE-PFEM法在GPU(图形处理单元)上的实现过程。 展开更多
关键词 单元级别并行有限元法 图形处理单元 三维涡流场 二阶矢量位 并行计算
下载PDF
多叉树数据流图粗粒度可重构单元阵列映射算法 被引量:4
3
作者 陈乃金 江建慧 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第7期1180-1187,共8页
针对多叉树任务数据流图的划分映射问题,基于粗粒度行并行可重构架构,提出一种行列剪枝映射算法.首先分析和比较了二维没有跳变近邻点点互连和行并行互连的可重构单元阵列的映射性能,通过3种类型的一次循环四阶多叉树映射实验结果表明(R... 针对多叉树任务数据流图的划分映射问题,基于粗粒度行并行可重构架构,提出一种行列剪枝映射算法.首先分析和比较了二维没有跳变近邻点点互连和行并行互连的可重构单元阵列的映射性能,通过3种类型的一次循环四阶多叉树映射实验结果表明(RCA4×4),行并行架构执行总周期最大减少了63个周期,最少减少了20个周期;然后设计实现了行列剪枝映射算法,先按行剪枝映射,再对已映射节点的依赖后继进行列剪枝映射,在满足面积和互连等约束下考虑运算节点层次和入度等因素构造了排队函数,通过该函数值动态调整就绪列表节点的调度次序.实验结果表明,与放置路由算法相比,文中算法执行时间平均减少了15.7%(RCA4×4)和18.4%(RCA5×5);与分裂压缩内核算法相比,该算法执行时间平均减少了30.0%(RCA4×4)和29.8%(RCA5×5):从而验证了文中提出解决多叉树行并行可重构单元阵列及映射算法有效性. 展开更多
关键词 多叉树 并行 可重构单元阵列 时域映射 资源约束
下载PDF
遥感影像的高性能并行处理技术研究 被引量:6
4
作者 赵颖辉 蒋从锋 《计算机技术与发展》 2014年第7期201-205,共5页
随着空间遥感技术和对地观测技术的不断发展,光学、热红外和微波等不同技术手段可以获取同一地区的多种遥感影像数据(多时相、多光谱、多传感器、多平台和多分辨率等),每天获取的遥感数据量越来越大。同时,大量的遥感应用需要快速地对... 随着空间遥感技术和对地观测技术的不断发展,光学、热红外和微波等不同技术手段可以获取同一地区的多种遥感影像数据(多时相、多光谱、多传感器、多平台和多分辨率等),每天获取的遥感数据量越来越大。同时,大量的遥感应用需要快速地对这些遥感数据进行处理与分析,提供辅助决策信息。因此,如果不能及时进行数据处理,这些数据就会失去时效性,甚至失去数据本身的价值。高性能计算与并行处理技术,加速了遥感影像数据处理与信息提取的进度,如大规模多处理系统、网格与云计算技术、通用图形处理器(GPGPU)等。文中综述了高性能计算、并行处理及云计算技术应用于遥感领域的最新进展,给出了一些研究与应用范例,并提出了当前高性能遥感影像处理所面临的一些挑战。 展开更多
关键词 遥感 图像处理 高性能计算 并行处理 通用图形处理单元
下载PDF
一种基于GPU的移动对象并行处理框架 被引量:2
5
作者 韦春丹 龚奕利 李文海 《计算机应用与软件》 CSCD 2016年第10期223-229,共7页
PGrid是一个基于格网索引的移动对象并行处理框架。通过分析PGrid框架不利于在GPU上并行的因素,提出基于GPU的无锁并行处理G-LFPP(GPU Based Lock Free Parallel Processing)框架。采用基于操作分解/聚类的无锁更新策略,消除更新过程中... PGrid是一个基于格网索引的移动对象并行处理框架。通过分析PGrid框架不利于在GPU上并行的因素,提出基于GPU的无锁并行处理G-LFPP(GPU Based Lock Free Parallel Processing)框架。采用基于操作分解/聚类的无锁更新策略,消除更新过程中并发控制对更新性能的影响;为了实现细粒度并行查询,提出基于候选集映射表和查询确认表的快速查询索引。实验表明,该方法更新和查询策略有利于大规模线程并发处理更新和查询。当移动对象的数量达到千万级时,更新速率和查询速率仍然可以超过每秒1100万次和110万次。与PGrid相比,并发处理更新和查询的速度提高了6.61倍。 展开更多
关键词 并行计算 图形处理单元 异构计算 格网索引 移动对象数据库
下载PDF
分块变换和GPU并行的遥感影像快速正射校正方法 被引量:1
6
作者 方留杨 何红艳 张炳先 《航天返回与遥感》 CSCD 2018年第6期80-90,共11页
正射校正是整个遥感数据处理过程中计算量最大、耗时最长的步骤之一,已经成为制约整个遥感数据处理快速完成的瓶颈。为了提高正射校正处理效率,文章系统地探讨了基于分块三维直接线性变换和图形处理单元(GPU)并行的遥感影像快速正射校... 正射校正是整个遥感数据处理过程中计算量最大、耗时最长的步骤之一,已经成为制约整个遥感数据处理快速完成的瓶颈。为了提高正射校正处理效率,文章系统地探讨了基于分块三维直接线性变换和图形处理单元(GPU)并行的遥感影像快速正射校正方法。首先针对正射校正坐标转换计算量过大的问题,提出了分块三维直接线性变换策略,有效地降低了坐标转换的计算量;在此基础上,采用"渐进式"策略开展GPU并行处理,首先通过GPU并行映射(核函数任务映射、基本设置),使方法在GPU上可执行,然后通过"两层次"性能优化(核函数性能优化、整体流程性能优化),进一步提高了方法的执行效率。在CPU和GPU组成的实验环境中,使用文中方法对"高分二号"卫星全色标准景影像进行实验,GPU执行时间仅为5.13s,与CPU相比,相应加速比达到142.42倍,可以满足对大数据遥感影像的快速正射校正需求。 展开更多
关键词 正射校正 分块三维直接线性变换 图形处理单元并行映射 核函数性能优化 整体流程性能优化 遥感数据处理
下载PDF
基于GPU的高光谱遥感MNF并行方法研究 被引量:6
7
作者 罗耀华 郭科 赵仕波 《四川师范大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期476-479,共4页
最小噪声分离变换(MNF)是高光谱遥感影像分类中特征提取和去除噪声的有效方法.MNF算法涉及大量的矩阵运算,在实际工程的海量数据处理中存在计算时间长的问题.在分析MNF算法原理的基础上,运用图形处理单元(GPU)并行框架对该算法进行优化... 最小噪声分离变换(MNF)是高光谱遥感影像分类中特征提取和去除噪声的有效方法.MNF算法涉及大量的矩阵运算,在实际工程的海量数据处理中存在计算时间长的问题.在分析MNF算法原理的基础上,运用图形处理单元(GPU)并行框架对该算法进行优化,并通过不同大小的高光谱遥感数据进行计算和分析.结果表明,随着影像数据量的递增,采用并行计算方式的提速比呈明显上升趋势,说明GPU并行方式对于计算密集型的大数据量处理具有良好的提速效果,为解决海量高光谱遥感数据处理速度慢的问题提供了思路. 展开更多
关键词 高光谱遥感 MNF变换 图形处理单元 并行计算
下载PDF
基于纹理映射和GPU的焦点区域体绘制 被引量:4
8
作者 周建龙 王知衍 肖春 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第1期32-37,共6页
利用图形硬件的纹理映射和可编程GPU功能,高效实现基于焦点区域的体绘制.使用模板缓存检测机制把体数据标记为3个不同的区域,然后对标记区域使用基于纹理映射的方法分别绘制;同时使用基于GPU方法实现了周围区域的体轮廓绘制以及体绘制... 利用图形硬件的纹理映射和可编程GPU功能,高效实现基于焦点区域的体绘制.使用模板缓存检测机制把体数据标记为3个不同的区域,然后对标记区域使用基于纹理映射的方法分别绘制;同时使用基于GPU方法实现了周围区域的体轮廓绘制以及体绘制中多个转换函数的指定过程.文中方法使得体绘制系统实现容易、可扩展性好. 展开更多
关键词 体视化 焦点区域 纹理映射 图形处理单元
下载PDF
采用向量内积的并行相关算法 被引量:2
9
作者 牟卫华 倪少杰 +2 位作者 白洋 孙广富 欧钢 《国防科技大学学报》 EI CAS CSCD 北大核心 2017年第5期50-55,共6页
针对软件接收机相关器计算的实时性问题,通过分析扩频信号的接收过程,建立一种基于向量内积的并行相关信号接收模型。利用图形处理单元中大量的浮点运算单元进行矩阵与向量运算,并行计算各通道相关值,提高了信号相关运算的实时性。仿真... 针对软件接收机相关器计算的实时性问题,通过分析扩频信号的接收过程,建立一种基于向量内积的并行相关信号接收模型。利用图形处理单元中大量的浮点运算单元进行矩阵与向量运算,并行计算各通道相关值,提高了信号相关运算的实时性。仿真验证结果表明,利用基于GPU的向量内积软件并行相关算法计算25 MHz采样率时长1 ms的信号相关值,25个通道共150个相关运算耗时967μs,与CPU上基于数学核心函数库的实现相比速度约提高了61.4倍,能够实现宽带扩频信号软件实时相关接收。 展开更多
关键词 相关器 向量内积 软件接收机 并行计算 图形处理单元
下载PDF
基于GPU的Landsat8实时解压缩处理技术 被引量:2
10
作者 杨仁忠 张洁 +1 位作者 韦宏卫 石璐 《计算机工程》 CAS CSCD 北大核心 2016年第3期301-307,共7页
根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压... 根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压缩方案相比,基于GPU的解压缩系统获得7.45倍的加速比,能够达到Landsat8卫星下行数据实时解压缩处理速度要求的1.8倍以上,解压缩的图像数据正确率高且成本较低。 展开更多
关键词 无损数据压缩算法 实时解压缩 图形处理单元 卫星下行数据 并行计算
下载PDF
基于BRDF和GPU并行计算的全局光照实时渲染 被引量:7
11
作者 王芳 秦磊华 《图学学报》 CSCD 北大核心 2016年第5期583-591,共9页
基于光线追踪,将屏幕图像像素分解为投射光线与场景对象交点面片辐射亮度和纹理贴图的合成,每个面片的辐射亮度计算基于双向反射分布函数(BRDF)基的线性组合,并通过图形处理器(GPU)处理核心并行绘制进行加速,最后与并行计算的纹理映射... 基于光线追踪,将屏幕图像像素分解为投射光线与场景对象交点面片辐射亮度和纹理贴图的合成,每个面片的辐射亮度计算基于双向反射分布函数(BRDF)基的线性组合,并通过图形处理器(GPU)处理核心并行绘制进行加速,最后与并行计算的纹理映射结果进行合成。提出了一种基于BRDF和GPU并行计算的全局光照实时渲染算法,利用GPU并行加速,在提高绘制效率的前提下,实现动态交互材质的全局光照实时渲染。重点研究:对象表面对光线的多次反射用BRDF基的线性组合来表示,将非线性问题转换为线性问题,从而提高绘制效率;利用GPU并行加速,分别计算对象表面光辐射能量和纹理映射及其线性组合,进一步提高计算效率满足实时绘制需求。 展开更多
关键词 全局光照 图形处理单元 双向反射分布函数 渲染方程 并行计算
下载PDF
基于图形处理单元的数字全息图加速再现算法研究 被引量:1
12
作者 丁鹤平 朱竹青 +2 位作者 孙敏 王晓雷 周延怀 《中国激光》 EI CAS CSCD 北大核心 2010年第11期2901-2905,共5页
研究了一种利用图形处理单元(GPU)加速数字全息图再现的算法。该算法充分利用GPU强大的并行计算能力,有效地缩短了数字全息图再现时间。比较了GPU加速运算和中央处理器(CPU)独立运算两种模式下,两种不同尺寸的数字全息图再现时间。结果... 研究了一种利用图形处理单元(GPU)加速数字全息图再现的算法。该算法充分利用GPU强大的并行计算能力,有效地缩短了数字全息图再现时间。比较了GPU加速运算和中央处理器(CPU)独立运算两种模式下,两种不同尺寸的数字全息图再现时间。结果表明,对于大小为2048 pixel×2048 pixel的数字全息图,GPU算法的再现时间可缩短至约1/15。利用该算法编写了易操作的通用软件。在高配置主机和高性能GPU硬件环境下,该软件不仅能够满足诸如数字全息显示、数字全息显微等系统实时功能的要求,还能够指导数字全息实验系统的快速搭建。 展开更多
关键词 全息 再现算法 向量化循环 图形处理单元 并行计算
原文传递
基于CUDA的热传导GPU并行算法研究 被引量:3
13
作者 孟小华 黄丛珊 朱丽莎 《计算机工程》 CAS CSCD 2014年第5期41-44,48,共5页
在热传导算法中,使用传统的CPU串行算法或MPI并行算法处理大批量粒子时,存在执行效率低、处理时间长的问题。而图形处理单元(GPU)具有大数据量并行运算的优势,为此,在统一计算设备架构(CUDA)并行编程环境下,采用CPU和GPU协同合作的模式... 在热传导算法中,使用传统的CPU串行算法或MPI并行算法处理大批量粒子时,存在执行效率低、处理时间长的问题。而图形处理单元(GPU)具有大数据量并行运算的优势,为此,在统一计算设备架构(CUDA)并行编程环境下,采用CPU和GPU协同合作的模式,提出并实现一个基于CUDA的热传导GPU并行算法。根据GPU硬件配置设定Block和Grid的大小,将粒子划分为若干个block,粒子输入到GPU显卡中并行计算,每一个线程执行一个粒子计算,并将结果传回CPU主存,由CPU计算出每个粒子的平均热流。实验结果表明,与CPU串行算法在时间效率方面进行对比,该算法在粒子数到达16 000时,加速比提高近900倍,并且加速比随着粒子数的增加而加速提高。 展开更多
关键词 热传导算法 图形处理单元 统一计算设备架构 并行计算 时间效率 加速比
下载PDF
压缩感知A*OMP重构算法的并行化与GPU加速实现 被引量:1
14
作者 熊承义 张静 +1 位作者 高志荣 雷梦 《中南民族大学学报(自然科学版)》 CAS 北大核心 2016年第2期79-84,共6页
针对压缩感知系统实时应用的需要,探讨了A*OMP算法的并行设计及基于GPU的加速方法.将耗时长的矩阵逆运算转化为可并行的矩阵/向量操作,并结合算法本身的关联特性,进一步采用迭代法实现以降低其计算复杂度.利用GPU高效的并行运算能力,将... 针对压缩感知系统实时应用的需要,探讨了A*OMP算法的并行设计及基于GPU的加速方法.将耗时长的矩阵逆运算转化为可并行的矩阵/向量操作,并结合算法本身的关联特性,进一步采用迭代法实现以降低其计算复杂度.利用GPU高效的并行运算能力,将算法中可并行的矩阵/向量计算映射到GPU上并行执行,在面向Matlab的Jacket软件平台上对整体串行算法进行了并行化的设计与实现.在NVIDIA Tesla K20Xm GPU和Intel(R)E5-2650 CPU上进行了测试,实验结果表明:对比CPU平台的串行实现,基于GPU的A*OMP算法整体上可获得约40倍的加速,实现了在保持系统较高重构质量的同时能有效降低计算时间,较好地满足了系统实时性的需要. 展开更多
关键词 A*OMP算法 并行 加速 图形处理单元
下载PDF
基于GPU并行粒子群优化的超声弹性实时成像算法 被引量:1
15
作者 杨先凤 李映洁 +1 位作者 赖俊良 彭博 《计算机工程》 CAS CSCD 北大核心 2015年第12期220-225,230,共7页
为提高超声弹性成像的质量同时满足实时成像的要求,以图形处理器(GPU)为计算平台,提出一种超声弹性实时成像算法。通过描述粒子群优化估计每一个待估计点位移的过程,对该算法进行GPU并行实现,并与传统互相关算法的实验数据进行对比。仿... 为提高超声弹性成像的质量同时满足实时成像的要求,以图形处理器(GPU)为计算平台,提出一种超声弹性实时成像算法。通过描述粒子群优化估计每一个待估计点位移的过程,对该算法进行GPU并行实现,并与传统互相关算法的实验数据进行对比。仿真结果显示,该算法比传统的互相关算法能更准确地估计组织的运动情况,使得到的弹性图具有较高的质量,同时其GPU并行实现可有效提高计算速度,满足实时超声弹性成像的要求。 展开更多
关键词 弹性成像 互相关函数 群智能算法 粒子群优化 并行计算 图形处理单元 统一计算设备架构
下载PDF
Fermi架构下超声成像组织运动可视化并行算法 被引量:1
16
作者 何兴无 《计算机系统应用》 2013年第4期147-152,共6页
在临床超声实时成像系统中组织运动情况是医生想要获取的重要诊断信息,例如心脏运动.基于线积分卷积的二维矢量场可视化技术可以同时展现运动矢量场的强度和方向.但这一算法在处理时涉及大量的复杂计算,尤其是流线追踪处理部分,使其成... 在临床超声实时成像系统中组织运动情况是医生想要获取的重要诊断信息,例如心脏运动.基于线积分卷积的二维矢量场可视化技术可以同时展现运动矢量场的强度和方向.但这一算法在处理时涉及大量的复杂计算,尤其是流线追踪处理部分,使其成为临床实时成像系统中的一大性能提升瓶颈.为此研究并提出了一种基于新兴的高性能并行计算平台Fermi架构GPU(graphics processing unit图形处理单元)的并行运动可视化算法.数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到一致的运动可视化和信息分析效果,而且可以取得较大的加速效果.对于260×260的图像数据在使用线积分卷积滤波器长度为7的情况下,速度提高了大约237倍. 展开更多
关键词 高性能并行计算 运行可视化 线积分卷积 并行处理 图形处理单元
下载PDF
三维不规则窦房结电生理模型的建立及其图形实现
17
作者 张虹 刘袁 +1 位作者 刘炀 金印彬 《西安交通大学学报》 EI CAS CSCD 北大核心 2017年第5期43-47,共5页
针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数... 针对窦房结三维电生理建模复杂、仿真运算量大等问题,提出了一种有效的解决方法。首先利用建模软件建立右心房三维不规则立体模型,再利用网格划分软件剖分为四面体网格,最后根据网格的位置赋予窦房结和心房细胞属性建立电生理模型。数值解算时采用算子分裂法和有限体积法,分别对反应-扩散方程和单纯描述电扩布的微分方程进行了处理,同时利用高性能图形处理单元(GPU)在CUDA(compute unified device architecture)编程环境下实现程序的并行加速。另外,从减少CPU和GPU间的数据交换频率、参量存储方式等多方面对程序加以优化。计算结果表明,所建模型无论是单细胞动作电位还是膜电位的传导均符合正常的电生理特征。通过与串行程序及基于4核8线程CPU编写的共享内存式OpenMP并行程序进行比较,基于GPU的CUDA程序可将运行耗时减少90%以上,CPU和GPU间的数据交换仅占总耗时的3%,且组织模型越大,网格划分越细致,GPU的加速效果愈显著。 展开更多
关键词 图形处理单元 并行计算 窦房结 有限体积法
下载PDF
基于CUDA的大型实对称矩阵并行求逆算法
18
作者 霍迎秋 王武星 +1 位作者 彭楚风 方勇 《计算机工程与设计》 北大核心 2015年第8期2133-2137,共5页
针对大型实对称矩阵数值求逆算法运算量大、计算时间长的问题,分析分块迭代求逆算法的并行性,设计基于CUDA(compute unified device architecture)的并行求逆算法。设计对比分析实验,实验结果表明,该算法能够提高大型实对称矩阵求逆的速... 针对大型实对称矩阵数值求逆算法运算量大、计算时间长的问题,分析分块迭代求逆算法的并行性,设计基于CUDA(compute unified device architecture)的并行求逆算法。设计对比分析实验,实验结果表明,该算法能够提高大型实对称矩阵求逆的速度,当矩阵大小为8000×8000时,加速比高达279倍,很好满足了实际工程中对实时性要求高的需求,且计算精度基本保持不变。 展开更多
关键词 实对称矩阵 分块迭代求逆 图形处理单元 统一计算设备架构 并行算法
下载PDF
基于GPU的LDPC译码器设计
19
作者 黄柯文 刘世刚 汪洋 《电子质量》 2024年第10期43-48,共6页
为了提高低密度奇偶校验码(LDPC)译码器的译码速度,提出了一种基于图形处理单元(GPU)加速的并行LDPC译码方案。该方案基于对数似然比(LLR-BP)译码算法进行设计,针对算法的可并行部分采用并行度更高的边并行译码方案,以降低译码延迟并提... 为了提高低密度奇偶校验码(LDPC)译码器的译码速度,提出了一种基于图形处理单元(GPU)加速的并行LDPC译码方案。该方案基于对数似然比(LLR-BP)译码算法进行设计,针对算法的可并行部分采用并行度更高的边并行译码方案,以降低译码延迟并提高了GPU的线程利用率。此外,通过优化线程分配策略,将变量节点更新的信息存储在访问成本更低的共享内存中,减少了消息传递过程中对全局内存的依赖。实验结果表明,所提方案的译码速度分别是传统的节点并行译码和边并行译码方案的2.8倍和1.2倍,满足高速通信系统的需求。 展开更多
关键词 图形处理单元 低密度奇偶校验码译码器 数据协调 并行计算
下载PDF
基于GPU的大尺度网络零模型分组生成并行算法 被引量:3
20
作者 李欢 卢罡 郭俊霞 《计算机工程与设计》 北大核心 2016年第1期93-99,共7页
为解决生成大尺度网络的零模型时间效率较低的问题,利用数据分组思想,针对生成0阶、1阶、2阶网络零模型的随机置乱算法提出基于GPU的并行化实现。并行化过程中,设计不重复分配原则,以及存在性替换、重复性替换策略避免无效置乱。基于常... 为解决生成大尺度网络的零模型时间效率较低的问题,利用数据分组思想,针对生成0阶、1阶、2阶网络零模型的随机置乱算法提出基于GPU的并行化实现。并行化过程中,设计不重复分配原则,以及存在性替换、重复性替换策略避免无效置乱。基于常用的网络拓扑指标以及网络随机化程度,验证并行算法的有效性,验证结果表明,并行的分组置乱算法相比传统的串行算法提高了时间效率,针对GPU显存无法一次性容纳的大尺度网络,能快速生成其相应的零模型,为大尺度网络零模型的研究提供了一种高效的解决方案。 展开更多
关键词 复杂网络 零模型 随机置乱 图形处理单元 并行计算
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部