期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于多核计算的实时数字图像稳定 被引量:1
1
作者 周渝斌 时永刚 《计算机科学》 CSCD 北大核心 2010年第4期269-273,277,共6页
多核计算已成为计算领域新的发展趋势。针对电子数字稳像系统中待处理的数据量和计算量都非常大的特点,结合双核PC平台的计算特点,采用了一种联合多种加快算法运行速度的处理方案,以满足系统的实时性要求。该方法结合图像视频数据处理... 多核计算已成为计算领域新的发展趋势。针对电子数字稳像系统中待处理的数据量和计算量都非常大的特点,结合双核PC平台的计算特点,采用了一种联合多种加快算法运行速度的处理方案,以满足系统的实时性要求。该方法结合图像视频数据处理的高度并行化、重复性处理的特征,在程序编制上,采用多线程并行处理方法,利用单指令多数据流(Single Instruction Multiple Data,SIMD)、流水线SIMD技术,在双核CPU上完成并行多线程任务分配和共享内存管理。并在快速搜索基础上,采用自适应多局部运动矢量估计消除运动物体干扰,用Kalman滤波分离了两种不同的运动信号,最终完成有害抖动信号的运动补偿。通过这些措施,在普通商用的双核PC机上实现了稳像实验系统的高效实时处理。 展开更多
关键词 多核计算 图像稳定 运动估计 并行处理
下载PDF
多核计算环境下改进的主从式并行遗传算法 被引量:4
2
作者 谢克家 刘昕 +1 位作者 王成良 杨少晨 《微计算机信息》 2011年第3期164-166,共3页
遗传算法作为通用而有效的全局搜索算法已在图像处理、自动控制等众多领域获得应用,但其计算量大、极耗计算资源,运行效率直接影响到复杂的非线性和多维空间寻优问题的求解效率。在分析OpenMP并行技术特点的基础上,针对主从式并行模型... 遗传算法作为通用而有效的全局搜索算法已在图像处理、自动控制等众多领域获得应用,但其计算量大、极耗计算资源,运行效率直接影响到复杂的非线性和多维空间寻优问题的求解效率。在分析OpenMP并行技术特点的基础上,针对主从式并行模型没有充分利用遗传算法内在并行性的问题,提出了一种改进的主从式并行遗传算法,并应用OpenMP编程模型在多核计算环境下实现。利用旅行商问题进行的实验表明,改进的并行遗传算法有更好的计算效率、扩展性,可在求解大规模TSP问题上有更广泛和高效的应用。 展开更多
关键词 并行遗传 多核计算环境 主从式 旅行商问题
下载PDF
多核计算下气象研究程序的并行化研究
3
作者 温娜 郝永生 卢俊文 《武汉理工大学学报(信息与管理工程版)》 CAS 2014年第6期739-742,共4页
针对多核计算环境下气象计算的并行化这个难题,在分析气象计算并行化步骤的基础上,从气象计算方法间并行,程序模块间并行和程序模块内并行3个角度描述了气象研究程序的一般并行化过程。并以一个气象研究模式为例,分析了其并行化的过程... 针对多核计算环境下气象计算的并行化这个难题,在分析气象计算并行化步骤的基础上,从气象计算方法间并行,程序模块间并行和程序模块内并行3个角度描述了气象研究程序的一般并行化过程。并以一个气象研究模式为例,分析了其并行化的过程。在模拟实验中,对广泛应用于气象计算的蒙特卡洛方法进行了并行化。实验结果表明,所提出的方法能减少约20%的执行时间。 展开更多
关键词 多核计算 气象计 并行化
下载PDF
一种适于多核计算机系统的并行压缩方法 被引量:1
4
作者 乔峰 《电子科学技术》 2015年第3期295-301,共7页
当前随着多核计算机硬件系统已经成为应用主流,软件开发者需要设计适合多核计算机硬件系统的软件系统。然而如何有效地使用多核硬件系统将成为很大的挑战。开发人员使用基于操作系统线程级开发模型将遇到很大的挑战。为有效地应对以上... 当前随着多核计算机硬件系统已经成为应用主流,软件开发者需要设计适合多核计算机硬件系统的软件系统。然而如何有效地使用多核硬件系统将成为很大的挑战。开发人员使用基于操作系统线程级开发模型将遇到很大的挑战。为有效地应对以上问题,Intel公司开发出了适合多核计算机硬件系统的开发编程模型:TBB, ArBB and Cilk等编程模型。最近一种新型的简单而有效的适合多核计算机硬件系统编程的模型“Concurrent Collections”简称“CnC”被Intel公司开发出来。CnC采用声明式编程语言允许应用程序开发者表达一个高层次的计算方法。在本文中,我们将描述如何使用这个新型的编程模型实现一个高性能的数据压缩程序,同时与其他方式实现的并行实现方法进行比较。本文采用双至强处理器X54603.16GHz 8-thread CPUs,通过本文说明的方法实现的并行压缩应用程序运行加速度超过8倍。通过与其他并行实现方式比较OpenMP, TBB and Cilk,本文实现的性能比其他实现方式有5%~10%的性能提升。 展开更多
关键词 CNC 多核计算 并行编程模型 压缩
下载PDF
小卫星/小运载可重构多核计算机设计 被引量:3
5
作者 孙兆伟 刘源 +1 位作者 徐国栋 叶东 《航空学报》 EI CAS CSCD 北大核心 2010年第4期770-777,共8页
通过共用小卫星与小运载的电子系统,能够降低卫星发射成本、实现卫星与运载的快速集成及测试、减少卫星的发射与入轨时间,从而达到快速响应自然灾害等突发事件的目的。传统航天器电子系统难以兼顾运载段任务的高实时性和在轨段任务的高... 通过共用小卫星与小运载的电子系统,能够降低卫星发射成本、实现卫星与运载的快速集成及测试、减少卫星的发射与入轨时间,从而达到快速响应自然灾害等突发事件的目的。传统航天器电子系统难以兼顾运载段任务的高实时性和在轨段任务的高可靠性要求,因此本文将多核处理器技术、可重构技术和航天器电子系统设计相结合,提出了基于可重构技术的小卫星/小运载多核计算机设计方案。该设计方案分为运载和在轨两种工作模式,通过现场可编程门阵列(FPGA)的快速重构来实现计算机两种工作模式的快速切换。其中运载模式将FPGA配置成并行构架的三核处理器,通过3个处理器并行计算来提升计算机的处理能力;在轨模式将FPGA配置成冗余构架的三核处理器,通过3个处理器互为冗余备份来提升计算机的长期可靠性。经过基于Markov过程理论的系统可靠性分析,表明系统在轨段的长期可靠性得到显著提升。同时经过地面半物理仿真系统仿真测试,运载段的控制周期可以达到10ms,满足运载段任务的实时性要求。 展开更多
关键词 可重构 多核计算 可靠性 性能 现场可编程门阵列
原文传递
并行与分布式计算动态负载均衡策略综述 被引量:43
6
作者 杨际祥 谭国真 王荣生 《电子学报》 EI CAS CSCD 北大核心 2010年第5期1122-1130,共9页
动态负载均衡(Dynamic Load Balancing,DLB)是提高动态和非规则问题计算效率与规模的一个挑战问题.阐述了DLB的一般性问题,根据DLB策略的主要特征给出了一个综合分类方法,按分类对近30年提出的各种主要DLB策略做了细致的分析和深入的比... 动态负载均衡(Dynamic Load Balancing,DLB)是提高动态和非规则问题计算效率与规模的一个挑战问题.阐述了DLB的一般性问题,根据DLB策略的主要特征给出了一个综合分类方法,按分类对近30年提出的各种主要DLB策略做了细致的分析和深入的比较,并做了策略有效性分析.在总结现有研究成果基础上,分析了该领域的最新发展趋势,为下一步的研究提出了新的问题和思路. 展开更多
关键词 并行与分布式计 动态负载均衡(DLB) 多核计算
下载PDF
多核环境下并行粒子群算法 被引量:4
7
作者 何莉 刘晓东 +1 位作者 李松阳 张倩 《计算机应用》 CSCD 北大核心 2015年第9期2482-2485,2518,共5页
针对串行粒子群算法在解决大任务耗时过长的问题,提出一种共享并行粒子群(Shared-PSO)算法。充分利用多核处理能力缩短问题处理运行时间,设置共享区和采取粒子随机替换策略有效促进粒子信息的交流,其算法流程具有较好的通用性,允许利用... 针对串行粒子群算法在解决大任务耗时过长的问题,提出一种共享并行粒子群(Shared-PSO)算法。充分利用多核处理能力缩短问题处理运行时间,设置共享区和采取粒子随机替换策略有效促进粒子信息的交流,其算法流程具有较好的通用性,允许利用多种串行粒子群算法完成粒子信息更新工作。在标准优化测试集CEC 2014上的实验结果显示新算法的执行时间是串行算法的1/4。新算法能够有效地改善串行粒子群的执行效率,扩展粒子群算法的应用范围。 展开更多
关键词 并行粒子群 多核计算 并行 最优化 群智能
下载PDF
多核环境下Hilbert曲线划分简单要素多边形合并算法 被引量:6
8
作者 陈占龙 吴亮 刘焕焕 《计算机应用研究》 CSCD 北大核心 2012年第7期2747-2750,共4页
为了解决大规模复杂多边形数据合并运算效率问题,减少在空间数据库中检索多边形时的磁盘读取次数,针对多核环境下简单要素类多边形合并的特点,利用Hilbert曲线划分方法对简单要素的多边形进行空间数据划分,利用多核处理器并发执行,充分... 为了解决大规模复杂多边形数据合并运算效率问题,减少在空间数据库中检索多边形时的磁盘读取次数,针对多核环境下简单要素类多边形合并的特点,利用Hilbert曲线划分方法对简单要素的多边形进行空间数据划分,利用多核处理器并发执行,充分利用了多核计算环境中CPU的计算能力,保证了合理的任务分配与充分利用。介绍了该算法中用到的简单要素类多边形合并算子,利用对重合边的判断来进行多边形的合并;最后对提出的算法进行了实验分析。实验证明,本算法在进行大数据的多边形集合合并时效率较高,基于本算法开发的功能用于实际问题中可较好地解决大规模复杂多边形数据层合并运算的效率问题。 展开更多
关键词 多边形合并 HILBERT曲线 多核计算 简单要素模型
下载PDF
马尔科夫链蒙特卡洛算法并行化设计与性能分析 被引量:3
9
作者 周玉科 刘建文 王妍 《计算机应用与软件》 2017年第12期250-255,272,共7页
马尔科夫链蒙特卡洛MCMC(Markov Chain Monte Carlo)算法广泛应用于地球系统模型中参数不确定性分析和模拟。由于地球环境科学数据的高维度、大容量特性,迫切需求高性能的MCMC算法满足应用需求。采用数据分治法实现该算法的多核并行化... 马尔科夫链蒙特卡洛MCMC(Markov Chain Monte Carlo)算法广泛应用于地球系统模型中参数不确定性分析和模拟。由于地球环境科学数据的高维度、大容量特性,迫切需求高性能的MCMC算法满足应用需求。采用数据分治法实现该算法的多核并行化。利用静态和动态分配策略将算法中的多个输入链分配到各CPU;独立计算并通过共享内存实现进程间通信;主进程回收各单元计算结果,合成最终的马尔可夫链输出矩阵。采用控制变量法分析不同样本和马尔可夫链数量下的算法加速情况。结果表明在计算规模较大、动态负载均衡的条件下易于获得较好的加速比,在4个CPU以内时效果显著,之后随着CPU增加加速效果出现波动或趋于稳定。研究表明并行化MCMC能够利用多核CPU硬件设施获得加速效果,更多核数的加速性能存在进一步优化的空间。 展开更多
关键词 马尔可夫链蒙特卡洛 分治法则 多核计算 共享内存 加速性能
下载PDF
多核环境下非线性特征值问题残量反迭代法并行计算
10
作者 王顺绪 《淮海工学院学报(自然科学版)》 CAS 2013年第1期1-4,共4页
非线性特征值问题不满足Schur类分解的结论,因此线性特征值问题的很多数值方法不能直接推广到非线性问题.基于多核并行环境的非线性特征值问题数值解法的并行计算,给出了适合于多核并行环境的并行Newton类残量反迭代算法,在多核计算环... 非线性特征值问题不满足Schur类分解的结论,因此线性特征值问题的很多数值方法不能直接推广到非线性问题.基于多核并行环境的非线性特征值问题数值解法的并行计算,给出了适合于多核并行环境的并行Newton类残量反迭代算法,在多核计算环境上使用Intel Fortran+OpenMP进行了数值试验.数值试验结果表明算法具有较高的加速比和并行效率. 展开更多
关键词 非线性特征值问题 多核计算 OPENMP
下载PDF
基于OpenMP的Kriging插值算法研究 被引量:5
11
作者 陈欢 谢健 《计算机科学》 CSCD 北大核心 2012年第B06期392-395,共4页
随着多核处理器的普及,并为了充分利用多核PC机的特性,计算机技术逐渐向多核架构及多核计算技术发展。为提高对湖南地区100m×100m小网格气温插值的速度,采用以OpenMP为标准的基于共享存储的并行编程模型对Kriging插值算法进行改进... 随着多核处理器的普及,并为了充分利用多核PC机的特性,计算机技术逐渐向多核架构及多核计算技术发展。为提高对湖南地区100m×100m小网格气温插值的速度,采用以OpenMP为标准的基于共享存储的并行编程模型对Kriging插值算法进行改进。在不同核的多核PC机中,采用100m×100m小网格和500m×500m小网格地形数据对平均气温进行插值,不仅有效减少了插值时间和提高了算法的加速比,而且集成到业务系统中大大提升了系统的反应时间及性能。 展开更多
关键词 多核计算 OpenMP模型 KRIGING插值 小网格插值
下载PDF
多图像同态滤波的CPU和GPU并行计算 被引量:1
12
作者 玉易 钟诚 +1 位作者 郑明 叶波 《计算机与数字工程》 2014年第10期1777-1781,共5页
采取CPU分发图像滤波任务和回收滤波结果、将多个图像数据划分分配给多个GPU及其线程块、GPU调用核函数库对图像进行傅里叶变换和反傅里叶变换的方法,设计实现了CPU和GPU协同计算的多图像同态滤波并行算法。实验结果表明,给出的多图像... 采取CPU分发图像滤波任务和回收滤波结果、将多个图像数据划分分配给多个GPU及其线程块、GPU调用核函数库对图像进行傅里叶变换和反傅里叶变换的方法,设计实现了CPU和GPU协同计算的多图像同态滤波并行算法。实验结果表明,给出的多图像同态滤波并行算法高效,与单GPU计算的并行算法相比,多GPU协同计算的并行算法显著缩短了多个图像同态滤波处理所需的时间。 展开更多
关键词 图像增强 同态滤波 并行 多核计算 GPU
下载PDF
基于VS2012的并行计算实验平台搭建与实现 被引量:2
13
作者 陈华 王明君 《实验室研究与探索》 CAS 北大核心 2015年第2期125-127,共3页
结合最新的并行计算技术,基于VS2012搭建了Open MP、MPI、C++AMP、CUDA 6.0等四个并行实验平台,并对不同实验平台实现PI值计算。实验结果说明这种并行计算环境具有良好的性能与可扩展性;Open MP与MPI等CPU计算加速效果与CPU内核数目成比... 结合最新的并行计算技术,基于VS2012搭建了Open MP、MPI、C++AMP、CUDA 6.0等四个并行实验平台,并对不同实验平台实现PI值计算。实验结果说明这种并行计算环境具有良好的性能与可扩展性;Open MP与MPI等CPU计算加速效果与CPU内核数目成比例,C++AMP与CUDA 6.0等GPU计算加速效果与GPU物理计算核心数目成正比;同等条件下GPU物理计算核心数目远多于CPU核心数目,用GPU进行计算往往可获得更高的性价比。 展开更多
关键词 并行实验平台 VS2012 多核计算 GPU并行计 MPI并行计
下载PDF
一种新型的并行化多栅光流计算实现方法
14
作者 乔峰 《电子科学技术》 2015年第4期475-481,共7页
计算机架构发展的新趋势表明,并行处理正在进入通过许多核心处理器和多核嵌入式芯片进行计算的新领域,这意味着传统的计算机领域必须使用并行编程开发应用程序,特别是在生物医学图像处理领域并行应用程序将起到关键的作用。本论文研究... 计算机架构发展的新趋势表明,并行处理正在进入通过许多核心处理器和多核嵌入式芯片进行计算的新领域,这意味着传统的计算机领域必须使用并行编程开发应用程序,特别是在生物医学图像处理领域并行应用程序将起到关键的作用。本论文研究了多栅光流计算的并行性和可扩展性。主要难点是从串行程序中提取完成并行计算需要的足够多的并行性,并提高可扩展性。目前我们很难使用现有的多线程编程方法来开发应用程序。幸好Intel公司推出Cn C,TBB Ar BB和Cilk++多核编程模型。我们使用简单有效的Cn C编程模型对多栅光流计算进行建模。本论文描述如何使用Cn C方法实现高性能多栅光流计算应用程序,并把它和现有方法进行比较。在一个带有至强处理器X5460、3.16GHz、8核CPU的平台上测试,Cn C并行解决方案比串行代码运行效率高6倍以上。相比于其它的并行解决方法,本文对比了其它实现方法包括ArBB、Cilk++和SIMD。相比于SIMD、ArBB和Cilk++的并行实现方法 ,本论文提出的并行方案方法大约有10%的性能提升。 展开更多
关键词 CnC 多核计算 并行编程模型 多栅光流
下载PDF
多核处理器的机载激光雷达点云并行三角网渐进加密滤波方法 被引量:32
15
作者 亢晓琛 刘纪平 林祥国 《测绘学报》 EI CSCD 北大核心 2013年第3期331-336,共6页
滤波是机载LiDAR点云数据处理的关键步骤之一,点云数据的海量化特性使得一般的串行化滤波处理方法无法满足快速成图的应用需求。提出一种基于多核计算技术的并行三角网渐进加密滤波方法,将串行方法中最耗时的三角网构建与脚点判别过程... 滤波是机载LiDAR点云数据处理的关键步骤之一,点云数据的海量化特性使得一般的串行化滤波处理方法无法满足快速成图的应用需求。提出一种基于多核计算技术的并行三角网渐进加密滤波方法,将串行方法中最耗时的三角网构建与脚点判别过程进行了并行化改造。三角网构建算法的并行化基于分治法实现,脚点判别算法的并行化采用一种随机分配策略将三角网划分为多个离散分布的三角形子集合来实现负载均衡。并行滤波方法在8核环境下多次渐进加密的实际加速比达到3.1左右。试验证明,该方法可以充分发挥多核计算优势,并且对不同分布形态点云数据具有良好的适应性。 展开更多
关键词 点云 并行滤波 三角网渐进加密 多核计算
下载PDF
负载均衡策略研究综述 被引量:21
16
作者 王荣生 杨际祥 王凡 《小型微型计算机系统》 CSCD 北大核心 2010年第8期1681-1686,共6页
负载均衡是最大化处理器利用率和提高并行计算效率的一个关键问题,而其发展相对滞后的软件成为影响并行计算应用发展的重要因素.本文给出负载均衡问题的一般性阐述,从算法理论和并行计算应用问题角度出发综述了现有负载均衡策略及其软... 负载均衡是最大化处理器利用率和提高并行计算效率的一个关键问题,而其发展相对滞后的软件成为影响并行计算应用发展的重要因素.本文给出负载均衡问题的一般性阐述,从算法理论和并行计算应用问题角度出发综述了现有负载均衡策略及其软件的研究成果.结合当前新兴并行体系结构和应用的发展趋势,分析并指出了下一步研究的问题和方向. 展开更多
关键词 并行计 负载均衡 多核计算 软件
下载PDF
多核图像处理并行设计范式的研究与应用 被引量:8
17
作者 王成良 谢克家 刘昕 《计算机工程》 CAS CSCD 北大核心 2011年第14期220-222,225,共4页
多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模... 多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模、映射、调试和性能评价及测试发布等5个设计步骤的基于多核计算环境的图像处理算法并行设计范式,以图像傅里叶变换并行算法设计为例在单核、双核、四核、八核计算环境下验证了该并行范式的有效性。实验结果表明,该范式在图像处理并行设计方面可扩展图像处理的应用空间。 展开更多
关键词 并行 并行设计范式 图像处理 多核计算环境 可扩展性
下载PDF
一种基于V^3模型的内存数据库性能分析研究 被引量:2
18
作者 王寅峰 王龙翔 《计算机技术与发展》 2015年第6期77-83,共7页
针对大数据时代各种复杂业务对数据处理日益增长的性能要求,以及对数据管理中:模式自由、高可用、轻量级复制、大容量水平可扩展等方面的需要,文中从内存数据库的存储类型、体系结构、规模、并发性、可用性与可扩展性等方面对19种主流... 针对大数据时代各种复杂业务对数据处理日益增长的性能要求,以及对数据管理中:模式自由、高可用、轻量级复制、大容量水平可扩展等方面的需要,文中从内存数据库的存储类型、体系结构、规模、并发性、可用性与可扩展性等方面对19种主流内存数据库进行了对比分析。提出了一种综合考虑处理速度、规模与可扩展性的V3性能模型,对主流内存数据库进行了分类,并选取了有代表性的内存数据库在高频量化交易测试环境进行性能分析与测试。结果表明,New SQL数据库有较好的综合性能。为提高内存数据库在多任务并行情况下处理的速度,文中对多核环境中内存数据库的设计与优化进行了分析,将优化过程分为访存、并发加速和数据划分模式,并对内存数据库发展进行了展望。 展开更多
关键词 内存数据库 事物处理 性能模型 高频量化 多核计算
下载PDF
GIS高性能空间分析研究进展 被引量:4
19
作者 张帅 伍传敏 《三明学院学报》 2011年第6期24-29,共6页
伴随着多核计算平台的发展和地理空间信息的爆炸性增长,并行地理信息系统(GIS)的时代已经到来。空间分析是GIS的核心,其性能直接制约着GIS软件的竞争力。多核计算环境为空间分析技术的发展提供了新的机遇,依据空间分析的5个功能领域逐... 伴随着多核计算平台的发展和地理空间信息的爆炸性增长,并行地理信息系统(GIS)的时代已经到来。空间分析是GIS的核心,其性能直接制约着GIS软件的竞争力。多核计算环境为空间分析技术的发展提供了新的机遇,依据空间分析的5个功能领域逐个探讨其在高性能环境下的并行算法复杂度和空间资源组织复杂度,以揭示在各个功能上的并行化的主要问题和挑战。 展开更多
关键词 GIS空间分析 高性能计 多核计算环境
下载PDF
基于函数式中间语言的XML查询并行化 被引量:3
20
作者 陈荣鑫 《重庆理工大学学报(自然科学)》 CAS 2011年第7期81-86,共6页
给出一种并行化的函数式中间语言——pFL的语义描述,通过并行原语的设计和组织,在执行层实现并行化查询。设计基于pFL的原型系统,并进行典型实例测试。初步实验结果表明,该原型系统能较好地实现多核条件下的XML并行查询。
关键词 XML查询 中间语言 语义描述 并行原语 多核计算
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部