期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于TBB任务调度器的N皇后多核并行算法 被引量:6
1
作者 郑晓薇 张建强 《计算机工程与设计》 CSCD 北大核心 2010年第15期3423-3426,共4页
为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式。基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式。利用任务调度器,设计了N皇后问题在多核处理器的并行算法。该算法将任务自动地映射到... 为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式。基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式。利用任务调度器,设计了N皇后问题在多核处理器的并行算法。该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率。并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率。 展开更多
关键词 多核 并行 TBB线程构建模块 任务调度器 N皇后算法
下载PDF
基于TBB的傅里叶变换多核并行化实现 被引量:5
2
作者 杨川 杨斌 《计算机工程》 CAS CSCD 北大核心 2010年第16期288-290,共3页
通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相... 通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相互独立的空间,并把这些空间的运算尽可能分配到多核上,实现了对传统傅里叶变换的并行化改造,并取得较好的效果。 展开更多
关键词 傅里叶变换 英特尔软件开发套件 英特尔线程构建模块 并行化
下载PDF
基于GPU的MD6算法快速实现 被引量:2
3
作者 李立新 叶剑 余洋 《北京工业大学学报》 EI CAS CSCD 北大核心 2010年第5期640-645,650,共7页
安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的... 安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的实现安全散列算法提供了有效的途径. 展开更多
关键词 图形处理器 SHA算法 MD6算法 线程构建模块 计算统一设备架构
下载PDF
分形计算的并行设计及TBB实现 被引量:1
4
作者 陈荣鑫 陈维斌 廖湖声 《计算机应用》 CSCD 北大核心 2011年第3期839-842,共4页
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡... 线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡优化方法,通过采样执行时间来估算工作负载,据此进行均衡的任务划分,利用TBB任务调度实现并行处理。实验结果表明,采样估算精度高,耗时比率低,能有效实现负载均衡;基于TBB的实现可获得较好加速比。 展开更多
关键词 分形计算 多核并行 线程构建模块 负载平衡
下载PDF
三层并行遗传算法及装箱问题中的应用 被引量:1
5
作者 张丽岩 马健 孙焰 《微型机与应用》 2011年第17期67-70,73,共5页
提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完... 提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完整表现并行性的代码库。采用C++语言实现了基于TBB的TPGA和串行遗传算法(SGA),通过大量实验证明,TPGA同SGA相比,不但提高了收敛速度,而且能够取得一致的最优解。 展开更多
关键词 线程 三层并行遗传算法 线程构建模块 装箱问题
下载PDF
基于Parallel studio的视频编解码并行化优化
6
作者 杨川 杨斌 +1 位作者 李刚 李杰 《微计算机应用》 2010年第3期42-46,共5页
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较... 随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较流行的视频编解码算法h.263为例,通过一个具体的视频会议系统,分析传统串行编解码算法的性能,通过英特尔Parallel studio并行化分析工具,找到算法的运行瓶颈,然后用英特尔线程构建模块对编解码算法进行并行化优化,取得了良好的效果。 展开更多
关键词 并行化 英特尔线程构建模块 英特尔并行化分析工具
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部