期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于TBB任务调度器的N皇后多核并行算法
被引量:
6
1
作者
郑晓薇
张建强
《计算机工程与设计》
CSCD
北大核心
2010年第15期3423-3426,共4页
为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式。基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式。利用任务调度器,设计了N皇后问题在多核处理器的并行算法。该算法将任务自动地映射到...
为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式。基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式。利用任务调度器,设计了N皇后问题在多核处理器的并行算法。该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率。并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率。
展开更多
关键词
多核
并行
TBB
线程构建模块
任务调度器
N皇后算法
下载PDF
职称材料
基于TBB的傅里叶变换多核并行化实现
被引量:
5
2
作者
杨川
杨斌
《计算机工程》
CAS
CSCD
北大核心
2010年第16期288-290,共3页
通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相...
通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相互独立的空间,并把这些空间的运算尽可能分配到多核上,实现了对传统傅里叶变换的并行化改造,并取得较好的效果。
展开更多
关键词
傅里叶变换
英特尔软件开发套件
英特尔
线程构建模块
并行化
下载PDF
职称材料
基于GPU的MD6算法快速实现
被引量:
2
3
作者
李立新
叶剑
余洋
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010年第5期640-645,650,共7页
安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的...
安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的实现安全散列算法提供了有效的途径.
展开更多
关键词
图形处理器
SHA算法
MD6算法
线程构建模块
计算统一设备架构
下载PDF
职称材料
分形计算的并行设计及TBB实现
被引量:
1
4
作者
陈荣鑫
陈维斌
廖湖声
《计算机应用》
CSCD
北大核心
2011年第3期839-842,共4页
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡...
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡优化方法,通过采样执行时间来估算工作负载,据此进行均衡的任务划分,利用TBB任务调度实现并行处理。实验结果表明,采样估算精度高,耗时比率低,能有效实现负载均衡;基于TBB的实现可获得较好加速比。
展开更多
关键词
分形计算
多核并行
线程构建模块
负载平衡
下载PDF
职称材料
三层并行遗传算法及装箱问题中的应用
被引量:
1
5
作者
张丽岩
马健
孙焰
《微型机与应用》
2011年第17期67-70,73,共5页
提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完...
提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完整表现并行性的代码库。采用C++语言实现了基于TBB的TPGA和串行遗传算法(SGA),通过大量实验证明,TPGA同SGA相比,不但提高了收敛速度,而且能够取得一致的最优解。
展开更多
关键词
多
线程
三层并行遗传算法
线程构建模块
装箱问题
下载PDF
职称材料
基于Parallel studio的视频编解码并行化优化
6
作者
杨川
杨斌
+1 位作者
李刚
李杰
《微计算机应用》
2010年第3期42-46,共5页
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较...
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较流行的视频编解码算法h.263为例,通过一个具体的视频会议系统,分析传统串行编解码算法的性能,通过英特尔Parallel studio并行化分析工具,找到算法的运行瓶颈,然后用英特尔线程构建模块对编解码算法进行并行化优化,取得了良好的效果。
展开更多
关键词
并行化
英特尔
线程构建模块
英特尔并行化分析工具
下载PDF
职称材料
题名
基于TBB任务调度器的N皇后多核并行算法
被引量:
6
1
作者
郑晓薇
张建强
机构
辽宁师范大学计算机与信息技术学院
出处
《计算机工程与设计》
CSCD
北大核心
2010年第15期3423-3426,共4页
基金
国家自然科学基金项目(60603047)
辽宁省教育厅高等学校科研基金项目(05L209)
文摘
为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式。基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式。利用任务调度器,设计了N皇后问题在多核处理器的并行算法。该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率。并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率。
关键词
多核
并行
TBB
线程构建模块
任务调度器
N皇后算法
Keywords
multi-core
parallel
TBB
task scheduler
N queens algorithm
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于TBB的傅里叶变换多核并行化实现
被引量:
5
2
作者
杨川
杨斌
机构
西南交通大学信息科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第16期288-290,共3页
文摘
通过对传统傅里叶变换的分析,发现其运行的瓶颈主要是循环体的运算效率低下,并且程序执行时只会被分配到一个硬件核上,并没有充分利用多核。针对上述问题,通过对英特尔线程构建模块(TBB)的研究与应用,使得循环体内的运算被划分为各个相互独立的空间,并把这些空间的运算尽可能分配到多核上,实现了对传统傅里叶变换的并行化改造,并取得较好的效果。
关键词
傅里叶变换
英特尔软件开发套件
英特尔
线程构建模块
并行化
Keywords
Fourier transform
Intel software development tools
Intel threading building blocks
parallelization
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于GPU的MD6算法快速实现
被引量:
2
3
作者
李立新
叶剑
余洋
机构
信息工程大学电子技术学院
出处
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010年第5期640-645,650,共7页
基金
国家'八六三'计划基金资助项目(2008AA01Z404)
文摘
安全散列算法(SHA)已经被广泛地应用于电子商务等信息安全领域.为了满足安全散列算法计算速度的需要,本文通过对SHA-3算法的候选算法——MD6算法的并行性分析,在GPU平台上快速实现了MD6算法,其最快实现速度是CPU速度的5倍,为快速高效的实现安全散列算法提供了有效的途径.
关键词
图形处理器
SHA算法
MD6算法
线程构建模块
计算统一设备架构
Keywords
GPU
SHA algorithm
MD6 algorithm
TBB
CUDA
分类号
TP309 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
分形计算的并行设计及TBB实现
被引量:
1
4
作者
陈荣鑫
陈维斌
廖湖声
机构
集美大学计算机工程学院
北京工业大学计算机学院
华侨大学计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2011年第3期839-842,共4页
基金
福建省自然科学基金资助项目(2008J04005)
北京市自然科学基金资助项目(4082003)
文摘
线程构建模块(TBB)基于模板的特点简化了并行化设计,适合高效地实现多核并行设计。针对分形计算具有计算密集和高耗时的特点,结合TBB并行化设计,以充分利用多核计算资源。对影响并行性能的计算负载不平衡问题,提出了基于采样估算的平衡优化方法,通过采样执行时间来估算工作负载,据此进行均衡的任务划分,利用TBB任务调度实现并行处理。实验结果表明,采样估算精度高,耗时比率低,能有效实现负载均衡;基于TBB的实现可获得较好加速比。
关键词
分形计算
多核并行
线程构建模块
负载平衡
Keywords
fractal computing
multi-core parallelism
Threading Building Blocks (TBB)
workload balance
分类号
TP311.11 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
三层并行遗传算法及装箱问题中的应用
被引量:
1
5
作者
张丽岩
马健
孙焰
机构
同济大学交通运输工程学院
苏州科技学院土木工程学院
出处
《微型机与应用》
2011年第17期67-70,73,共5页
基金
国家自然科学基金(71072027)
博士点基金(200802471072)
文摘
提出了一个新的基于线程构建模块(TBB)的三层并行遗传算法(TPGA)。与传统遗传算法相比,在保证了算法正确性的前提下提高了运行效率,并将遗传算法的数据编码、任务处理和数据解码分别进行并行化,提高了收敛速度。TBB是Intel提供的能够完整表现并行性的代码库。采用C++语言实现了基于TBB的TPGA和串行遗传算法(SGA),通过大量实验证明,TPGA同SGA相比,不但提高了收敛速度,而且能够取得一致的最优解。
关键词
多
线程
三层并行遗传算法
线程构建模块
装箱问题
Keywords
multi-thread
three-tier parallel genetic algorithm
threading building blocks (TBB)
bin-packing problem
分类号
F252 [经济管理—国民经济]
下载PDF
职称材料
题名
基于Parallel studio的视频编解码并行化优化
6
作者
杨川
杨斌
李刚
李杰
机构
西南交通大学信息科学与技术学院
出处
《微计算机应用》
2010年第3期42-46,共5页
文摘
随着计算机技术的不断发展,人们对多媒体技术的实时性有了更高的要求,特别是视频编解码的时间效率。另外,随着多核CPU及相关技术的不断普及,使得原有非并行化程序的性能的不足显现了出来,因此对传统程序的并行化迫在眉睫。本文以目前较流行的视频编解码算法h.263为例,通过一个具体的视频会议系统,分析传统串行编解码算法的性能,通过英特尔Parallel studio并行化分析工具,找到算法的运行瓶颈,然后用英特尔线程构建模块对编解码算法进行并行化优化,取得了良好的效果。
关键词
并行化
英特尔
线程构建模块
英特尔并行化分析工具
Keywords
parallelization
Intel Threading Building Blocks
Intel Parallel Studio
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于TBB任务调度器的N皇后多核并行算法
郑晓薇
张建强
《计算机工程与设计》
CSCD
北大核心
2010
6
下载PDF
职称材料
2
基于TBB的傅里叶变换多核并行化实现
杨川
杨斌
《计算机工程》
CAS
CSCD
北大核心
2010
5
下载PDF
职称材料
3
基于GPU的MD6算法快速实现
李立新
叶剑
余洋
《北京工业大学学报》
EI
CAS
CSCD
北大核心
2010
2
下载PDF
职称材料
4
分形计算的并行设计及TBB实现
陈荣鑫
陈维斌
廖湖声
《计算机应用》
CSCD
北大核心
2011
1
下载PDF
职称材料
5
三层并行遗传算法及装箱问题中的应用
张丽岩
马健
孙焰
《微型机与应用》
2011
1
下载PDF
职称材料
6
基于Parallel studio的视频编解码并行化优化
杨川
杨斌
李刚
李杰
《微计算机应用》
2010
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部