期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于2阶段同步的GPGPU线程块压缩调度方法 被引量:1
1
作者 张军 何炎祥 +2 位作者 沈凡凡 江南 李清安 《计算机研究与发展》 EI CSCD 北大核心 2016年第6期1173-1185,共13页
通用图形处理器(general purpose graphics processing unit,GPGPU)在面向高性能计算、高吞吐量的通用计算领域的应用日益广泛,它采用的SIMD(single instruction multiple data)执行模式使其能获得强大的并行计算能力.目前主流的通用图... 通用图形处理器(general purpose graphics processing unit,GPGPU)在面向高性能计算、高吞吐量的通用计算领域的应用日益广泛,它采用的SIMD(single instruction multiple data)执行模式使其能获得强大的并行计算能力.目前主流的通用图形处理器均通过大量高度并行的线程完成计算任务的高效执行.但是在处理条件分支转移的控制流中,由于通用图形处理器采用串行的方式顺序处理不同的分支路径,使得其并行计算能力受到影响.在分析讨论前人针对分支转移处理低效的线程块压缩重组调度方法的基础上,提出了2阶段同步的线程块压缩重组调度方法 TSTBC(two-stage synchronization based thread block compaction scheduling),通过线程块压缩重组适合性判断逻辑部件,分2个阶段对线程块进行压缩重组有效性分析,进一步减少了无效的线程块压缩重组次数.模拟实验结果表明:该方法较好地提高了线程块的压缩重组有效性,相对于其他同类方法降低了对线程组内部数据局部性的破坏,并使得片上一级数据cache的访问失效率得到有效降低;相对于基准体系结构,系统性能提升了19.27%. 展开更多
关键词 通用图形处理器 线程调度 线程块压缩重组 2阶段同步 分支转移
下载PDF
基于CUDA的快速光线投射法 被引量:5
2
作者 董现玲 江贵平 张煜 《北京生物医学工程》 2010年第2期125-129,共5页
NVIDIA的GeForce8系列显卡上的统一设备架构(common unified device architecture,CUDA)不需要映射到图形API便可在GPU上进行计算的分配和管理,因此较适合于大数据量的医学图像可视化领域。本文分析了CUDA的设计思想和编程模式,针对其... NVIDIA的GeForce8系列显卡上的统一设备架构(common unified device architecture,CUDA)不需要映射到图形API便可在GPU上进行计算的分配和管理,因此较适合于大数据量的医学图像可视化领域。本文分析了CUDA的设计思想和编程模式,针对其特点对传统基于硬件的光线投射法进行改进,将计算耗时的绘制部分改造成单指令多数据模式(single instruction multiple data,SIMD),并分别运用纹理存储器和共享存储器对算法进行优化。实验结果表明,该方法能够快速、高效地生成可视化图像。 展开更多
关键词 光线投射 CUDA GPU 线程块 优化
下载PDF
Windows环境下基于栈和堆的应用程序行为解析方法研究
3
作者 罗文华 王强 《警察技术》 2015年第1期46-49,共4页
通过描述Windows中与栈及堆密切相关的系统结构,说明其定位方法,并重点讨论其结构格式的电子数据取证特性,为内存空间电子数据取证提供了新的思路与方法。实例分析部分,则以目前广泛使用的Windows操作系统为应用背景,说明了所述方法的... 通过描述Windows中与栈及堆密切相关的系统结构,说明其定位方法,并重点讨论其结构格式的电子数据取证特性,为内存空间电子数据取证提供了新的思路与方法。实例分析部分,则以目前广泛使用的Windows操作系统为应用背景,说明了所述方法的具体应用。 展开更多
关键词 应用程序行为 核心线程块 线程环境
下载PDF
MPI+TBB混合并行编程模型在分子动力学中的应用 被引量:2
4
作者 白明泽 赵文辉 +2 位作者 豆育升 孙世新 温迪 《计算机应用研究》 CSCD 北大核心 2012年第5期1772-1774,1794,共4页
为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点... 为了提高分子动力学模拟在对称多处理(SMP)集群上的计算速度,在分子动力学并行方法中引入MPI+TBB的混合并行编程模型。基于该模型,在分子动力学软件LAMMPS中设计并实现混合并行算法,在节点间采用MPI及空间分解技术实施进程级并行,节点内采用TBB及临界区技术实施线程级并行。在SMP集群中的测试表明,该方法在体系较大以及节点数较多时可以明显减少通信时间,使加速比在纯MPI模型上提高45%。结果表明,MPI+TBB混合并行编程模型可促进分子动力学并行模拟且效率明显提升。 展开更多
关键词 分子动力学 混合并行编程模型 SMP集群 MPI 线程构建
下载PDF
Windows(2000/XP)下隐藏进程的检测机制 被引量:7
5
作者 王驎峰 董亮卫 《计算机工程》 EI CAS CSCD 北大核心 2006年第20期95-96,99,共3页
随着计算机技术的不断发展,近期出现了利用Windows(2000/XP)内核设计上的漏洞隐藏自身进程的入侵技术。针对这种隐藏技术提出了利用内核进程环境控制块(KPEB)、内核线程环境控制块(KTEB)以及Windows操作系统的调度机制来检测这些隐藏进... 随着计算机技术的不断发展,近期出现了利用Windows(2000/XP)内核设计上的漏洞隐藏自身进程的入侵技术。针对这种隐藏技术提出了利用内核进程环境控制块(KPEB)、内核线程环境控制块(KTEB)以及Windows操作系统的调度机制来检测这些隐藏进程的新方法,并给出了代码示例。 展开更多
关键词 进程 隐藏 内核进程环境控制 内核线程环境控制 检测
下载PDF
针对进程用户空间的电子数据取证方法研究
6
作者 罗文华 《中国司法鉴定》 2014年第5期64-68,共5页
进程用户空间中的信息往往与特定用户的特定操作行为直接关联,对于证据链的建立意义重大。从数目繁多的用户空间数据结构中筛选出最重要的三种:进程环境块、线程环境块与虚拟地址描述符,说明其定位方法,并重点讨论其结构格式的电子数据... 进程用户空间中的信息往往与特定用户的特定操作行为直接关联,对于证据链的建立意义重大。从数目繁多的用户空间数据结构中筛选出最重要的三种:进程环境块、线程环境块与虚拟地址描述符,说明其定位方法,并重点讨论其结构格式的电子数据取证特性,为内存空间电子数据取证提供了新的思路与方法。实例分析部分,则以目前广泛使用的Windows 7操作系统为应用背景,说明了所述方法的具体应用。 展开更多
关键词 进程用户空间 电子数据取证 进程环境 线程环境 虚拟地址描述符
下载PDF
基于TBB的二维DCT并行化设计
7
作者 陈荣鑫 杨岳斌 《微计算机应用》 2011年第11期53-57,共5页
线程构造块(TBB)能简化并行化设计,支持高效地实现多核并行功能。给出面向多核计算的二维DCT的并行化方法,并利用TBB平台实现;针对高耗时的余弦计算,利用查表和分块计算措施进行优化,并探讨粒度设置方法。在多核环境中的实验结果表明,... 线程构造块(TBB)能简化并行化设计,支持高效地实现多核并行功能。给出面向多核计算的二维DCT的并行化方法,并利用TBB平台实现;针对高耗时的余弦计算,利用查表和分块计算措施进行优化,并探讨粒度设置方法。在多核环境中的实验结果表明,优化后的并行化方法能有效改善执行性能,获得较好的加速比,且具备可扩展性。 展开更多
关键词 线程构造 并行化 二维DCT 多核计算
下载PDF
MICROTHREAD BASED (MTB) COARSE GRAINED FAULT TOLERANCE SUPERSCALAR PROCESSOR ARCHITECTURE 被引量:3
8
作者 Fu Zhongchuan Chen Hongsong Cui Gang 《Journal of Electronics(China)》 2006年第3期461-466,共6页
Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance archit... Fault tolerance in microprocessor systems has become a popular topic of architecture research. Much work has been done at different levels to accomplish reliability against soft errors, and some fault tolerance architectures have been proposed. But little attention is paid to the thread level superscalar fault tolerance. This letter introduces microthread concept into superscalar processor fault tolerance domain, and puts forward a novel fault tolerance architecture, namely, MicroThread Based (MTB) coarse grained transient fault tolerance superscalar processor architecture, then discusses some detailed implementations. 展开更多
关键词 Microthread Basic block Coarse grained fault tolerance Superscalar processor
下载PDF
A BLOCK GENERALIZED MINIMUM BACKWARD (BGMBACK) ERROR ALGORITHM FOR NONSYMMETRIC LINEAR SYSTEMS
9
作者 魏红霞 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2002年第2期208-212,共5页
Many applications require the solution of large nonsymmetric linear systems with multiple right hand sides. Instead of applying an iterative method to each of these systems individually, it is often more efficient to... Many applications require the solution of large nonsymmetric linear systems with multiple right hand sides. Instead of applying an iterative method to each of these systems individually, it is often more efficient to use a block version of the method that generates iterates for all the systems simultaneously. In this paper, we propose a block version of generalized minimum backward (GMBACK) for solving large multiple nonsymmetric linear systems. The new method employs the block Arnoldi process to construct a basis for the Krylov subspace K m(A, R 0) and seeks X m∈X 0+K m(A, R 0) to minimize the norm of the perturbation to the data given in A. 展开更多
关键词 multiple right hand sides Krylov sub space block Arnoldi process
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部