期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
一种基于线程的数据预取方法 被引量:3
1
作者 欧国东 张民选 《计算机工程与科学》 CSCD 2008年第1期119-122,共4页
多线程、多核处理器的推广受限于应用。目前,大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场并行执行来提高速度。使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用... 多线程、多核处理器的推广受限于应用。目前,大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场并行执行来提高速度。使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度。在基于线程的数据预取方法中,数据预取线程是从主线程的执行踪迹中提取的。它们使用空闲的现场,和主线程并行执行,在主线程需要数据之前把数据取到离处理器更近的存储层次。基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式。本文具体分析了应用程序中访存行为的特点,结合控制流处理,设计并验证了一种基于线程的数据预取方法TDP。模拟结果显示,使用TDP可以获得7%左右的性能提升。 展开更多
关键词 线程应用 线程处理器 数据线程 TDP
下载PDF
面向非规则大数据分析应用的多核帮助线程预取方法 被引量:4
2
作者 张建勋 古志民 +1 位作者 胡潇涵 蔡旻 《通信学报》 EI CSCD 北大核心 2014年第8期137-146,共10页
大数据分析应用往往采用基于大型稀疏图的遍历算法,其主要特点是非规则数据密集访存。以频繁使用的具有大型稀疏图遍历特征的介度中心算法为例,提出一种基于帮助线程的多参数预取控制模型和参数优化方法,从而达到提高非规则数据密集程... 大数据分析应用往往采用基于大型稀疏图的遍历算法,其主要特点是非规则数据密集访存。以频繁使用的具有大型稀疏图遍历特征的介度中心算法为例,提出一种基于帮助线程的多参数预取控制模型和参数优化方法,从而达到提高非规则数据密集程序性能的目的。在商用多核平台Q6600和I7上运用该方法后,介度中心算法在不同规模输入下平均性能加速比分别为1.20和1.11。实验结果表明,帮助线程预取能够有效提升该类非规则应用程序的性能。 展开更多
关键词 帮助线程 非规则数据密集应用 介度中心性
下载PDF
基于线程的多路径数据预取技术研究
3
作者 欧国东 王永文 张民选 《计算机研究与发展》 EI CSCD 北大核心 2011年第S1期328-334,共7页
多核多线程处理器应用日益广泛,但传统应用多为单线程的串行程序,不能充分利用多线程处理器提供的多个现场,难以通过并行执行来提高执行速度.如何使用空闲现场加速单线程应用成为多线程微处理器领域研究的一个热点.基于线程的数据预取... 多核多线程处理器应用日益广泛,但传统应用多为单线程的串行程序,不能充分利用多线程处理器提供的多个现场,难以通过并行执行来提高执行速度.如何使用空闲现场加速单线程应用成为多线程微处理器领域研究的一个热点.基于线程的数据预取方法利用空闲现场执行数据预取线程,计算关键指令访存地址并发起预取,可以改善系统存储行为、加速单线程执行、提高系统吞吐率.在数据流分析的基础上,扩充了控制流分析,提出了一种基于线程的多路径数据预取方法,研究了多种执行控制策略.模拟结果表明:根据路径信息进行数据预取,可以提高预取效率、减少预取开销. 展开更多
关键词 线程 基于线程的数据预取方法 控制流 数据 多路径
下载PDF
基于CMP的指针数据预取方法 被引量:4
4
作者 朱会东 黄永丽 宋宝卫 《计算机工程》 CAS CSCD 北大核心 2011年第6期71-73,共3页
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理... 针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。 展开更多
关键词 存储墙 链式数据结构 多核多线程 数据
下载PDF
帮助线程预取质量的实时在线评价方法 被引量:2
5
作者 张建勋 古志民 《计算机应用》 CSCD 北大核心 2017年第1期114-119,127,共7页
针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮助线程预取质量的实时在线评价方法。首先,明确了帮助线程的预取服务质量(QoS)的目标;其次,分析了帮助线程预取性能评价的动态指标,对帮助线程预取QoS进行了建模分析... 针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮助线程预取质量的实时在线评价方法。首先,明确了帮助线程的预取服务质量(QoS)的目标;其次,分析了帮助线程预取性能评价的动态指标,对帮助线程预取QoS进行了建模分析;最后,提出一个帮助线程预取的动态自适应调节算法,算法根据程序的阶段行为变化和动态预取获益变化等信息来判断参数值的适用度以及是否需要进行反馈优化,从而实现对预取控制的自适应调节。实验结果表明,应用自适应预取评价算法之后,Mst热点模块的性能提升加速比为1.496,所提出的自适应预取评价方法能够根据程序的动态阶段行为对帮助线程控制参数值作出自适应控制和调节。 展开更多
关键词 帮助线程 质量 评价方法 性能分析
下载PDF
面向单线程应用的数据预取技术研究
6
作者 欧国东 张民选 《计算机研究与发展》 EI CSCD 北大核心 2007年第z1期140-147,共8页
多线程处理器的推广受限于应用,目前大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场,并行执行以提高速度.使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问... 多线程处理器的推广受限于应用,目前大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场,并行执行以提高速度.使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度.在基于线程的数据预取方法TDP中,数据预取线程是从主线程的执行踪迹中提取的,它们使用空闲的现场,和主线程并行执行.由于数据预取线程仅仅包括和预取相关的指令,它们比主线程执行要快,可以在主线程需要数据之前,把数据取到离处理器更近的存储层次.基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式.研究控制相关对TDP的影响,具体分析使用错误前瞻的数据预取方法:通过在预取线程中加入分支指令,并用它们控制预取线程的执行过程.通过研究发现,在某些情况下即使控制前瞻已经被证实是错误的,继续执行预取线程可以获得更好的预取效果.模拟结果显示,使用错误前瞻可以获得5%的性能提升. 展开更多
关键词 线程应用 线程处理器 数据 错误前瞻
下载PDF
帮助线程预取技术研究综述 被引量:3
7
作者 张建勋 古志民 《计算机科学》 CSCD 北大核心 2013年第7期19-23,39,共6页
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连... 帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连续局部性转换为瞬时的连续时空局部性(即时局部性),从而达到通过线程级数据预取提高程序性能的目的。归纳了帮助线程预取技术的分类,概括和比较了不同帮助线程实现技术的优势和局限性,深入分析和探讨了现有的几种典型帮助线程技术的预取控制策略。最后从帮助线程实时控制、参数动态选取和优化方面指出了帮助线程预取技术的研究方向。 展开更多
关键词 帮助线程 数据 CMP(Chip Multi-Processor)平台 非规则数据密集应用
下载PDF
梯度学习的参数控制帮助线程预取模型 被引量:1
8
作者 裴颂文 张俊格 宁静 《国防科技大学学报》 EI CAS CSCD 北大核心 2016年第5期59-63,共5页
对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对... 对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对控制参数求解最优值,从而有效地控制帮助线程与主线程的访存任务量,使帮助线程领先于主线程。实验结果表明,基于参数选择的线程预取模型能获得1.1~1.5倍的系统性能加速比。 展开更多
关键词 数据 帮助线程 多核系统 访存延迟 梯度下降
下载PDF
一种面向非规则数据的预取优化组合策略 被引量:1
9
作者 黄艳 刘海燕 《科技通报》 北大核心 2016年第12期163-168,共6页
在面向非规则数据的线程预取策略中,默认开启的硬件预取会加剧共享存储资源竞争,降低整个内存系统的有效性。为解决该问题,提出一种面向非规则数据的的线程预取与硬件预取优化组合策略。该策略测试和分析了L2硬件预取配置对非规则数据... 在面向非规则数据的线程预取策略中,默认开启的硬件预取会加剧共享存储资源竞争,降低整个内存系统的有效性。为解决该问题,提出一种面向非规则数据的的线程预取与硬件预取优化组合策略。该策略测试和分析了L2硬件预取配置对非规则数据的线程预取性能与访存行为影响,并在此基础上为非规则数据的线程预取实现了L2硬件预取的配置优化。实验结果和分析表明,优化后预取组合策略减少了系统访存请求,提高了预取准确率和时效性,进一步改善了预取性能。 展开更多
关键词 非规则数据 线程 硬件 准确率
下载PDF
小计算量下非规则数据密集型热函数的性能优化
10
作者 郑宁汉 古志民 孙贤和 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2436-2443,共8页
随着云计算的兴起和发展,基于多核的非规则数据密集型应用越来越多,而大量的数据缺失问题导致这类应用的性能严重下降.利用空闲核资源的传统帮助线程方法试图提前将主线程所需要的非规则数据放入共享的最后一级缓存(last layer cache,LL... 随着云计算的兴起和发展,基于多核的非规则数据密集型应用越来越多,而大量的数据缺失问题导致这类应用的性能严重下降.利用空闲核资源的传统帮助线程方法试图提前将主线程所需要的非规则数据放入共享的最后一级缓存(last layer cache,LLC),如果帮助线程相对于主线程具有恰当的运算速度,能在主线程访问之前将有关缺失数据放入LLC中,则热函数的性能可被改进.然而,如果热函数缺乏计算任务(称之为小计算量热函数),使用这样的传统方法就无法构建一个相对于主线程有效预取的帮助线程,其热函数性能的改善将会大大降低.针对源代码级小计算量下非规则数据密集型热函数的性能优化问题,先对帮助线程预取QoS进行了形式化描述.在此基础上,通过引入提前量等参数模型,提出了一种小计算量下热函数的性能优化方法.在Intel Core 2Duo Processor 6550处理器上,通过对科学计算测试程序em3d,mst和SPEC CPU benchmark 2006中的mcf的进行实验,相对于传统方法分别获得了1.97%,31.63%和1.10%的性能提升. 展开更多
关键词 多核处理器 帮助线程 数据 计算量 非规则数据密集型热函数
下载PDF
J2EE架构下的海量数据访问技术研究 被引量:1
11
作者 和密密 孙忠林 张煜 《计算机与现代化》 2011年第12期89-91,96,共4页
海量数据处理的快速响应是应用系统的性能标准之一,特别是基于Web的应用系统,响应速度直接影响应用软件的使用价值。本文研究J2EE架构下海量数据访问的优化技术,并给出应用优化技术的测试结果。
关键词 海量数据 数据库连接池 线程
下载PDF
异构HPL算法中CPU端高性能BLAS库优化 被引量:2
12
作者 蔡雨 孙成国 +3 位作者 杜朝晖 刘子行 康梦博 李双双 《软件学报》 EI CSCD 北大核心 2021年第8期2289-2306,共18页
异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整... 异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整体效率的提升尤为重要.针对具体平台体系结构特点对BLAS(basic linear algebra subprograms)函数进行优化往往可以更加充分地利用通用CPU计算能力,提高系统整体效率.BLIS(BLAS-like library instantiation software)算法库是开源的BLAS函数框架,具有易开发、易移植和模块化等优点.基于异构系统平台体系结构以及HPL算法特点,充分利用三级缓存、向量化指令和多线程并行等技术手段优化CPU端调用的各级BLAS函数,应用auto-tuning技术优化矩阵分块参数,从而形成了异构环境下优化的BLIS算法库HBLIS.与MKL相比,HPL整体性能提高了11.8%. 展开更多
关键词 BLAS 遗传算法auto-tuning 向量化指令 数据 线程并行
下载PDF
大数据查询性能优化的研究与实现
13
作者 王家强 《网络安全技术与应用》 2024年第7期76-78,共3页
随着大数据技术的迅速发展,数据查询与处理的效率成为研究的重点。本文首先介绍了大数据平台系统及其相关的技术,特别是Hadoop平台及其基本架构和分布式文件系统HDFS。接着,我们深入探讨了查询合并及数据处理机制,其中SOLCombines算法... 随着大数据技术的迅速发展,数据查询与处理的效率成为研究的重点。本文首先介绍了大数据平台系统及其相关的技术,特别是Hadoop平台及其基本架构和分布式文件系统HDFS。接着,我们深入探讨了查询合并及数据处理机制,其中SOLCombines算法在查询优化中的作用被详细描述,同时也探索了多队列与多线程并发处理技术。为了进一步提高数据查询的速度,本文研究了热点数据预取技术,并在local memcached中实现了预取机制。最后,通过实验验证了所提方法的有效性,并对不同预取机制进行了性能比较。实验结果显示,应用我们的优化策略可以显著提高数据查询的效率。 展开更多
关键词 数据 HADOOP SOL-Combines算法 线程并发处理 热点数据 local memcached 性能优化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部