期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
13
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种基于线程的数据预取方法
被引量:
3
1
作者
欧国东
张民选
《计算机工程与科学》
CSCD
2008年第1期119-122,共4页
多线程、多核处理器的推广受限于应用。目前,大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场并行执行来提高速度。使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用...
多线程、多核处理器的推广受限于应用。目前,大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场并行执行来提高速度。使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度。在基于线程的数据预取方法中,数据预取线程是从主线程的执行踪迹中提取的。它们使用空闲的现场,和主线程并行执行,在主线程需要数据之前把数据取到离处理器更近的存储层次。基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式。本文具体分析了应用程序中访存行为的特点,结合控制流处理,设计并验证了一种基于线程的数据预取方法TDP。模拟结果显示,使用TDP可以获得7%左右的性能提升。
展开更多
关键词
单
线程
应用
多
线程
处理器
数据
预
取
线程
TDP
下载PDF
职称材料
面向非规则大数据分析应用的多核帮助线程预取方法
被引量:
4
2
作者
张建勋
古志民
+1 位作者
胡潇涵
蔡旻
《通信学报》
EI
CSCD
北大核心
2014年第8期137-146,共10页
大数据分析应用往往采用基于大型稀疏图的遍历算法,其主要特点是非规则数据密集访存。以频繁使用的具有大型稀疏图遍历特征的介度中心算法为例,提出一种基于帮助线程的多参数预取控制模型和参数优化方法,从而达到提高非规则数据密集程...
大数据分析应用往往采用基于大型稀疏图的遍历算法,其主要特点是非规则数据密集访存。以频繁使用的具有大型稀疏图遍历特征的介度中心算法为例,提出一种基于帮助线程的多参数预取控制模型和参数优化方法,从而达到提高非规则数据密集程序性能的目的。在商用多核平台Q6600和I7上运用该方法后,介度中心算法在不同规模输入下平均性能加速比分别为1.20和1.11。实验结果表明,帮助线程预取能够有效提升该类非规则应用程序的性能。
展开更多
关键词
帮助
线程
预
取
非规则
数据
密集应用
介度中心性
下载PDF
职称材料
基于线程的多路径数据预取技术研究
3
作者
欧国东
王永文
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S1期328-334,共7页
多核多线程处理器应用日益广泛,但传统应用多为单线程的串行程序,不能充分利用多线程处理器提供的多个现场,难以通过并行执行来提高执行速度.如何使用空闲现场加速单线程应用成为多线程微处理器领域研究的一个热点.基于线程的数据预取...
多核多线程处理器应用日益广泛,但传统应用多为单线程的串行程序,不能充分利用多线程处理器提供的多个现场,难以通过并行执行来提高执行速度.如何使用空闲现场加速单线程应用成为多线程微处理器领域研究的一个热点.基于线程的数据预取方法利用空闲现场执行数据预取线程,计算关键指令访存地址并发起预取,可以改善系统存储行为、加速单线程执行、提高系统吞吐率.在数据流分析的基础上,扩充了控制流分析,提出了一种基于线程的多路径数据预取方法,研究了多种执行控制策略.模拟结果表明:根据路径信息进行数据预取,可以提高预取效率、减少预取开销.
展开更多
关键词
多
线程
基于线程的数据预取方法
控制流
数据
流
多路径
下载PDF
职称材料
基于CMP的指针数据预取方法
被引量:
4
4
作者
朱会东
黄永丽
宋宝卫
《计算机工程》
CAS
CSCD
北大核心
2011年第6期71-73,共3页
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理...
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。
展开更多
关键词
存储墙
链式
数据
结构
多核多
线程
数据
预
取
下载PDF
职称材料
帮助线程预取质量的实时在线评价方法
被引量:
2
5
作者
张建勋
古志民
《计算机应用》
CSCD
北大核心
2017年第1期114-119,127,共7页
针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮助线程预取质量的实时在线评价方法。首先,明确了帮助线程的预取服务质量(QoS)的目标;其次,分析了帮助线程预取性能评价的动态指标,对帮助线程预取QoS进行了建模分析...
针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮助线程预取质量的实时在线评价方法。首先,明确了帮助线程的预取服务质量(QoS)的目标;其次,分析了帮助线程预取性能评价的动态指标,对帮助线程预取QoS进行了建模分析;最后,提出一个帮助线程预取的动态自适应调节算法,算法根据程序的阶段行为变化和动态预取获益变化等信息来判断参数值的适用度以及是否需要进行反馈优化,从而实现对预取控制的自适应调节。实验结果表明,应用自适应预取评价算法之后,Mst热点模块的性能提升加速比为1.496,所提出的自适应预取评价方法能够根据程序的动态阶段行为对帮助线程控制参数值作出自适应控制和调节。
展开更多
关键词
帮助
线程
预
取
质量
评价
方法
性能分析
下载PDF
职称材料
面向单线程应用的数据预取技术研究
6
作者
欧国东
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z1期140-147,共8页
多线程处理器的推广受限于应用,目前大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场,并行执行以提高速度.使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问...
多线程处理器的推广受限于应用,目前大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场,并行执行以提高速度.使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度.在基于线程的数据预取方法TDP中,数据预取线程是从主线程的执行踪迹中提取的,它们使用空闲的现场,和主线程并行执行.由于数据预取线程仅仅包括和预取相关的指令,它们比主线程执行要快,可以在主线程需要数据之前,把数据取到离处理器更近的存储层次.基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式.研究控制相关对TDP的影响,具体分析使用错误前瞻的数据预取方法:通过在预取线程中加入分支指令,并用它们控制预取线程的执行过程.通过研究发现,在某些情况下即使控制前瞻已经被证实是错误的,继续执行预取线程可以获得更好的预取效果.模拟结果显示,使用错误前瞻可以获得5%的性能提升.
展开更多
关键词
单
线程
应用
多
线程
处理器
数据
预
取
错误前瞻
下载PDF
职称材料
帮助线程预取技术研究综述
被引量:
3
7
作者
张建勋
古志民
《计算机科学》
CSCD
北大核心
2013年第7期19-23,39,共6页
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连...
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连续局部性转换为瞬时的连续时空局部性(即时局部性),从而达到通过线程级数据预取提高程序性能的目的。归纳了帮助线程预取技术的分类,概括和比较了不同帮助线程实现技术的优势和局限性,深入分析和探讨了现有的几种典型帮助线程技术的预取控制策略。最后从帮助线程实时控制、参数动态选取和优化方面指出了帮助线程预取技术的研究方向。
展开更多
关键词
帮助
线程
数据
预
取
CMP(Chip
Multi-Processor)平台
非规则
数据
密集应用
下载PDF
职称材料
梯度学习的参数控制帮助线程预取模型
被引量:
1
8
作者
裴颂文
张俊格
宁静
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2016年第5期59-63,共5页
对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对...
对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对控制参数求解最优值,从而有效地控制帮助线程与主线程的访存任务量,使帮助线程领先于主线程。实验结果表明,基于参数选择的线程预取模型能获得1.1~1.5倍的系统性能加速比。
展开更多
关键词
数据
预
取
帮助
线程
多核系统
访存延迟
梯度下降
下载PDF
职称材料
一种面向非规则数据的预取优化组合策略
被引量:
1
9
作者
黄艳
刘海燕
《科技通报》
北大核心
2016年第12期163-168,共6页
在面向非规则数据的线程预取策略中,默认开启的硬件预取会加剧共享存储资源竞争,降低整个内存系统的有效性。为解决该问题,提出一种面向非规则数据的的线程预取与硬件预取优化组合策略。该策略测试和分析了L2硬件预取配置对非规则数据...
在面向非规则数据的线程预取策略中,默认开启的硬件预取会加剧共享存储资源竞争,降低整个内存系统的有效性。为解决该问题,提出一种面向非规则数据的的线程预取与硬件预取优化组合策略。该策略测试和分析了L2硬件预取配置对非规则数据的线程预取性能与访存行为影响,并在此基础上为非规则数据的线程预取实现了L2硬件预取的配置优化。实验结果和分析表明,优化后预取组合策略减少了系统访存请求,提高了预取准确率和时效性,进一步改善了预取性能。
展开更多
关键词
非规则
数据
线程
预
取
硬件
预
取
预
取
准确率
下载PDF
职称材料
小计算量下非规则数据密集型热函数的性能优化
10
作者
郑宁汉
古志民
孙贤和
《计算机研究与发展》
EI
CSCD
北大核心
2013年第11期2436-2443,共8页
随着云计算的兴起和发展,基于多核的非规则数据密集型应用越来越多,而大量的数据缺失问题导致这类应用的性能严重下降.利用空闲核资源的传统帮助线程方法试图提前将主线程所需要的非规则数据放入共享的最后一级缓存(last layer cache,LL...
随着云计算的兴起和发展,基于多核的非规则数据密集型应用越来越多,而大量的数据缺失问题导致这类应用的性能严重下降.利用空闲核资源的传统帮助线程方法试图提前将主线程所需要的非规则数据放入共享的最后一级缓存(last layer cache,LLC),如果帮助线程相对于主线程具有恰当的运算速度,能在主线程访问之前将有关缺失数据放入LLC中,则热函数的性能可被改进.然而,如果热函数缺乏计算任务(称之为小计算量热函数),使用这样的传统方法就无法构建一个相对于主线程有效预取的帮助线程,其热函数性能的改善将会大大降低.针对源代码级小计算量下非规则数据密集型热函数的性能优化问题,先对帮助线程预取QoS进行了形式化描述.在此基础上,通过引入提前量等参数模型,提出了一种小计算量下热函数的性能优化方法.在Intel Core 2Duo Processor 6550处理器上,通过对科学计算测试程序em3d,mst和SPEC CPU benchmark 2006中的mcf的进行实验,相对于传统方法分别获得了1.97%,31.63%和1.10%的性能提升.
展开更多
关键词
多核处理器
帮助
线程
数据
预
取
小
计算量
非规则
数据
密集型热函数
下载PDF
职称材料
J2EE架构下的海量数据访问技术研究
被引量:
1
11
作者
和密密
孙忠林
张煜
《计算机与现代化》
2011年第12期89-91,96,共4页
海量数据处理的快速响应是应用系统的性能标准之一,特别是基于Web的应用系统,响应速度直接影响应用软件的使用价值。本文研究J2EE架构下海量数据访问的优化技术,并给出应用优化技术的测试结果。
关键词
海量
数据
行
预
取
数据
库连接池
线程
池
下载PDF
职称材料
异构HPL算法中CPU端高性能BLAS库优化
被引量:
2
12
作者
蔡雨
孙成国
+3 位作者
杜朝晖
刘子行
康梦博
李双双
《软件学报》
EI
CSCD
北大核心
2021年第8期2289-2306,共18页
异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整...
异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整体效率的提升尤为重要.针对具体平台体系结构特点对BLAS(basic linear algebra subprograms)函数进行优化往往可以更加充分地利用通用CPU计算能力,提高系统整体效率.BLIS(BLAS-like library instantiation software)算法库是开源的BLAS函数框架,具有易开发、易移植和模块化等优点.基于异构系统平台体系结构以及HPL算法特点,充分利用三级缓存、向量化指令和多线程并行等技术手段优化CPU端调用的各级BLAS函数,应用auto-tuning技术优化矩阵分块参数,从而形成了异构环境下优化的BLIS算法库HBLIS.与MKL相比,HPL整体性能提高了11.8%.
展开更多
关键词
BLAS
遗传算法auto-tuning
向量化指令
数据
预
取
多
线程
并行
下载PDF
职称材料
大数据查询性能优化的研究与实现
13
作者
王家强
《网络安全技术与应用》
2024年第7期76-78,共3页
随着大数据技术的迅速发展,数据查询与处理的效率成为研究的重点。本文首先介绍了大数据平台系统及其相关的技术,特别是Hadoop平台及其基本架构和分布式文件系统HDFS。接着,我们深入探讨了查询合并及数据处理机制,其中SOLCombines算法...
随着大数据技术的迅速发展,数据查询与处理的效率成为研究的重点。本文首先介绍了大数据平台系统及其相关的技术,特别是Hadoop平台及其基本架构和分布式文件系统HDFS。接着,我们深入探讨了查询合并及数据处理机制,其中SOLCombines算法在查询优化中的作用被详细描述,同时也探索了多队列与多线程并发处理技术。为了进一步提高数据查询的速度,本文研究了热点数据预取技术,并在local memcached中实现了预取机制。最后,通过实验验证了所提方法的有效性,并对不同预取机制进行了性能比较。实验结果显示,应用我们的优化策略可以显著提高数据查询的效率。
展开更多
关键词
大
数据
HADOOP
SOL-Combines算法
多
线程
并发处理
热点
数据
预
取
local
memcached
性能优化
原文传递
题名
一种基于线程的数据预取方法
被引量:
3
1
作者
欧国东
张民选
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
2008年第1期119-122,共4页
基金
国家自然科学基金资助项目(60273069
60376018
90207011)
文摘
多线程、多核处理器的推广受限于应用。目前,大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场并行执行来提高速度。使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度。在基于线程的数据预取方法中,数据预取线程是从主线程的执行踪迹中提取的。它们使用空闲的现场,和主线程并行执行,在主线程需要数据之前把数据取到离处理器更近的存储层次。基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式。本文具体分析了应用程序中访存行为的特点,结合控制流处理,设计并验证了一种基于线程的数据预取方法TDP。模拟结果显示,使用TDP可以获得7%左右的性能提升。
关键词
单
线程
应用
多
线程
处理器
数据
预
取
线程
TDP
Keywords
single-threaded application
multi-threaded/multi-core microprocessor
data prefetching thread
TDP
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向非规则大数据分析应用的多核帮助线程预取方法
被引量:
4
2
作者
张建勋
古志民
胡潇涵
蔡旻
机构
北京理工大学计算机学院
天津中医药大学网络中心
出处
《通信学报》
EI
CSCD
北大核心
2014年第8期137-146,共10页
基金
国家自然科学基金资助项目(61070029
61370062)~~
文摘
大数据分析应用往往采用基于大型稀疏图的遍历算法,其主要特点是非规则数据密集访存。以频繁使用的具有大型稀疏图遍历特征的介度中心算法为例,提出一种基于帮助线程的多参数预取控制模型和参数优化方法,从而达到提高非规则数据密集程序性能的目的。在商用多核平台Q6600和I7上运用该方法后,介度中心算法在不同规模输入下平均性能加速比分别为1.20和1.11。实验结果表明,帮助线程预取能够有效提升该类非规则应用程序的性能。
关键词
帮助
线程
预
取
非规则
数据
密集应用
介度中心性
Keywords
helper thread prefetching
irregular data intensive applications
betweenness centrality
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于线程的多路径数据预取技术研究
3
作者
欧国东
王永文
张民选
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S1期328-334,共7页
基金
国家"八六三"高技术研究发展计划基金项目(2009AA01Z124)
国家自然科学基金项目(60970036)
文摘
多核多线程处理器应用日益广泛,但传统应用多为单线程的串行程序,不能充分利用多线程处理器提供的多个现场,难以通过并行执行来提高执行速度.如何使用空闲现场加速单线程应用成为多线程微处理器领域研究的一个热点.基于线程的数据预取方法利用空闲现场执行数据预取线程,计算关键指令访存地址并发起预取,可以改善系统存储行为、加速单线程执行、提高系统吞吐率.在数据流分析的基础上,扩充了控制流分析,提出了一种基于线程的多路径数据预取方法,研究了多种执行控制策略.模拟结果表明:根据路径信息进行数据预取,可以提高预取效率、减少预取开销.
关键词
多
线程
基于线程的数据预取方法
控制流
数据
流
多路径
Keywords
multi-threaded
thread-based data prefetching
control flow
data flow
multi-path
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于CMP的指针数据预取方法
被引量:
4
4
作者
朱会东
黄永丽
宋宝卫
机构
郑州轻工业学院计算机与通信工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第6期71-73,共3页
文摘
针对现代计算机系统中的存储墙问题,提出一种适合于链式数据结构的数据预取方法——纯遍历推送方法。采用基于共享高速缓存的多核处理器平台CMP上的多线程技术,在主程序运行时分离出一个推送线程,由其将主线程需要的数据提前预取至处理器共享高速缓存中以隐藏主线程的存储器延迟。实验结果证明该方法在CMP架构下对以链式结构为主的内存受限程序的性能有一定的改进。
关键词
存储墙
链式
数据
结构
多核多
线程
数据
预
取
Keywords
memory wall
linked data structure
multi-core and multi-threading
data prefetching
分类号
N945 [自然科学总论—系统科学]
下载PDF
职称材料
题名
帮助线程预取质量的实时在线评价方法
被引量:
2
5
作者
张建勋
古志民
机构
天津职业技术师范大学信息技术工程学院
北京理工大学计算机学院
出处
《计算机应用》
CSCD
北大核心
2017年第1期114-119,127,共7页
基金
国家自然科学基金资助项目(61070029
61370062)
天津职业技术师范大学科研启动基金资助项目(KYQD1619)~~
文摘
针对传统静态枚举设置帮助线程控制参数值的繁杂耗时问题,提出了一种帮助线程预取质量的实时在线评价方法。首先,明确了帮助线程的预取服务质量(QoS)的目标;其次,分析了帮助线程预取性能评价的动态指标,对帮助线程预取QoS进行了建模分析;最后,提出一个帮助线程预取的动态自适应调节算法,算法根据程序的阶段行为变化和动态预取获益变化等信息来判断参数值的适用度以及是否需要进行反馈优化,从而实现对预取控制的自适应调节。实验结果表明,应用自适应预取评价算法之后,Mst热点模块的性能提升加速比为1.496,所提出的自适应预取评价方法能够根据程序的动态阶段行为对帮助线程控制参数值作出自适应控制和调节。
关键词
帮助
线程
预
取
质量
评价
方法
性能分析
Keywords
helper thread
prefetching quality
evaluation method
performance analysis
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向单线程应用的数据预取技术研究
6
作者
欧国东
张民选
机构
国防科学技术大学计算机学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z1期140-147,共8页
基金
国家自然科学基金项目(60273069,60376018,90207011)
文摘
多线程处理器的推广受限于应用,目前大部分应用尤其是桌面应用都是单线程程序,不能充分利用多线程处理器提供的多个现场,并行执行以提高速度.使用空闲现场加速单线程应用是目前研究的一个热点,研究主要集中在提高传统串行应用存储访问的效率和分支预测的精度.在基于线程的数据预取方法TDP中,数据预取线程是从主线程的执行踪迹中提取的,它们使用空闲的现场,和主线程并行执行.由于数据预取线程仅仅包括和预取相关的指令,它们比主线程执行要快,可以在主线程需要数据之前,把数据取到离处理器更近的存储层次.基于线程的数据预取方法能够有效地解决传统数据预取方法难以处理的诸多问题,如不规则内存访问模式.研究控制相关对TDP的影响,具体分析使用错误前瞻的数据预取方法:通过在预取线程中加入分支指令,并用它们控制预取线程的执行过程.通过研究发现,在某些情况下即使控制前瞻已经被证实是错误的,继续执行预取线程可以获得更好的预取效果.模拟结果显示,使用错误前瞻可以获得5%的性能提升.
关键词
单
线程
应用
多
线程
处理器
数据
预
取
错误前瞻
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
帮助线程预取技术研究综述
被引量:
3
7
作者
张建勋
古志民
机构
北京理工大学计算机学院
天津中医药大学网络中心
出处
《计算机科学》
CSCD
北大核心
2013年第7期19-23,39,共6页
基金
国家自然科学基金项目(61070029)资助
文摘
帮助线程预取是当前多核平台提高非规则数据密集应用预取效果性能的关键技术之一,近年来已成为国内外的研究热点。针对非规则数据密集应用访存规律的非连续局部性特征,帮助线程预取技术利用CMP平台的最后一级共享缓存(LLC)将应用的非连续局部性转换为瞬时的连续时空局部性(即时局部性),从而达到通过线程级数据预取提高程序性能的目的。归纳了帮助线程预取技术的分类,概括和比较了不同帮助线程实现技术的优势和局限性,深入分析和探讨了现有的几种典型帮助线程技术的预取控制策略。最后从帮助线程实时控制、参数动态选取和优化方面指出了帮助线程预取技术的研究方向。
关键词
帮助
线程
数据
预
取
CMP(Chip
Multi-Processor)平台
非规则
数据
密集应用
Keywords
Helper thread, Data prefetching, CMP platfotto, Non-irregular data intensive application
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
梯度学习的参数控制帮助线程预取模型
被引量:
1
8
作者
裴颂文
张俊格
宁静
机构
上海理工大学光电信息与计算机工程学院
上海理工大学上海市现代光学系统重点实验室
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2016年第5期59-63,共5页
基金
上海市自然科学基金资助项目(15ZR1428600)
计算机体系结构国家重点实验室开放资助项目(CARCH201206)
上海市浦江人才计划资助项目(16PJ1407600)
文摘
对于非规则访存的应用程序,当某个应用程序的访存开销大于计算开销时,传统帮助线程的访存开销会高于主线程的计算开销,从而导致帮助线程落后于主线程。于是提出一种改进的基于参数控制的帮助线程预取模型,该模型采用梯度下降算法对控制参数求解最优值,从而有效地控制帮助线程与主线程的访存任务量,使帮助线程领先于主线程。实验结果表明,基于参数选择的线程预取模型能获得1.1~1.5倍的系统性能加速比。
关键词
数据
预
取
帮助
线程
多核系统
访存延迟
梯度下降
Keywords
data pre-fetch
helper thread
multi-core system
memory latency
gradient descent
分类号
TN95 [电子电信—信号与信息处理]
下载PDF
职称材料
题名
一种面向非规则数据的预取优化组合策略
被引量:
1
9
作者
黄艳
刘海燕
机构
郑州轻工业学院软件学院
郑州轻工业学院工程训练中心
出处
《科技通报》
北大核心
2016年第12期163-168,共6页
基金
国家自然科学基金资助项目(61272038)
博士基金项目(2013BSJJ050)
文摘
在面向非规则数据的线程预取策略中,默认开启的硬件预取会加剧共享存储资源竞争,降低整个内存系统的有效性。为解决该问题,提出一种面向非规则数据的的线程预取与硬件预取优化组合策略。该策略测试和分析了L2硬件预取配置对非规则数据的线程预取性能与访存行为影响,并在此基础上为非规则数据的线程预取实现了L2硬件预取的配置优化。实验结果和分析表明,优化后预取组合策略减少了系统访存请求,提高了预取准确率和时效性,进一步改善了预取性能。
关键词
非规则
数据
线程
预
取
硬件
预
取
预
取
准确率
Keywords
irregular data
threaded prefetching
hardware prefetcher
prefetching accuracy
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
小计算量下非规则数据密集型热函数的性能优化
10
作者
郑宁汉
古志民
孙贤和
机构
北京理工大学计算机科学与技术学院可扩展计算联合实验室
清华大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2013年第11期2436-2443,共8页
基金
国家自然科学基金项目(61070029)
教育部-英特尔信息技术专项基金项目(MoE-Intel-08-10)
文摘
随着云计算的兴起和发展,基于多核的非规则数据密集型应用越来越多,而大量的数据缺失问题导致这类应用的性能严重下降.利用空闲核资源的传统帮助线程方法试图提前将主线程所需要的非规则数据放入共享的最后一级缓存(last layer cache,LLC),如果帮助线程相对于主线程具有恰当的运算速度,能在主线程访问之前将有关缺失数据放入LLC中,则热函数的性能可被改进.然而,如果热函数缺乏计算任务(称之为小计算量热函数),使用这样的传统方法就无法构建一个相对于主线程有效预取的帮助线程,其热函数性能的改善将会大大降低.针对源代码级小计算量下非规则数据密集型热函数的性能优化问题,先对帮助线程预取QoS进行了形式化描述.在此基础上,通过引入提前量等参数模型,提出了一种小计算量下热函数的性能优化方法.在Intel Core 2Duo Processor 6550处理器上,通过对科学计算测试程序em3d,mst和SPEC CPU benchmark 2006中的mcf的进行实验,相对于传统方法分别获得了1.97%,31.63%和1.10%的性能提升.
关键词
多核处理器
帮助
线程
数据
预
取
小
计算量
非规则
数据
密集型热函数
Keywords
chip multi-core processors (CMP)
helper thread
data prefetching
low computingworkload
irregular data intensive hot-slice
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
J2EE架构下的海量数据访问技术研究
被引量:
1
11
作者
和密密
孙忠林
张煜
机构
山东科技大学信息科学与工程学院
出处
《计算机与现代化》
2011年第12期89-91,96,共4页
基金
山东省博士基金资助项目(BS2009DXO11)
山东省政府"泰山学者"建设工程项目
文摘
海量数据处理的快速响应是应用系统的性能标准之一,特别是基于Web的应用系统,响应速度直接影响应用软件的使用价值。本文研究J2EE架构下海量数据访问的优化技术,并给出应用优化技术的测试结果。
关键词
海量
数据
行
预
取
数据
库连接池
线程
池
Keywords
massive data
line prefetching
database connection pool
thread pool
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
异构HPL算法中CPU端高性能BLAS库优化
被引量:
2
12
作者
蔡雨
孙成国
杜朝晖
刘子行
康梦博
李双双
机构
信息技术有限公司
出处
《软件学报》
EI
CSCD
北大核心
2021年第8期2289-2306,共18页
文摘
异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整体效率的提升尤为重要.针对具体平台体系结构特点对BLAS(basic linear algebra subprograms)函数进行优化往往可以更加充分地利用通用CPU计算能力,提高系统整体效率.BLIS(BLAS-like library instantiation software)算法库是开源的BLAS函数框架,具有易开发、易移植和模块化等优点.基于异构系统平台体系结构以及HPL算法特点,充分利用三级缓存、向量化指令和多线程并行等技术手段优化CPU端调用的各级BLAS函数,应用auto-tuning技术优化矩阵分块参数,从而形成了异构环境下优化的BLIS算法库HBLIS.与MKL相比,HPL整体性能提高了11.8%.
关键词
BLAS
遗传算法auto-tuning
向量化指令
数据
预
取
多
线程
并行
Keywords
BLAS
genetic algorithm auto-tuning
vectorization instruction
data prefetching
multi-threading parallelization
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
大数据查询性能优化的研究与实现
13
作者
王家强
机构
山东省淄博市淄川区纪委监委
出处
《网络安全技术与应用》
2024年第7期76-78,共3页
文摘
随着大数据技术的迅速发展,数据查询与处理的效率成为研究的重点。本文首先介绍了大数据平台系统及其相关的技术,特别是Hadoop平台及其基本架构和分布式文件系统HDFS。接着,我们深入探讨了查询合并及数据处理机制,其中SOLCombines算法在查询优化中的作用被详细描述,同时也探索了多队列与多线程并发处理技术。为了进一步提高数据查询的速度,本文研究了热点数据预取技术,并在local memcached中实现了预取机制。最后,通过实验验证了所提方法的有效性,并对不同预取机制进行了性能比较。实验结果显示,应用我们的优化策略可以显著提高数据查询的效率。
关键词
大
数据
HADOOP
SOL-Combines算法
多
线程
并发处理
热点
数据
预
取
local
memcached
性能优化
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种基于线程的数据预取方法
欧国东
张民选
《计算机工程与科学》
CSCD
2008
3
下载PDF
职称材料
2
面向非规则大数据分析应用的多核帮助线程预取方法
张建勋
古志民
胡潇涵
蔡旻
《通信学报》
EI
CSCD
北大核心
2014
4
下载PDF
职称材料
3
基于线程的多路径数据预取技术研究
欧国东
王永文
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2011
0
下载PDF
职称材料
4
基于CMP的指针数据预取方法
朱会东
黄永丽
宋宝卫
《计算机工程》
CAS
CSCD
北大核心
2011
4
下载PDF
职称材料
5
帮助线程预取质量的实时在线评价方法
张建勋
古志民
《计算机应用》
CSCD
北大核心
2017
2
下载PDF
职称材料
6
面向单线程应用的数据预取技术研究
欧国东
张民选
《计算机研究与发展》
EI
CSCD
北大核心
2007
0
下载PDF
职称材料
7
帮助线程预取技术研究综述
张建勋
古志民
《计算机科学》
CSCD
北大核心
2013
3
下载PDF
职称材料
8
梯度学习的参数控制帮助线程预取模型
裴颂文
张俊格
宁静
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2016
1
下载PDF
职称材料
9
一种面向非规则数据的预取优化组合策略
黄艳
刘海燕
《科技通报》
北大核心
2016
1
下载PDF
职称材料
10
小计算量下非规则数据密集型热函数的性能优化
郑宁汉
古志民
孙贤和
《计算机研究与发展》
EI
CSCD
北大核心
2013
0
下载PDF
职称材料
11
J2EE架构下的海量数据访问技术研究
和密密
孙忠林
张煜
《计算机与现代化》
2011
1
下载PDF
职称材料
12
异构HPL算法中CPU端高性能BLAS库优化
蔡雨
孙成国
杜朝晖
刘子行
康梦博
李双双
《软件学报》
EI
CSCD
北大核心
2021
2
下载PDF
职称材料
13
大数据查询性能优化的研究与实现
王家强
《网络安全技术与应用》
2024
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部