期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
多核处理器中基于Radix-Join的嵌套循环连接优化
被引量:
1
1
作者
邓亚丹
景宁
熊伟
《计算机研究与发展》
EI
CSCD
北大核心
2010年第6期1079-1087,共9页
针对目前主流的多核处理器,研究了基于共享Cache多核处理器的数据库Nested Loop Join(NINLJ)优化.针对无索引情况下的NLJ,提出了基于Radix-NL-Join算法的NLJ多线程执行框架.从减少Cache访问冲突和提高Cache命中率两个方面优化了NINLJ多...
针对目前主流的多核处理器,研究了基于共享Cache多核处理器的数据库Nested Loop Join(NINLJ)优化.针对无索引情况下的NLJ,提出了基于Radix-NL-Join算法的NLJ多线程执行框架.从减少Cache访问冲突和提高Cache命中率两个方面优化了NINLJ多线程执行框架中的聚集划分和聚集连接线程.主要贡献如下:1.针对多线程访问共享Cache容易出现共享Cache访问冲突的问题,优化了聚集划分阶段的多线程聚集划分线程的启动时机;2.针对聚集连接阶段,聚集连接线程Cache访问性能不佳,利用聚集连接线程顺序访问聚集的优势,采用预取线程提高聚集连接线程的性能;3.在实验中,基于开源数据库EaseDB实现了上述多线程执行框架,测试了多线程NLJ的性能.实验结果表明,提出的NLJ多线程执行框架,可以充分利用多核处理器的计算资源,并有效地解决共享Cache在多线程条件下的Cache访问冲突问题,大大提高了NLJ的性能,相对于未采用Cache优化的多线程Radix-NL-Join算法,其性能提升了26%左右.
展开更多
关键词
嵌套循环连接
radix-join
共享Cache多核处理器
多线程优化
Cache访问优化
下载PDF
职称材料
基于共享Cache多核处理器的Hash连接优化
被引量:
4
2
作者
邓亚丹
景宁
熊伟
《软件学报》
EI
CSCD
北大核心
2010年第6期1220-1232,共13页
针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行...
针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行框架中的各种线程及其访问共享Cache的性能,优化了聚集连接时Hash连接算法的内存访问,并分析了多线程聚集划分的加速比.基于开源数据库INGRES和EaseDB,实现了所提出的连接多线程执行框架,在实验中测试了多线程Hash连接框架的性能.实验结果表明,该算法可以有效解决Hash连接执行时共享Cache在多线程条件下的访问冲突和处理器负载均衡问题,极大地提高了Hash连接性能.
展开更多
关键词
Hash连接
radix-join
多核处理器
共享CACHE
多线程性能分析
下载PDF
职称材料
基于共享Cache多核处理器的Radix聚集连接优化
3
作者
邓亚丹
景宁
+1 位作者
熊伟
吴秋云
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009年第4期68-73,共6页
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并...
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并根据聚集连接执行时的代价模型,优化了聚集连接执行框架和各种线程参数。在实验中,基于内存数据库EaseDB实现了本文提出了算法,实验结果表明,聚集连接性能得到较大提高。
展开更多
关键词
多核处理器
radix—join
聚集连接
下载PDF
职称材料
CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例
被引量:
3
4
作者
吴林阳
罗蓉
+1 位作者
郭雪婷
郭崎
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期289-304,共16页
硬件加速器能够有效地提高当前计算机系统的能效.然而,传统的硬件加速器(如GPU,FPGA和定制的加速器)和内存是相互分离的,加速器和内存之间的数据移动难以避免,这使得如何降低加速器和内存之间数据移动的开销成为极具挑战性的问题.随着...
硬件加速器能够有效地提高当前计算机系统的能效.然而,传统的硬件加速器(如GPU,FPGA和定制的加速器)和内存是相互分离的,加速器和内存之间的数据移动难以避免,这使得如何降低加速器和内存之间数据移动的开销成为极具挑战性的问题.随着靠近数据的处理技术(near-dataprocessing)和3D堆叠DRAM的出现,我们能够将硬件加速器集成到3D堆叠DRAM中,使得数据移动的开销大大降低.然而,由于3D堆叠DRAM对面积、功耗和散热具有严格的限制,所以不可能将一个功能复杂的硬件加速器完整地集成到DRAM中.因此,在设计内存端的硬件加速器时,应该考虑将加速任务在CPU和加速器之间合理地进行划分.以加速大数据系统中的一个关键操作hash joins为例子,阐述了CPU和内存端加速任务划分的设计思想.以减少数据移动为出发点,设计了一个包含内存端定制加速器和处理器端SIMD加速单元的混合加速系统,并对应用进行分析,将加速任务划分到不同的加速器.其中,内存端的加速器用于加速数据移动受限的执行阶段,而处理器端SIMD加速单元则用于加速数据移动开销较低成本的执行阶段.实验结果表明:与英特尔的Haswell处理器和Xeon Phi相比,设计的混合加速系统的能效分别提升了47.52倍和19.81倍.此外,提出的以数据移动为驱动的方法很容易扩展于指导其他应用的加速设计.
展开更多
关键词
3D堆叠内存
加速器
大数据
HASH
joins
RADIX
joins算法的优化版本
hash分区加速器
下载PDF
职称材料
题名
多核处理器中基于Radix-Join的嵌套循环连接优化
被引量:
1
1
作者
邓亚丹
景宁
熊伟
机构
国防科学技术大学电子科学与工程学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第6期1079-1087,共9页
基金
国家"八六三"高技术研究发展计划基金项目(2007AA120400
2007AA12Z208)
国家自然科学基金项目(40801160)
文摘
针对目前主流的多核处理器,研究了基于共享Cache多核处理器的数据库Nested Loop Join(NINLJ)优化.针对无索引情况下的NLJ,提出了基于Radix-NL-Join算法的NLJ多线程执行框架.从减少Cache访问冲突和提高Cache命中率两个方面优化了NINLJ多线程执行框架中的聚集划分和聚集连接线程.主要贡献如下:1.针对多线程访问共享Cache容易出现共享Cache访问冲突的问题,优化了聚集划分阶段的多线程聚集划分线程的启动时机;2.针对聚集连接阶段,聚集连接线程Cache访问性能不佳,利用聚集连接线程顺序访问聚集的优势,采用预取线程提高聚集连接线程的性能;3.在实验中,基于开源数据库EaseDB实现了上述多线程执行框架,测试了多线程NLJ的性能.实验结果表明,提出的NLJ多线程执行框架,可以充分利用多核处理器的计算资源,并有效地解决共享Cache在多线程条件下的Cache访问冲突问题,大大提高了NLJ的性能,相对于未采用Cache优化的多线程Radix-NL-Join算法,其性能提升了26%左右.
关键词
嵌套循环连接
radix-join
共享Cache多核处理器
多线程优化
Cache访问优化
Keywords
nested loop join
radix-join
shared cache chip multi-processor
multithreaded optimization
cache access optimization
分类号
TP311.132 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于共享Cache多核处理器的Hash连接优化
被引量:
4
2
作者
邓亚丹
景宁
熊伟
机构
国防科学技术大学电子科学与工程学院
出处
《软件学报》
EI
CSCD
北大核心
2010年第6期1220-1232,共13页
基金
国家自然科学基金No.40801160
国家高技术研究发展计划(863)Nos.2007AA120400
+1 种基金
2007AA12Z208
2006AA12Z205~~
文摘
针对目前主流的多核处理器,研究了基于共享缓存多核处理器环境下的数据库Hash连接优化.首先提出基于Radix-Join算法的Hash连接多线程执行框架,通过实例分析了影响多线程Radix-Join算法性能的因素.在此基础上,优化了Hash连接多线程执行框架中的各种线程及其访问共享Cache的性能,优化了聚集连接时Hash连接算法的内存访问,并分析了多线程聚集划分的加速比.基于开源数据库INGRES和EaseDB,实现了所提出的连接多线程执行框架,在实验中测试了多线程Hash连接框架的性能.实验结果表明,该算法可以有效解决Hash连接执行时共享Cache在多线程条件下的访问冲突和处理器负载均衡问题,极大地提高了Hash连接性能.
关键词
Hash连接
radix-join
多核处理器
共享CACHE
多线程性能分析
Keywords
hash join
radix-join
chip multi-processor
shared cache
multithread performance analysis
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于共享Cache多核处理器的Radix聚集连接优化
3
作者
邓亚丹
景宁
熊伟
吴秋云
机构
国防科技大学电子科学与工程学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009年第4期68-73,共6页
基金
国家863高技术研究发展计划重点资助项目(2007AA120400)
国家自然科学基金资助项目(40801160)
文摘
基于目前主流的多核处理器,研究了数据库Radix-Join算法中的聚集连接优化。针对多线程聚集连接执行时,线程Cache访问缺失严重的问题,采用预读线程预先将聚集连接线程需要访问的聚集对从内存读入L2-Cache,提高了线程的Cache访问性能。并根据聚集连接执行时的代价模型,优化了聚集连接执行框架和各种线程参数。在实验中,基于内存数据库EaseDB实现了本文提出了算法,实验结果表明,聚集连接性能得到较大提高。
关键词
多核处理器
radix—join
聚集连接
Keywords
chip multi-processor
radix-join
cluster join
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例
被引量:
3
4
作者
吴林阳
罗蓉
郭雪婷
郭崎
机构
中国科学院计算技术研究所
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第2期289-304,共16页
基金
国家重点研发计划项目(2017YFB1003101)
国家自然科学基金项目(61472396
+13 种基金
61432016
61473275
61522211
61532016
61521092
61502446
61672491
61602441
61602446
61732002
61702478)
北京市科技计划项目(Z151100000915072)
中科院STS计划项目
国家"九七三"重点基础研究发展计划基金项目(2015CB358800)~~
文摘
硬件加速器能够有效地提高当前计算机系统的能效.然而,传统的硬件加速器(如GPU,FPGA和定制的加速器)和内存是相互分离的,加速器和内存之间的数据移动难以避免,这使得如何降低加速器和内存之间数据移动的开销成为极具挑战性的问题.随着靠近数据的处理技术(near-dataprocessing)和3D堆叠DRAM的出现,我们能够将硬件加速器集成到3D堆叠DRAM中,使得数据移动的开销大大降低.然而,由于3D堆叠DRAM对面积、功耗和散热具有严格的限制,所以不可能将一个功能复杂的硬件加速器完整地集成到DRAM中.因此,在设计内存端的硬件加速器时,应该考虑将加速任务在CPU和加速器之间合理地进行划分.以加速大数据系统中的一个关键操作hash joins为例子,阐述了CPU和内存端加速任务划分的设计思想.以减少数据移动为出发点,设计了一个包含内存端定制加速器和处理器端SIMD加速单元的混合加速系统,并对应用进行分析,将加速任务划分到不同的加速器.其中,内存端的加速器用于加速数据移动受限的执行阶段,而处理器端SIMD加速单元则用于加速数据移动开销较低成本的执行阶段.实验结果表明:与英特尔的Haswell处理器和Xeon Phi相比,设计的混合加速系统的能效分别提升了47.52倍和19.81倍.此外,提出的以数据移动为驱动的方法很容易扩展于指导其他应用的加速设计.
关键词
3D堆叠内存
加速器
大数据
HASH
joins
RADIX
joins算法的优化版本
hash分区加速器
Keywords
3D-stacked DRAM
accelerator
big data
hash joins
optimized version of radix joins algorithm(PRO)
hash partition accelerator(HPA)
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
多核处理器中基于Radix-Join的嵌套循环连接优化
邓亚丹
景宁
熊伟
《计算机研究与发展》
EI
CSCD
北大核心
2010
1
下载PDF
职称材料
2
基于共享Cache多核处理器的Hash连接优化
邓亚丹
景宁
熊伟
《软件学报》
EI
CSCD
北大核心
2010
4
下载PDF
职称材料
3
基于共享Cache多核处理器的Radix聚集连接优化
邓亚丹
景宁
熊伟
吴秋云
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2009
0
下载PDF
职称材料
4
CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例
吴林阳
罗蓉
郭雪婷
郭崎
《计算机研究与发展》
EI
CSCD
北大核心
2018
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部