面向图形处理器重叠通信与计算的数据划分方法
摘要
本篇文章主要是利用数据平均划分的形式,来使得主协式处理架构本身所表现出的一些额外性质通信开销,无法完全对资源加以利用的问题进行了解决?而提出了以图形处理器与系统通信贷款相结合的计算形式,让通信和计算的重叠得以实现?
出处
《黑龙江科技信息》
2014年第17期145-145,共1页
Heilongjiang Science and Technology Information
参考文献3
-
1周国亮,陈红,李翠平,王珊,郑涛.基于图形处理器的并行方体计算[J].计算机学报,2010,33(10):1788-1808. 被引量:7
-
2冯国富,董小社,丁彦飞,王旭昊.面向Cell宽带引擎架构的异构多核访存技术[J].西安交通大学学报,2009,43(2):1-5. 被引量:10
-
3周永彬,张军超,张帅,张浩.基于软硬件的协同支持在众核上对1-DFFT算法的优化研究[J].计算机学报,2008,31(11):2005-2014. 被引量:9
二级参考文献28
-
1Cooley J W, Tukey J W. An algorithm for the machine computation of the complex fourier series. Mathematics of Computation, 1965, 19(90): 297-301
-
2Frigo M, Johson S G. The design and implementation of FFTW3. Proceedings of the IEEE, 2005, 93(2): 216-231
-
3Williams Samuel, Shall John, Oliker Leonid, Kamil Shoaib, Husbands Parry, Yelick Katherine. Scientific computing kernels on the Cell processor. International Journal of Parallel Programming, 2007, 35(3): 263-298
-
4Govindaraiu Naga K, Larsen Scott, Gray Jim, Manocha Dinesh. A memory model for scientific algorithms on graphics processors//Proceedings of the 2006 ACM/IEEE Conference on Supereomputing. Tampa, Florida, 2006
-
5Chen Long, Hu Ziang, Lin Jun-Min, Gao Guang R. Optimizing fast fourier transform on a multi-core architecture//Proceedings of the IEEE International Parallel and Distributed Processing Symposium. California, USA, 2007: 499
-
6Bailey D H. FFTs in external or hierarchical memory. Journal of Supercomputing, 1990, 4(1): 23-35
-
7Woo Steven Cameron, Ohara Moriyoshi, Torrie Evan, Singh Jaswinder Pal, Gupta Anoop. The SPLASH-2 programs: Characterization and methodological considerations//Proceedings of the 22nd International Symposium on Computer Architecture. S. Marghenta Ligure, Italy, 19951 24-36
-
8Iftode Liviu, Singh Jaswinder Pal, Li Kai. Scope consistency: A bridge between release consistency and entry consistency// Proceedings of the 8th Annual ACM Symposium on Parallel Algorithms and Architectures. Padua, Italy, 1996:277-287
-
9GSCHWlND M. Chip multiprocessing and the cell broadband engine [C]//Proceedings of ACM Compu- ting Frontiers. New York, USA: ACM Press, 2006: 1-8.
-
10OHARA M,INOUE H,SOHDA Y, et al. MPI microtask for programming the cell broadband engine processor [J]. IBM Systems Journal, 2006, 45 (1) : 85- 102.
共引文献21
-
1蒋建春,汪同庆.异构多核处理器的任务调度算法[J].计算机工程与应用,2009,45(33):52-56. 被引量:10
-
2董小社,冯国富,王旭昊,冯景华,胡雷钧.基于Cell多核处理器的层次化运行时支持技术[J].计算机研究与发展,2010,47(4):561-570. 被引量:2
-
3徐祯,孙济洲,于策,亓大志,张旭明.基于CELL宽带引擎架构的MPI研究与实现[J].计算机应用研究,2010,27(7):2526-2529. 被引量:1
-
4巨新刚,杨靓,黄士坦.Cell处理器结构概述[J].武汉大学学报(工学版),2010,43(6):774-779. 被引量:3
-
5余磊,刘志勇,马宜科,宋风龙,徐卫志,叶笑春.众核结构上分块LU分解算法的研究[J].高技术通讯,2011,21(3):248-253.
-
6柴亚辉,沈文枫,张倬,唐振.Cell BE高性能计算实验平台设计与实现[J].实验室研究与探索,2011,30(5):68-71. 被引量:2
-
7刘勇,刘丽,何王全.面向众核多级访存资源的静态数据布局优化模型[J].计算机应用与软件,2011,28(7):53-56. 被引量:3
-
8张保,曹海军,董小社,李丹,胡雷钧.面向图形处理器重叠通信与计算的数据划分方法[J].西安交通大学学报,2011,45(4):1-5. 被引量:5
-
9余磊,刘志勇,宋风龙,叶笑春.LU分解在众核结构仿真器上的指令级调度研究[J].系统仿真学报,2011,23(12):2603-2610. 被引量:5
-
10王海峰.快速复杂网络聚类图形处理器并行算法[J].计算机应用,2012,32(9):2458-2462.
-
1张保,曹海军,董小社,李丹,胡雷钧.面向图形处理器重叠通信与计算的数据划分方法[J].西安交通大学学报,2011,45(4):1-5. 被引量:5
-
2寿标,李晓峰.更实际的并行算法的设计[J].计算机研究与发展,1996,33(6):445-449.
-
3张晓孪,王西锋.基于本体和相似图的概念语义相似度计算[J].计算机技术与发展,2011,21(8):101-104. 被引量:6
-
4陈凤萍.云计算环境下的数据存储技术分析[J].硅谷,2013,6(17):43-43. 被引量:2
-
5田鸽.云邮,为业务铺路[J].信息方略,2013(20):39-41.
-
6张博锋,蔡青,高光焘.面向图形的集成方法[J].西北工业大学学报,1994,12(4):552-555.
-
7陈忠华.细说IEC61131-3(第四节)[J].自动化博览,2004,21(2):97-98.
-
8周琛,李满春,陈振杰,姜朋辉,陈东.矢量多边形并行栅格化数据划分方法[J].国防科技大学学报,2015,37(5):21-28. 被引量:4
-
9周桂林,张瀛,杜毅,马群生,李三立.HPNI:一种新型的机群系统网络接口[J].计算机研究与发展,2000,37(2):201-206. 被引量:2
-
10张博锋,蔡青,高光焘.面向图形的CAD集成系统[J].中国机械工程,1993,4(6):1-2.