期刊文献+

矩阵乘法在Open SPARC T2多核处理器上的优化

下载PDF
导出
摘要 矩阵乘法是很多应用问题的核心计算模块,在OpenSPARC T2处理器平台上,对矩阵乘法算法进行了设计优化,针对矩阵乘法访存特点,利用处理器本身8核64线程的特征,基于Open MP并行编程模型设计了矩阵乘多线程并行算法,并对访存和块大小进行了优化,采用C语言编程,对比单核单线程,并行矩阵乘算法在8核64线程的加速比达到21.9%,发挥峰值性能的53.9%。
作者 谢林川 刘杰
出处 《数字技术与应用》 2012年第5期226-228,共3页 Digital Technology & Application
基金 国家"863"计划资助项目(2012AA01301) 国家自然科学基金项目(60970033)资助
  • 相关文献

参考文献9

  • 1Goto K,van de Geijn R A.Anatomy of high-performance ma- trix multiplication[J].ACM Transactions on Mathematical Software, 2008,34(3): Article 12(1-25).
  • 2Goto K.van de Geijn R A.High-Performance Implementation of the Level-3 8LAS[J].ACM Transactions on Mathematical Software, Vol.V(3):Article 12(1-18).
  • 3Gunnels J A, Henry G M,van de Geijn R A.A family of high- performance matrix multiplication algorithms [C]//Proceedings of the International Conference on Computational Science Part I.London,UK:Springer,2001:5]-60.
  • 4Dongarra,J.J.,Du Croz,J.,Hammarling,S.,and Duff, I.1990.A set of level 3 basic linear algebra subprograms,ACM Trans.Math.Soft. 16,1 (March), 1-17.
  • 5Gunnels J, Lin C, Morrow G,et al.A flexible class of parallel matrix multiplication algorithms [C]// First Merged Interna- tional Parallel Processing Symposium and Symposium on Parallel and Distributed Processing.Washington,USA:IEEE Computer Society, 1998, 12:110-116.
  • 6Marker B,van Zee F G,Goto K, et al.Toward scalable matrix multiply on multithreaded architectures [C]i Proceedings of the 13th International European Conference on Parallel and Distributed Computing.Rennes, France:ACM Press,2007:748-757.
  • 7Chandra R, Menon R,Dagum L,et al.Parallel Programming in Open- MP,Morgan Kaufman Publishers, Oct.2000.
  • 8MalyshkinV,Parallelcomputing technologies[C]//8th inter-na- tional conference,PaCT 2005.Krasnoyarsk, Russia,2OO5.Berlin;New York:Springer,2005.
  • 9Quinn M J.Parallel programming in C with MPI and OpenMP[M]. 北京.清华大学出版社,2005.

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部