期刊文献+

龙芯2F上的访存优化 被引量:7

Optimization of Memory Access Based on Loongson2F
下载PDF
导出
摘要 一般的数据处理程序中,计算时间在其中往往只起次要作用,因此访存方式是否有效对程序的性能影响很大。在基于龙芯2F处理器研制的高性能计算机系统KD-50-I上安装ATLAS,经测试其性能只达到龙芯2F理论峰值的30%。通过循环展开减少函数存储访问次数,增大计算访存比;采用数据分块、部分拷贝以增强访存局部性,减少cache失效;利用非阻塞cache加快内存访问速度等访存优化技术,将ATLAS性能提高50%以上。 In most cases,compared to computing time,memory access time takes a much larger proportion of program running time.Therefore,memory access approach can affect the program performance significantly.Testing results show that the performance of ATLAS transplanted on KD-50-I,which is based on Loongson 2F, reaches only 30%of its theoretical peak.In this paper,by exploiting Loop Unrolling technique to decrease memory access frequency,enhancing time and space locality to reduce cache misses and nonblocking cache mechanism to form memory access pipeline,the performance of optimized ATLAS can be improved to 50% higher.
出处 《计算机系统应用》 2010年第1期171-175,共5页 Computer Systems & Applications
基金 国家高技术研究发展计划(863)(2008AA010902)
关键词 ATLAS KD-50-I cache失效 非阻塞cache ATLAS KD-50-I cache miss non-blocking cache
  • 相关文献

参考文献7

  • 1KasperskyK.代码优化:有效使用内存.北京:电子工业出版社.2004.85.
  • 2http://www.loongson.cn/loongson/.
  • 3龙芯2F处理器用户手册.中国科学院计算技术研究所.
  • 4http://www.kd50.ustc.edu.cn.
  • 5http://www.netlib.org.
  • 6Lawson CL, Hanson RJ, et al. Basic linear algebra subprograms for Fortran usage. ACM Trans. Math. Software, 1979,5(3):324 - 325.
  • 7Clint Whaly R, Petitet A, Dongarra JJ. Automated empirical optimation of software and the ATL AS project. Parallel Computing, 2001,270-2):3 -35.

共引文献1

同被引文献38

引证文献7

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部