摘要
矩阵乘法是很多应用问题的核心计算模块,在OpenSPARC T2处理器平台上,对矩阵乘法算法进行了设计优化,针对矩阵乘法访存特点,利用处理器本身8核64线程的特征,基于Open MP并行编程模型设计了矩阵乘多线程并行算法,并对访存和块大小进行了优化,采用C语言编程,对比单核单线程,并行矩阵乘算法在8核64线程的加速比达到21.9%,发挥峰值性能的53.9%。
出处
《数字技术与应用》
2012年第5期226-228,共3页
Digital Technology & Application
基金
国家"863"计划资助项目(2012AA01301)
国家自然科学基金项目(60970033)资助