期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
Xeon Phi平台上基于模板优化的3D GVF场计算加速 被引量:1
1
作者 齐金 李宽 +1 位作者 杨灿群 杜云飞 《计算机工程与科学》 CSCD 北大核心 2014年第8期1435-1440,共6页
3D梯度向量流场(3DGVF field)广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义。面向Intel Xeon Phi众核集成架构,首次进行了3DGVF场计算的加速优化。首先,挖掘3D图像像素点间存在... 3D梯度向量流场(3DGVF field)广泛应用于多种3D图像分析算法中,其计算需要多次迭代,计算量大,如何提高其计算速度具有重要的研究意义。面向Intel Xeon Phi众核集成架构,首次进行了3DGVF场计算的加速优化。首先,挖掘3D图像像素点间存在的天然并行性,发挥众核架构优势,尝试线程级并行(多核)和数据级并行(SIMD)。其次,3DGVF场的计算过程是一种典型的3D-7点模板运算,结合Xeon Phi架构的L2缓存规格,提出一种高效的数据分块策略,充分挖掘数据的时/空局部性,有效缓解模板计算引起的缓存缺失,提升了计算性能。实验结果表明,引入模板优化技术能显著提升3D GVF场的计算速度,在图像维度为5123时,所提方法在57核Xeon Phi平台上的性能相比在2.6GHz 8核16线程的Intel Xeon E5-2670CPU上的性能,加速比可达2.77。 展开更多
关键词 3d梯度向量流场 XEON PHI 模板优化 缓存分块
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部