期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于汇编代码的单重循环向量化方法
1
作者 陆洪毅 戴葵 王志英 《计算机科学》 CSCD 北大核心 2003年第4期116-117,124,共3页
Through loops vectorization in instruction sequence, the vector power provided by hardware can be fully utilized. This paper analyzes the RISC instructton set, and presents a single loop vectorization method that is b... Through loops vectorization in instruction sequence, the vector power provided by hardware can be fully utilized. This paper analyzes the RISC instructton set, and presents a single loop vectorization method that is based on assemble code, it can efficiently detect single loops in instruct sequence and vectorize them. 展开更多
关键词 微处理器 设计 汇编代码 单重循环向量化方法 指令源代码 计算机
下载PDF
面向非多媒体程序的SIMD向量化算法的研究及改进 被引量:6
2
作者 李玉祥 施慧 陈莉 《小型微型计算机系统》 CSCD 北大核心 2009年第10期1927-1935,共9页
利用微处理器的多媒体扩展对非多媒体程序的向量化已成为提高程序性能的一个重要手段,然而目前几乎所有的商业编译器对非多媒体程序的向量化的结果,都无法说明其编译器有效的向量能力.本文通过分析典型的非多媒体程序--SPECCPU2000浮点... 利用微处理器的多媒体扩展对非多媒体程序的向量化已成为提高程序性能的一个重要手段,然而目前几乎所有的商业编译器对非多媒体程序的向量化的结果,都无法说明其编译器有效的向量能力.本文通过分析典型的非多媒体程序--SPECCPU2000浮点程序,归纳出非多媒体程序的SIMD向量化特征,并依此提出局部数据重组的向量化方法、针对外层循环的向量化方法、部分语句SLP的向量化方法几种新的向量化方法和相关的向量化优化技术.通过对比Intel编译器对SPECCPU2000的向量化性能测试,可以发现本文提出的改进方法有效的提高了程序的向量化. 展开更多
关键词 向量化 数据重组 SIMD 外层循环向量化
下载PDF
向量化中临时数组的引入 被引量:1
3
作者 朱鳌鑫 《计算机学报》 EI CSCD 北大核心 1995年第7期510-516,共7页
本文讨论可向量化DO循环中临时数组的引入问题.首先精确定义了对一个引用量引入一临时数组的概念,接着讨论了两种有效的引入形式,然后,对所有可向量化的DO循环证明按有效形式引入临时数组是普通有效的.同时也给出了在何处如何... 本文讨论可向量化DO循环中临时数组的引入问题.首先精确定义了对一个引用量引入一临时数组的概念,接着讨论了两种有效的引入形式,然后,对所有可向量化的DO循环证明按有效形式引入临时数组是普通有效的.同时也给出了在何处如何引入临时数组的算法.最后,还讨论了在一般循环分布中的相应问题. 展开更多
关键词 循环向量化 循环分布 临时数组 算法
下载PDF
基于图形处理单元的数字全息图加速再现算法研究 被引量:1
4
作者 丁鹤平 朱竹青 +2 位作者 孙敏 王晓雷 周延怀 《中国激光》 EI CAS CSCD 北大核心 2010年第11期2901-2905,共5页
研究了一种利用图形处理单元(GPU)加速数字全息图再现的算法。该算法充分利用GPU强大的并行计算能力,有效地缩短了数字全息图再现时间。比较了GPU加速运算和中央处理器(CPU)独立运算两种模式下,两种不同尺寸的数字全息图再现时间。结果... 研究了一种利用图形处理单元(GPU)加速数字全息图再现的算法。该算法充分利用GPU强大的并行计算能力,有效地缩短了数字全息图再现时间。比较了GPU加速运算和中央处理器(CPU)独立运算两种模式下,两种不同尺寸的数字全息图再现时间。结果表明,对于大小为2048 pixel×2048 pixel的数字全息图,GPU算法的再现时间可缩短至约1/15。利用该算法编写了易操作的通用软件。在高配置主机和高性能GPU硬件环境下,该软件不仅能够满足诸如数字全息显示、数字全息显微等系统实时功能的要求,还能够指导数字全息实验系统的快速搭建。 展开更多
关键词 全息 再现算法 向量化循环 图形处理单元 并行计算
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部