期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
一种超椭圆曲线密码处理器并行结构设计 被引量:2
1
作者 方跃坚 沈晴霓 吴中海 《计算机研究与发展》 EI CSCD 北大核心 2013年第11期2383-2388,共6页
提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数... 提出了一种超椭圆曲线密码处理器并行结构设计.处理器由多个具有相同结构的核组成,每个核由一个控制器、一个寄存器文件、一个运算单元组成.多个独立的核之间通过寄存器共享进行通信来协作完成复杂运算.每个运算单元执行自定义多操作数指令A(B+C)+D,并在指令产生过程和执行时对指令进行灵活配置.该设计可以实现核之间的指令级并行处理和不同指令执行阶段的流水线处理.在FPGA上的实验结果表明,与以往研究相比,该设计可以实现对超椭圆曲线密码点乘运算更高的加速. 展开更多
关键词 超椭圆曲线密码系统 并行结构 自定义指令 指令级并行 流水线技术 FPGA
下载PDF
基于BWDSP100的传播分簇算法研究与实现 被引量:4
2
作者 王昊 黄光红 王向前 《中国集成电路》 2014年第8期24-28,共5页
BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,... BWDSP100是一款SIMD和VLIW架构高性能DSP,它的指令级并行性主要通过指令分簇和软件流水来实现。本文针对BWDSP100的特点,提出了一种新的分簇算法——传播分簇,该算法考虑了负载均衡和特殊ABI规则,不会产生簇间转移指令。实验结果表明,该分簇方法在Open64编译器上的实现可以取得比传统方法更好的效果。 展开更多
关键词 数字信号处理器 超长指令字 指令级并行 分簇
下载PDF
基于IA64二进制翻译的解码技术研究
3
作者 杨欣 李崇 《计算机工程》 CAS CSCD 北大核心 2008年第6期88-89,92,共3页
作为64位处理器架构,IA64提供了更高的指令级并行性,代表了一种新型微处理器的发展方向。该文介绍了基于SLED对IA64指令的描述和利用MLTK生成反向工具,讨论了IA64中指令解码器的设计与实现。这些技术对IA64二进制指令代码流的自动分析... 作为64位处理器架构,IA64提供了更高的指令级并行性,代表了一种新型微处理器的发展方向。该文介绍了基于SLED对IA64指令的描述和利用MLTK生成反向工具,讨论了IA64中指令解码器的设计与实现。这些技术对IA64二进制指令代码流的自动分析和变换,以及实现IA64二进制自动翻译具有重要的意义。 展开更多
关键词 EPIC操作系统 指令级并行 指令槽
下载PDF
基于硬件剖析的DVS能耗优化
4
作者 吴昊 周学海 《计算机工程》 CAS CSCD 北大核心 2007年第12期241-243,共3页
如何在满足系统性能要求的前提下尽可能降低系统能耗已成为嵌入式系统设计所面临的挑战之一。动态电压调节是降低能耗的有效技术,它能通过硬件剖析来识别“热点”,根据指令级并行(ILP)的变化情况动态调节处理器的电压和速度。实验表明... 如何在满足系统性能要求的前提下尽可能降低系统能耗已成为嵌入式系统设计所面临的挑战之一。动态电压调节是降低能耗的有效技术,它能通过硬件剖析来识别“热点”,根据指令级并行(ILP)的变化情况动态调节处理器的电压和速度。实验表明该方法可在性能损失较小的情况下,有效节省能耗。 展开更多
关键词 低功耗 动态电压调节 指令级并行 热点
下载PDF
基于数据流图的异构VLIW DSP分簇方法 被引量:1
5
作者 邱鹏飞 洪一 +1 位作者 耿锐 徐云 《计算机应用》 CSCD 北大核心 2011年第4期935-937,977,共4页
超长指令字数字信号处理器(VLIW DSP)的指令级并行性(ILP)主要通过指令分簇和软件流水来实现。在以前的研究中,指令分簇主要只考虑指令级并行性和减少簇间转移指令,对异构体系结构和某些寄存器只能分在指定簇上的情况考虑较少。提出一... 超长指令字数字信号处理器(VLIW DSP)的指令级并行性(ILP)主要通过指令分簇和软件流水来实现。在以前的研究中,指令分簇主要只考虑指令级并行性和减少簇间转移指令,对异构体系结构和某些寄存器只能分在指定簇上的情况考虑较少。提出一种基于数据流图(DFG)的异构体系结构上的分簇方法,利用指令的相关性将DFG划分为与簇数目相同个数的子图,再根据特殊寄存器对簇的要求采用启发式算法对子图进行调整,实验结果表明这种分簇方法使得负载更均衡,加速比相对于传统方法可以提高8%左右。 展开更多
关键词 超长指令字 指令级并行性 异构 分簇 启发式算法
下载PDF
分簇VLIW DSP上支持单双字模式选择的SIMD编译优化 被引量:2
6
作者 黄胜兵 郑启龙 郭连伟 《计算机应用》 CSCD 北大核心 2015年第8期2371-2374,共4页
BWDSP100是一款采用超长指令字(VLIW)和单指令多数据流(SIMD)架构的针对高性能计算领域而设计的32位静态标量数字信号处理器,其指令级并行(ILP)主要是通过其特殊的分簇体系结构和SIMD指令来实现,然而现有的编译框架无法对这些特殊的SIM... BWDSP100是一款采用超长指令字(VLIW)和单指令多数据流(SIMD)架构的针对高性能计算领域而设计的32位静态标量数字信号处理器,其指令级并行(ILP)主要是通过其特殊的分簇体系结构和SIMD指令来实现,然而现有的编译框架无法对这些特殊的SIMD指令提供支持。由于BWDSP100拥有丰富的SIMD向量化资源,且其所运用的雷达数字信号处理领域对程序的性能要求极高,因此针对BWDSP100结构的特点,在传统Open64编译器中SIMD编译优化框架的基础上提出并实现了一种支持单双字模式选择的SIMD编译优化算法,通过该算法可以显著提高一些在DSP上有着广泛运用计算密集型程序的性能。实验结果表明,与优化前相比,该算法方案在BWDSP编译器上的实现能够平均取得5.66的加速比。 展开更多
关键词 编译优化 指令级并行 分簇体系数字信号处理器 超长指令字 单指令多数据流 Open64编译器
下载PDF
一种动态的变型向量处理器
7
作者 吴晨曦 杨惠 《中国电子科学研究院学报》 2014年第3期296-299,303,共5页
嵌入式应用中,单指令流多数据流(SIMD,single instruction multiple data)结构的向量处理器在蓬勃发展的同时,也面临着如何高效利用其丰富处理资源的问题。在SIMD的向量结构上,处理实际应用中无法被向量化运算的部分,尤其是很多非向量... 嵌入式应用中,单指令流多数据流(SIMD,single instruction multiple data)结构的向量处理器在蓬勃发展的同时,也面临着如何高效利用其丰富处理资源的问题。在SIMD的向量结构上,处理实际应用中无法被向量化运算的部分,尤其是很多非向量化的循环内部往往含有体间相关,使得SIMD结构的丰富运算资源处于空闲状态。因此,传统的SIMD结构受限于此类应用。提出了一种变型的向量处理器,在保持传统SIMD处理数据并行应用高效性的同时,能够高效地执行包含循环体间数据相关的代码段。实验结果表明,它能获得2.4倍的性能加速,而仅仅占用0.97%的面积开销。 展开更多
关键词 单指令流多数据流 指令级并行 数据级并行 向量处理单元
下载PDF
基于指令距离的存储相关性预测方法
8
作者 路冬冬 何军 +1 位作者 杨剑新 王飙 《计算机应用》 CSCD 北大核心 2013年第7期1903-1907,共5页
存储相关性预测对于减少存储相关性冲突、提高微处理器性能具有十分重要的作用。针对传统相关性预测器硬件开销大、可实现性较差的缺点,通过对存储相关性的局部性分析,提出了一种基于指令距离的存储相关性预测方法。该方法充分利用了发... 存储相关性预测对于减少存储相关性冲突、提高微处理器性能具有十分重要的作用。针对传统相关性预测器硬件开销大、可实现性较差的缺点,通过对存储相关性的局部性分析,提出了一种基于指令距离的存储相关性预测方法。该方法充分利用了发生存储相关性冲突的指令在指令距离上的局部性,预测冲突指令的指令距离,进而控制部分访存指令的发射时机,大大减少了存储相关性冲突的次数。实验结果表明,在硬件开销约为1 KB的情况下,使用基于指令距离的相关性预测器后,每个时钟周期平均执行的指令数可以提高1.70%,最高可以提高5.11%。在硬件开销较小的情况下,较大程度提高了微处理器的性能。 展开更多
关键词 指令级并行 访存指令 存储相关性预测 指令距离
下载PDF
Study on Cache Configuration of A Muitithreaded Approach
9
作者 Lan Dong Xinmin Tang +2 位作者 Zhenzhou Ji Mingzeng Hu Guangzuo Cui 《通讯和计算机(中英文版)》 2006年第7期13-15,共3页
关键词 cache[ kAF ]n.隐藏处所 隐藏的粮食或物资 贮藏物vt.隐藏 窖藏高速缓冲存储器 多线程 指令级并行性 内部处理器并行运算
下载PDF
A power-aware code-compression design for RISC/VLIW architecture 被引量:1
10
作者 Che-Wei LIN Chang Hong LIN Wei Jhih WANG 《Journal of Zhejiang University-Science C(Computers and Electronics)》 SCIE EI 2011年第8期629-637,共9页
We studied the architecture of embedded computing systems from the viewpoint of power consumption in memory systems and used a selective-code-compression (SCC) approach to realize our design.Based on the LZW (Lempel-Z... We studied the architecture of embedded computing systems from the viewpoint of power consumption in memory systems and used a selective-code-compression (SCC) approach to realize our design.Based on the LZW (Lempel-Ziv-Welch) compression algorithm,we propose a novel cost effective compression and decompression method.The goal of our study was to develop a new SCC approach with an extended decision policy based on the prediction of power consumption.Our decompression method had to be easily implemented in hardware and to collaborate with the embedded processor.The hardware implementation of our decompression engine uses the TSMC 0.18μm-2p6m model and its cell-based libraries.To calculate power consumption more accurately,we used a static analysis method to estimate the power overhead of the decompression engine.We also used variable sized branch blocks and considered several features of very long instruction word (VLIW) processors for our compression,including the instruction level parallelism (ILP) technique and the scheduling of instructions.Our code-compression methods are not limited to VLIW machines,and can be applied to other kinds of reduced instruction set computer (RISC) architecture. 展开更多
关键词 LZW compression Cell-based libraries instruction level parallelism (ilp) VLIW processors
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部