期刊文献+
共找到1,167篇文章
< 1 2 59 >
每页显示 20 50 100
面向ARMv8 64位多核处理器的QGEMM设计与实现 被引量:3
1
作者 姜浩 杜琦 +4 位作者 郭敏 全哲 左克 王锋 杨灿群 《计算机学报》 EI CSCD 北大核心 2017年第9期2018-2029,共12页
该文在ARMv8 64位多核处理器上基于OpenBLAS首次设计、实现并优化了四精度矩阵乘法(Quadruple precision General Matrix-Matrix Multiplication,QGEMM).由于浮点计算中不可避免地引入舍入误差,双精度矩阵乘法(DGEMM)在某些情况下不能... 该文在ARMv8 64位多核处理器上基于OpenBLAS首次设计、实现并优化了四精度矩阵乘法(Quadruple precision General Matrix-Matrix Multiplication,QGEMM).由于浮点计算中不可避免地引入舍入误差,双精度矩阵乘法(DGEMM)在某些情况下不能给出令人满意的数值结果,因此需要高精度或多精度算法来实现更精确的计算.Double-double算术是一种较为有效和广泛使用的手段.文中采用double-double数据格式构建结构体存储四精度浮点数据;基于OpenBLAS中的稠密矩阵计算的分块算法,增加四精度数据格式的相关的头文件和源文件,并用汇编代码撰写文中所提出的QGEMM的核心内核;利用无误差变换技术,调整并优化内核中的算法流程,避免规格化操作步骤造成的数据强制依赖关系;通过分析算法的数据依赖关系,设计寄存器的分配和轮转策略,优化指令调度顺序,开发指令级并行性,提高QGEMM的实际性能.根据具体算法使用混合乘加指令(FMA)的程度不同,文中采用了算法理论峰值性能这一概念,其有别于机器理论峰值的概念,能更好地评估文中所提出的QGEMM的实际效率.数值实验表明:文中通过汇编代码实现并优化的QGEMM性能最高达到19.7Gflops,效率为在ARMv864位多核处理器平台上QGEMM算法理论峰值性能的82.1%,在满足数值结果精度要求的同时,其计算速度约是由C语言撰写的未优化的QGEMM和MBLAS中QGEMM的5.8倍,是编译器GCC实现的long double数据格式的QGEMM的24倍.同时数值实验还显示文中提出的QGEMM针对不同规模的矩阵具有较好的线程可扩展性. 展开更多
关键词 ARMv8 64位多核处理器 QGEMM 四精度 double—double数据格式 LONG double数据格式 OpenBLAS
下载PDF
基于SPARC V8结构处理器的计算机系统设计 被引量:4
2
作者 施蕾 刘波 周凯 《空间控制技术与应用》 2008年第3期46-50,共5页
首先介绍了国内外计算机SPARC体系结构的研究现状,指出SPARC体系结构已成为国际上流行的处理器结构之一,而且众多航天机构也采用了SPARC结构的处理器设计其航天器的计算机系统。随后,着重说明了SPARCV8的组成结构以及国内外基于SPARCV8... 首先介绍了国内外计算机SPARC体系结构的研究现状,指出SPARC体系结构已成为国际上流行的处理器结构之一,而且众多航天机构也采用了SPARC结构的处理器设计其航天器的计算机系统。随后,着重说明了SPARCV8的组成结构以及国内外基于SPARCV8结构设计实现的处理器。最后给出了基于国产SPARCV8结构处理器BM3802设计实现的最小系统组成结构。 展开更多
关键词 sparc结构 sparc V8处理器 体系结构 最小系统
下载PDF
面向ARMv8 64位多核处理器QTRSM的实现 被引量:1
3
作者 杜琦 姜浩 +2 位作者 李宽 彭林 杨灿群 《计算机工程与科学》 CSCD 北大核心 2017年第3期451-457,共7页
在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用double-double数据格式及其相应的四精度加... 在ARMv8 64位多核处理器上基于OpenBLAS实现了四精度三角矩阵求解(QTRSM)。基于两种数据格式分别实现了QTRSM,第一种实现利用GCC编译器对long double数据类型的支持来实现QTRSM,第二种实现采用double-double数据格式及其相应的四精度加减法、乘法和除法。以long double数据类型QTRSM为测试基准,就不同矩阵规模下测试结果精度和时间与double-double数据格式QTRSM进行比较。实验结果表明:两者得到近似相同精度的数值结果,但double-double数据格式QTRSM的性能是long double数据类型QTRSM的1.6倍。随着线程数的增加,两种QTRSM实现的加速比接近2.0,具有较好的可扩展性。 展开更多
关键词 ARMv8 64位多核处理器 OpenBLAS 四精度 double-double数据格式 QTRSM
下载PDF
Sun64位UltraSPARC1Ie处理器
4
《电脑技术——Hello-IT》 2000年第10期17-17,共1页
关键词 Sun公司 64 Ultrasparc1Ie 处理器
下载PDF
Fujitsu(富士通)发布全新SPARC64 Ⅶ4核处理器
5
《移动通信》 2008年第14期69-69,共1页
2008年7月14日,IT服务供应商Fujitsu(富士通)发布了最新的SPARC64 Ⅶ 4核处理器,并宣布将其配置于SPARC Enterprise UNIX服务器中高端的型号上。至此,SPARC Enterprise中端型号“M4000”、“M5000”以及高端型号“M8000”和“M900... 2008年7月14日,IT服务供应商Fujitsu(富士通)发布了最新的SPARC64 Ⅶ 4核处理器,并宣布将其配置于SPARC Enterprise UNIX服务器中高端的型号上。至此,SPARC Enterprise中端型号“M4000”、“M5000”以及高端型号“M8000”和“M9000”等产品系列将面向用户提供配置最新的SPARC64TM Ⅶ 4核处理器和原有的“SPARC64TM Ⅵ”双核处理器共计8个机型。 展开更多
关键词 FUJITSU 处理器 富士通 UNIX服务器 sparc 服务供应商 M9000 M8000
下载PDF
SPARC处理器启动代码的分析与编程 被引量:1
6
作者 吴景红 李朋 刘柳柳 《机电产品开发与创新》 2008年第6期59-60,共2页
优秀的启动代码的编写可以保证程序的稳定高效运行。首先介绍了SPARC启动代码中中断向量表的定义、堆栈初始化、系统硬件初始化,然后重点分析了代码的搬运和程序跳转的实现。虽然是针对BM3803芯片,却可以推广到一般SPARC嵌入式系统的启... 优秀的启动代码的编写可以保证程序的稳定高效运行。首先介绍了SPARC启动代码中中断向量表的定义、堆栈初始化、系统硬件初始化,然后重点分析了代码的搬运和程序跳转的实现。虽然是针对BM3803芯片,却可以推广到一般SPARC嵌入式系统的启动代码的分析与设计中去。 展开更多
关键词 存储器 sparc处理器 BM3803 启动代码 程序设计
下载PDF
科学计算程序在FT64流处理器上的实现、优化和评测
7
作者 邓宇 晏小波 +2 位作者 杜静 张英 杨学军 《计算机工程与科学》 CSCD 2008年第9期107-110,共4页
流体系结构是一种适应VLSI工艺发展的新型体系结构,它是否对科学计算程序有效是一个广泛关注的问题。本文选取NASA并行测试程序集中的一个数据密集型程序MG,研究了它在一个64位的面向科学计算设计的流处理器FT64上的实现和优化问题。在F... 流体系结构是一种适应VLSI工艺发展的新型体系结构,它是否对科学计算程序有效是一个广泛关注的问题。本文选取NASA并行测试程序集中的一个数据密集型程序MG,研究了它在一个64位的面向科学计算设计的流处理器FT64上的实现和优化问题。在FT64上的实测表明,经过面向片上存储层次的优化,FT64能够达到与Itanium 2处理器相当的性能。 展开更多
关键词 FT64 处理器 存储层次 性能评测
下载PDF
SUN的SPARC处理器体系结构及TurboSPARC微处理器
8
作者 蒋爱军 李师贤 《现代计算机》 1998年第2期10-13,共4页
本文介绍了Sun Microsystems公司的SPARC处理器体系结构以及TurboSPARC微处理器,详细叙述了其技术特征及优化性能。
关键词 sparc 体系结构 处理器 计算机
下载PDF
ARM:全新64位处理器引领计算跨入新时代——访ARM公司首席商务官Mike Inglis
9
作者 王莹 《电子产品世界》 2012年第12期1-2,共2页
10月底,ARM宣布推出第一个64位处理器系列——Cortex-A50系列,并推出Cortex-A53与Cortex-A57处理器,可与现有32位处理技术的扩展升级。ARM称全新64位处理器引领移动及企业计算跨入新时代。
关键词 64处理器 ARM公司 企业计算 MIKE 商务 32位 移动
下载PDF
64位处理器IA-64的技术特点
10
作者 陈幼松 《电子科技导报》 1998年第12期6-9,共4页
本文着重介绍下一代处理器Merced的IA64结构所采用的推断技术和风险装载技术。并对RISC处理器前途作简要评述。
关键词 MERCED IA-64 EPIC 处理器
下载PDF
EDA工作站添新品——记HP发布基于AMD64位处理器工作站新品
11
作者 辛璋 《中国集成电路》 2005年第4期46-46,共1页
关键词 64处理器 HP Workstation EDA 新品 布基 AMD处理器 个人工作站 家族
下载PDF
基于64位处理器的Android平台优化AES加密算法 被引量:7
12
作者 赵君 《哈尔滨理工大学学报》 CAS 北大核心 2017年第3期8-12,共5页
与PC机相比,在手机上实现同样的算法要求占用空间小、功耗低。高级加密标准(AES)的S盒设计采用查表方式,复杂度较高、消耗功率大,因此,将它用于手机中要对它进行优化。本文提出优化AES加密算法,将分组长度扩充至256位,增加分组长度能提... 与PC机相比,在手机上实现同样的算法要求占用空间小、功耗低。高级加密标准(AES)的S盒设计采用查表方式,复杂度较高、消耗功率大,因此,将它用于手机中要对它进行优化。本文提出优化AES加密算法,将分组长度扩充至256位,增加分组长度能提高算法的安全性;在采用求逆运算的基础上添加仿射变换,以运算代替查表操作,能减少存储空间;将字替换、行移位、列混合合并在为成为一个运算步骤,其输入数据为16位、输出数据为64位,能提高运算效率。实验结果表明,该算法既能大幅提升加密强度又能保持高运算效率。 展开更多
关键词 ANDROID AES 64处理器 分组密码
下载PDF
基于32位SPARC处理器的JTAG仿真器设计与实现 被引量:1
13
作者 张晓静 华更新 +1 位作者 刘超伟 乔磊 《空间控制技术与应用》 2010年第3期59-62,共4页
在研究IEEE1149.1标准和JTAG调试原理的基础上,以SPARC处理器内嵌调试体系结构为核心,设计实现一种JTAG仿真器.JTAG仿真器通过以太网和串口与上位机通信,利用FPGA发送JTAG协议时序完成用户调试任务.该系统设计可扩展性好,成本低,且JTAG... 在研究IEEE1149.1标准和JTAG调试原理的基础上,以SPARC处理器内嵌调试体系结构为核心,设计实现一种JTAG仿真器.JTAG仿真器通过以太网和串口与上位机通信,利用FPGA发送JTAG协议时序完成用户调试任务.该系统设计可扩展性好,成本低,且JTAG数据发送速率可达到8Mbit/s、性价比高.经测试,该系统能稳定、可靠工作. 展开更多
关键词 JTAG 仿真器 嵌入式调试 sparc处理器
下载PDF
IA-64微处理器与HP高性能服务器体系结构
14
作者 曾田 吴向军 《电子设计应用》 2002年第A1期29-31,共1页
本文从并行处理的角度出发,简要阐述了Intel&HPIA-64微处理器的体系结构,探讨了当前主流商用服务器体系结构的技术特征,并以HPSuperdome服务器为例,具体进行了高性能服务器的结构介绍。
关键词 IA-64处理器 并行处理 CC-NUMA HP Superdome服务器
下载PDF
SPARC微处理器综述 被引量:2
15
作者 覃辉 于立新 刘鹏 《电子产品世界》 2010年第7期71-72,共2页
SPARC是一个开放的体系结构标准,它基于80年代加州大学伯克利分校对RISC微处理器的研究成果,现在已成为国际上流行的RISC微处理器体系架构之一。本文介绍了SPARC微处理器的发展历史、优势特点和国内外现状,并对其未来发展进行了展望。
关键词 sparc 处理器
下载PDF
64位微处理器的现状与发展 被引量:1
16
作者 张丽 毕思庆 《微处理机》 2005年第1期1-3,共3页
本文介绍了目前世界上主要的64位微处理器的历史、现状及未来的发展方向,并介绍了各制造商的技术水平和产品的主要性能。
关键词 64 处理器
下载PDF
ARM推出高效64位处理器Cortex—A50系列 被引量:1
17
作者 高珍 《单片机与嵌入式系统应用》 2012年第12期26-26,共1页
ARM推出新款ARMv8架构ARM Cortex~A50处理器系列产品。该系列率先推出的是Cortex—A53与Cortex—A57处理器以及最新节能64位处理技术与现有32位处理技术的扩展升级。该处理器系列的可扩展性使ARM的合作伙伴能够针对智能手机、高性能服... ARM推出新款ARMv8架构ARM Cortex~A50处理器系列产品。该系列率先推出的是Cortex—A53与Cortex—A57处理器以及最新节能64位处理技术与现有32位处理技术的扩展升级。该处理器系列的可扩展性使ARM的合作伙伴能够针对智能手机、高性能服务器等各类不同市场需求开发系统级芯片(SoC)。Cortex~A57是ARM最先进、性能最高的应用处理器,Cortex—A53不仅是功耗效率最高的ARM应用处理器,也是最小的64位ARM处理器。 展开更多
关键词 ARM处理器 64处理器 A50 高性能服务器 应用处理器 系统级芯片 智能手机 合作伙伴
下载PDF
基于TMS320C64X协处理器TCP的Turbo译码实现
18
作者 李佳宁 于宏毅 《电子技术应用》 北大核心 2005年第4期68-71,共4页
介绍了TMS320C64X系列DSP内部Turbo码协处理器(TCP)的结构和算法。给出了使用TCP实现符合3GPP协议的Turbo译码的程序流程,实现了一种使用中断服务程序控制的高效处理流程,最后给出了TCP译码性能与处理时延的硬件实现结果,并做出了一定... 介绍了TMS320C64X系列DSP内部Turbo码协处理器(TCP)的结构和算法。给出了使用TCP实现符合3GPP协议的Turbo译码的程序流程,实现了一种使用中断服务程序控制的高效处理流程,最后给出了TCP译码性能与处理时延的硬件实现结果,并做出了一定的分析。 展开更多
关键词 TMS320C64X 处理器 TCP TURBO译码 中断服务程序
下载PDF
高性能64位微处理器
19
作者 马卓杰 陈新玉 《信息工程大学学报》 2000年第4期69-72,共4页
本文介绍了目前国际上已投入使用的和正在研制的 64位微处理器 ,分析了各自的性能特点 ,着重对Alpha处理器的设计思想、体系结构及实现技术进行了研究和分析 ,论述了 64位微处理器对计算技术、多媒体处理及Internet服务的影响和作用。
关键词 64位微处理器 Alpha处理器 体系结构 设计思想 在线事务处理 分布式数据访问
下载PDF
64位微处理器体系结构发展回顾和展望(上)——2002年全国计算机体系结构学术会议技术报告
20
作者 张报昌 《电子科技》 2002年第23期30-36,共7页
本文从回顾和分析64位微处理器历史、现状、未来发展出发,说明Intel和HP合作开发的IA-64EPIC体系结构IPF系列的先进性和开放性以及发展潜力,它将要取代64位RISC芯片成为未来系统设计和企业应用的主流平台。
关键词 体系结构 处理器 2002年全国计算机体系结构学术会议 技术报告 IA-64指令集 精简指令集 RISC
下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部