期刊文献+
共找到232篇文章
< 1 2 12 >
每页显示 20 50 100
面向FT1000微处理器的STREAM并行计算与优化 被引量:4
1
作者 迟利华 胡庆丰 +3 位作者 刘杰 甘新标 蒋杰 晏益慧 《计算机工程与科学》 CSCD 北大核心 2014年第12期2267-2271,共5页
STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小... STREAM是微处理器上内存性能的基准测试程序,在多核多线程FT1000微处理器上发挥高性能是具有挑战性的研究工作。基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序。基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式。数据测试结果表明,优化后的STREAM的性能比原始串行程序性能提高了19.2%-64.2%。优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%。 展开更多
关键词 多线程微处理器 STREAM测试程序 性能优化
下载PDF
“龙腾~RR2”微处理器流水线的设计及优化 被引量:9
2
作者 黄小平 樊晓桠 +1 位作者 贾琳 白永强 《微电子学与计算机》 CSCD 北大核心 2006年第2期144-147,共4页
32位RISC微处理器“龙腾R2”是西北工业大学航空微电子中心2005年设计的一款自主知识产权的嵌入式微处理器。采用PowerPC体系结构,六级流水线,具有独立的数据Cache和指令Cache。文章介绍“龙腾R2”处理器流水线的设计思想以及优化方... 32位RISC微处理器“龙腾R2”是西北工业大学航空微电子中心2005年设计的一款自主知识产权的嵌入式微处理器。采用PowerPC体系结构,六级流水线,具有独立的数据Cache和指令Cache。文章介绍“龙腾R2”处理器流水线的设计思想以及优化方案。重点介绍流水线中相关的解决方案、精确异常的实现以及流水线中指令预取级的设计与实现等。 展开更多
关键词 “龙腾R2”微处理器 流水线 优化 相关处理 异常 指令预取队列
下载PDF
基于安腾微处理器的程序性能优化与分析 被引量:3
3
作者 迟利华 刘杰 《计算机工程与科学》 CSCD 北大核心 2011年第9期42-47,共6页
高性能计算越来越广泛地应用到科学和工程的各个领域,但实际应用程序获得的性能并未随着机器峰值性能的提高而同比例提高,应用程序只能发挥峰值性能的5%~10%左右,而且两者的差距在扩大,程序性能优化作为解决该问题的方法之一得到了学... 高性能计算越来越广泛地应用到科学和工程的各个领域,但实际应用程序获得的性能并未随着机器峰值性能的提高而同比例提高,应用程序只能发挥峰值性能的5%~10%左右,而且两者的差距在扩大,程序性能优化作为解决该问题的方法之一得到了学术界的广泛关注。本文基于安腾微处理器,总结了程序优化的通用方法,给出了程序优化与分析的一般步骤。根据优化与分析步骤,首先对四个程序进行了详细的性能分析,找到性能瓶颈和重点子程序;然后分别根据四个程序的特点,采用基于Cache和指令流水线的优化技术,对程序进行了性能优化;最后给出了性能优化测试结果,分别得到8%~33%的性能提高,取得了良好的优化效果。 展开更多
关键词 安腾微处理器 程序性能优化 程序性能分析
下载PDF
使用支持向量机的微处理器验证向量优化方法 被引量:1
4
作者 王朋宇 郭崎 +2 位作者 沈海华 陈云霁 张珩 《高技术通讯》 EI CAS CSCD 北大核心 2010年第1期68-74,共7页
为了解决微处理器仿真验证中随机验证向量质量不高的问题,提出了一种基于支持向量机(SVM)的验证向量优化方法。该方法将已仿真运行的验证向量及其覆盖率信息作为支持向量机的样本进行有监督学习,得到验证向量关于功能覆盖点的分类器。... 为了解决微处理器仿真验证中随机验证向量质量不高的问题,提出了一种基于支持向量机(SVM)的验证向量优化方法。该方法将已仿真运行的验证向量及其覆盖率信息作为支持向量机的样本进行有监督学习,得到验证向量关于功能覆盖点的分类器。利用训练后的分类器对于新产生的验证向量进行预测,并丢弃预测中不能提高覆盖率的冗余验证向量。实验数据表明该方法能准确地过滤冗余验证向量,提高仿真运行的验证向量的质量。和完全随机的验证向量生成方法相比,该方法达到相同的功能覆盖率仅需要前者1/3的验证向量。 展开更多
关键词 支持向量机(SVM) 功能覆盖率模型 微处理器验证 仿真验证 验证向量优化
下载PDF
一种Java-DSP微处理器系统
5
作者 戴葵 陈虎 李思昆 《计算机工程》 CAS CSCD 北大核心 2001年第5期1-2,12,共3页
为了满足当前新型信息设备对其核心微处理器的特殊需求,将和结合组成微处理器系统是微处理器系统设计的一个JavaDSPJava-DSP新趋势。给出了一种微处理器系统的体系结构,并详细论述了其各个组成部分的结构和技术特点。
关键词 微处理器 java DSP 体系结构
下载PDF
意法半导体推出第二代工业4.0级边缘AI微处理器
6
《单片机与嵌入式系统应用》 2023年第8期94-94,共1页
意法半导体(STMicroelectronics,简称ST)推出第二代STM32微处理器(MPU),该产品在继承了STM32生态系统基础上,采用了全新的处理器架构,提升了工业和物联网边缘应用的性能和安全性。新一代微处理器的第一条产品线STM32MP25配备一颗或两颗6... 意法半导体(STMicroelectronics,简称ST)推出第二代STM32微处理器(MPU),该产品在继承了STM32生态系统基础上,采用了全新的处理器架构,提升了工业和物联网边缘应用的性能和安全性。新一代微处理器的第一条产品线STM32MP25配备一颗或两颗64位Arm Cortex-A35内核,1.5 GHz主频,具备高能效。为处理实时任务,还集成一颗400 MHz Cortex-M33内核。内置的专用神经处理单元(NPU)将处理器的总算力提高到1.35 TOPS(每秒1.35万亿次运算),使其能够为先进的机器视觉、预测性维护等应用提供更强大的边缘AI加速能力。STM32MP25支持32位DDR4和LPDDR4存储器,为成本优化设计提供长期保障。 展开更多
关键词 STM32 意法半导体 预测性维护 机器视觉 微处理器 物联网 实时任务 成本优化
下载PDF
应用于智能卡的Java嵌入式微处理器核的设计 被引量:2
7
作者 唐小勇 羊性滋 《微电子学》 CAS CSCD 北大核心 2000年第6期382-386,共5页
介绍了一种可直接执行 Java字节码的嵌入式微处理器体系结构。该处理器核实现了Java卡虚拟机 (JCVM)指令集。类 RISC的流水线显著加快了指令的执行速度。文中对堆栈类型指令间的数据相关问题提出了一种新的解决办法。
关键词 嵌入式微处理器 java处理器 虚拟机 智能卡
下载PDF
PicoJava-I微处理器的体系结构 被引量:1
8
作者 王涛 毛志刚 叶以正 《微处理机》 1999年第4期30-33,共4页
本文简单介绍 Java虚拟机及 Java语言的执行方式 ,并在此基础上介绍Sun公司的 Java微处理器系列成员之一的 Pico Java-I微处理器的体系结构 ,包括Pico Java-I的结构特征。
关键词 java虚拟机 微处理器 Picojavah-Ⅰ 体系结构
下载PDF
Java智能卡微处理器软件仿真指令的研究与实现
9
作者 李飞卉 张建杰 +2 位作者 葛元庆 岳震伍 周润德 《微电子学》 CAS CSCD 北大核心 2002年第5期325-329,共5页
JCP( Java Card Processor)是一种直接支持 Java卡虚拟机运行的 1 6位 RISC微处理器。但 Java卡虚拟机的支持面向对象的字节码指令功能较复杂 ,用硬件直接实现需要消耗大量的资源 ,不适合智能卡等硬件资源有限的系统。JCP提供一种硬件... JCP( Java Card Processor)是一种直接支持 Java卡虚拟机运行的 1 6位 RISC微处理器。但 Java卡虚拟机的支持面向对象的字节码指令功能较复杂 ,用硬件直接实现需要消耗大量的资源 ,不适合智能卡等硬件资源有限的系统。JCP提供一种硬件陷阱机制 ,在执行此类指令时 ,切换到相应的陷阱处理程序中 ,用软件仿真它们的功能。文章讨论了 Java卡虚拟机二进制文件特点 ,软件仿真指令的面向对象的功能及其具体实现。通过仿真基于 JCP的 Java卡操作系统和应用程序 ,验证了软件仿真指令实现的正确性。 展开更多
关键词 java 智能卡 微处理器 软件仿真
下载PDF
一种SOC微处理器IP核的优化设计 被引量:1
10
作者 张国萍 邓先灿 《杭州电子科技大学学报(自然科学版)》 2006年第1期63-66,共4页
该文提出了多种改善微处理器设计的优化方法。在系统结构上,采用四级流水结构,改善了微处理器的执行效率;为了解决数据相关问题,采用了bypass技术,并进一步提高了流水线的效率。在CPU结构上,采用纯组合逻辑电路和改进的ALU算法,来提高... 该文提出了多种改善微处理器设计的优化方法。在系统结构上,采用四级流水结构,改善了微处理器的执行效率;为了解决数据相关问题,采用了bypass技术,并进一步提高了流水线的效率。在CPU结构上,采用纯组合逻辑电路和改进的ALU算法,来提高处理器的速度。最后,对该CPU核完成了仿真和综合,并在FPGA上成功地实现。实验结果表明设计的SOC处理器在指令上与通用的PIC16C57的处理器兼容,而执行效率为其4倍,系统时钟可达到40MHz以上。 展开更多
关键词 微处理器 优化设计 执行效率
下载PDF
抽象机在Java微处理器中的应用研究
11
作者 王海晨 赵祥模 《计算机技术与发展》 2011年第6期242-245,共4页
抽象机通常用在软件程序编译器中。提出了一个基于硬件抽象机的处理器设计方法,使用该方法设计了一个Java微处理器,并且利用硬件抽象机增强了处理器的指令级并行能力,提高了微处理器性能。描述了用于Java处理器的硬件抽象机设计方法,阐... 抽象机通常用在软件程序编译器中。提出了一个基于硬件抽象机的处理器设计方法,使用该方法设计了一个Java微处理器,并且利用硬件抽象机增强了处理器的指令级并行能力,提高了微处理器性能。描述了用于Java处理器的硬件抽象机设计方法,阐述了它的实现基本原理,给出了Java处理器的逻辑设计。通过软件仿真,证明了采用硬件抽象机的Java处理器可以获得从78%到173%的指令级并行增强,处理器性能提高平均31%。说明了提出的方法可以用于嵌入式微处理器的设计,提高系统性能。 展开更多
关键词 指令级并行 java 微处理器 抽象机
下载PDF
软硬件联合仿真方法进行微处理器流水线管理优化设计
12
作者 万律 许新任 杜德臣 《微电子学与计算机》 CSCD 北大核心 2003年第10期7-10,共4页
本文讨论微处理器设计过程中使用的软硬件联合仿真评估方法。本方法可以在进行硬件设计时辅助设计者分析软硬件划分方案的合理性,并对设计的原型系统的性能和成本进行定量的评估。本文以通用数字信号处理器的流水线控制单元设计为案例,... 本文讨论微处理器设计过程中使用的软硬件联合仿真评估方法。本方法可以在进行硬件设计时辅助设计者分析软硬件划分方案的合理性,并对设计的原型系统的性能和成本进行定量的评估。本文以通用数字信号处理器的流水线控制单元设计为案例,介绍这种方法思想以及具体应用。通过采用这套方法的应用,设计者找出流水线控制单元的软硬件合理划分方案,在性能受影响极小的前提下,获得硬件逻辑和芯片面积显著减小,功耗和成本大大降低的集成电路设计方案。 展开更多
关键词 微处理器 流水线管理 优化设计 软件 硬件 联合仿真方法 数据依赖 数字信号处理器
下载PDF
Java正在影响微处理器的设计思路
13
作者 范东华 《电子产品世界》 1997年第3期34-35,共2页
关键词 程序语言 java 微处理器 设计
下载PDF
Android应用中的Java题库系统的设计与优化 被引量:1
14
作者 王全新 刘音 《信息记录材料》 2024年第1期142-144,共3页
本研究致力于设计和开发基于Android平台的Java题库系统,旨在提供一个灵活、高效的考试和评估工具。该系统分为三大部分:基于Android的Java题库系统的设计、数据库查询性能优化、前端性能优化。首先,研究Android平台的优势,突出其广泛... 本研究致力于设计和开发基于Android平台的Java题库系统,旨在提供一个灵活、高效的考试和评估工具。该系统分为三大部分:基于Android的Java题库系统的设计、数据库查询性能优化、前端性能优化。首先,研究Android平台的优势,突出其广泛应用和定制性,为教育领域带来创新。其次,数据库查询性能优化方法着重于索引设计、数据缓存、网络请求优化,提高了数据的访问效率。前端性能优化方法包括异步加载、图片优化、减少网络请求,提高了用户界面的响应性。通过系统设计和开发,演示版本的Java题库系统为教育领域提供了一个潜力巨大的工具。 展开更多
关键词 ANDROID java题库 数据库查询 前端优化
下载PDF
FitenBLAS:面向FT1000微处理器的高性能线性代数库
15
作者 迟利华 刘杰 +5 位作者 晏益慧 谢林川 甘新标 胡庆丰 蒋杰 李胜国 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第4期100-106,共7页
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目... BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线性代数库,其研制对FT1000微处理器在科学与工程计算中的应用具有重要意义.根据多级存储结构和寄存器的数目,设计了向量与向量、矩阵与向量和矩阵与矩阵运算的多级循环展开方法,采用指令调度、数据预取等通用优化技术,优化BLAS库串行程序.对于BLAS3子程序,设计了矩阵乘无冗余数据拷贝分块算法,采用指令重排、访存与计算的重叠、分块等技术优化矩阵乘子程序,基于矩阵乘子程序实现了其他BLAS3子程序.研制了汇编线性代数程库FitenBLAS,其核心子程序矩阵乘的双精度计算性能达到6.91Gflops,是峰值性能的86.4%. 展开更多
关键词 FT1000微处理器 BLAS库 性能优化
下载PDF
FPGA嵌入式微处理器软核迎向开放时代——Actel推出专为FPGA而优化的32位ARM软核系列
16
作者 任苙萍 《电子与电脑》 2005年第11期23-26,共4页
关键词 嵌入式微处理器 FPGA Actel ARM 32位 软核 系统单芯片 优化 数字视频
下载PDF
Java Web应用程序开发课程教学设计优化策略研究
17
作者 崔婷玉 张俊 《电脑知识与技术》 2024年第16期146-149,共4页
文章首先对Java Web应用程序开发课程教学内容进行了概述,通过对传统教学环节的分析,发现存在学生学习兴趣不高、实操能力不强、课后沟通不畅的问题。针对传统教学中存在的问题,文章从课堂教学前、课堂教学、课堂教学后3个环节进行教学... 文章首先对Java Web应用程序开发课程教学内容进行了概述,通过对传统教学环节的分析,发现存在学生学习兴趣不高、实操能力不强、课后沟通不畅的问题。针对传统教学中存在的问题,文章从课堂教学前、课堂教学、课堂教学后3个环节进行教学内容优化,将三个阶段形成一个完整的闭环,从教学设计、教学方法、信息化教学平台、考核方式方面,提出Java Web应用程序开发课程教学设计优化策略,有效提高了学生学习兴趣,提升了学生课程参与度,为学生以后进入职场工作打下坚实的基础。 展开更多
关键词 java Web应用程序 教学优化 教学内容 信息化教学平台 教学设计
下载PDF
SMA处理器中的持续优化技术
18
作者 邓鹍 窦勇 周兴铭 《计算机研究与发展》 EI CSCD 北大核心 2002年第9期1087-1092,共6页
前瞻多线程结构 (SMA)是在超标量前瞻执行技术和多线程技术的基础上结合了二者的优点而发展起来的 .首先研究了 SMA模型的特点 ,指出了 3个关键性能要素 :现场负载不均衡、线程间控制前瞻失效与线程间数据前瞻失效 .为了有效地开发 SMA... 前瞻多线程结构 (SMA)是在超标量前瞻执行技术和多线程技术的基础上结合了二者的优点而发展起来的 .首先研究了 SMA模型的特点 ,指出了 3个关键性能要素 :现场负载不均衡、线程间控制前瞻失效与线程间数据前瞻失效 .为了有效地开发 SMA结构的潜能 ,引入了若干启发式规则 ,设计了基于线程的动态轮廓采样机制 ,并在此基础上实现了一个持续优化框架原型 .对上述优化规则的模拟表明 ,该优化原型能够较好地完成线程优化任务 ,有效地开发 SMA结构的性能潜力 . 展开更多
关键词 SMA处理器 持续优化技术 前瞻多线程结构 动态Profile 微处理器 指令级并行技术
下载PDF
利用硬件抽象机模拟执行技术设计JAVA处理器
19
作者 王海晨 赵祥模 《微电子学与计算机》 CSCD 北大核心 2011年第1期104-107,共4页
提出了一个基于硬件抽象机的流水线微处理器设计框架,创造性地使用了一种基于标签结构的模拟执行技术.基于这一框架,描述了一个堆栈抽象机的工作原理,实现了一个Java指令级并行处理器.利用堆栈硬件抽象机和堆栈指令折叠技术的组合解决了... 提出了一个基于硬件抽象机的流水线微处理器设计框架,创造性地使用了一种基于标签结构的模拟执行技术.基于这一框架,描述了一个堆栈抽象机的工作原理,实现了一个Java指令级并行处理器.利用堆栈硬件抽象机和堆栈指令折叠技术的组合解决了Java处理器中的堆栈依赖瓶颈问题.软件模拟证明了该处理器能够最大限度地挖掘出Java程序中的指令级并行,并且拥有更高的处理能力. 展开更多
关键词 抽象机 java微处理器 堆栈 指令级并行 超长指令字
下载PDF
微处理器芯片的层次化综合与物理设计 被引量:5
20
作者 刘东明 王仁平 +1 位作者 李宏意 林丽霞 《有线电视技术》 2019年第1期89-92,共4页
本文介绍了采用90nm工艺制程的微处理器芯片的层次化综合与物理设计。在层次化综合阶段,使用二次迭代的方法生成网表文件,较一次迭代获得了更精准的时序结果。在物理设计方面,利用Top-Down的层次化设计结构,合并FRAM-ETM模型调用方式。... 本文介绍了采用90nm工艺制程的微处理器芯片的层次化综合与物理设计。在层次化综合阶段,使用二次迭代的方法生成网表文件,较一次迭代获得了更精准的时序结果。在物理设计方面,利用Top-Down的层次化设计结构,合并FRAM-ETM模型调用方式。此外,选择多例化模式对多个重复子模块进行相同的物理设计,并对子模块的引脚采取直角向心式处理。在顶层模块后布线阶段,执行透明接口优化,辅助实现时序收敛。 展开更多
关键词 微处理器芯片 二次迭代 TOP-DOWN FRAM-ETM 多例化模式 透明接口优化
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部