期刊文献+
共找到761篇文章
< 1 2 39 >
每页显示 20 50 100
Using Tensilica Xtensa configures a dual-core processor based-on SoC
1
作者 TU Jih -Fu WU Chang-Jo 《通讯和计算机(中英文版)》 2009年第2期1-10,共10页
关键词 多核心处理器 数字信号 计算机技术 虚拟内存
下载PDF
Multiple MIPS 4Kc cores based interrupt controller design and its implementation on HDTV SoC platform 被引量:2
2
作者 陈颖琪 Lin Guixu Wang Feng Hu Jianling Tan Zhiming 《High Technology Letters》 EI CAS 2007年第3期297-301,共5页
A multiple MIPS 4Kc processor cores based interrupt processing system is introduced. The interrupt controller plays a key role in the high definition television (HDTV) system-on-a-chip (SoC) platform, especially w... A multiple MIPS 4Kc processor cores based interrupt processing system is introduced. The interrupt controller plays a key role in the high definition television (HDTV) system-on-a-chip (SoC) platform, especially when it is a multiple processor system. Based on a general introduction to the whole HDTV SoC platform, a layered interrupt controller and its implementation are discussed in detail. The proposed scheme was implemented in our FPGA verification board. The results indicate that our scheme is reliable and efficient. Meanwhile, as a functional intellectual property (IP), the interrupt controller has reusability and expandability with the layered structure. 展开更多
关键词 HDTV SoC interrupt controller MIPS processor core
下载PDF
高并行性能Intel Core i7多核处理器及其关键技术研究
3
作者 王文义 王杰 《中原工学院学报》 CAS 2011年第5期23-26,共4页
介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速... 介绍了Intel Nehalem多核处理器微架构的组成及其独特的三级缓存模式,同时针对并行计算机对处理器在计算性能(Gflops)和能耗比(Mflop/W)两方面的特殊要求,介绍了Nehalem Core i7处理器所采用的一些关键技术,如超线程,QPI总线,内核加速模式和SSE4.2指令集等,这些技术对高效使用并行计算机是非常必要的. 展开更多
关键词 Nehalem微架构 多核多线程处理器 超线程技术 QPI总线
下载PDF
基于Core i7处理器的高性能计算机主模块设计 被引量:2
4
作者 黄斌 《计算机测量与控制》 CSCD 北大核心 2012年第10期2763-2765,共3页
为了提高基于Compact PCI的抗恶劣环境计算机的处理能力,提出了一种基于Intel Core i7低功耗双核处理器的Compact PCI计算模块的设计方法;该方法中包括了基于Intel Core i7低功耗双核处理器的计算模块的主要设计思路和实现过程;该方法... 为了提高基于Compact PCI的抗恶劣环境计算机的处理能力,提出了一种基于Intel Core i7低功耗双核处理器的Compact PCI计算模块的设计方法;该方法中包括了基于Intel Core i7低功耗双核处理器的计算模块的主要设计思路和实现过程;该方法通过采用In-tel Core i7 620LE处理器提高了计算机性能,采用热设计保证了被动散热的效果;该计算机主模块已经投入应用,在应用过程中取得了良好的效果。 展开更多
关键词 core I7 处理器 计算机主模块 Compact PCI
下载PDF
基于六代Core i7处理器的加固计算机设计技术研究 被引量:2
5
作者 张平峰 《工业控制计算机》 2019年第4期42-44,共3页
为了更好地适应高性能加固计算机需求发展,提供基于六代Core i7的高性能平台,掌握基于六代Core i7加固计算机系统的设计技术。对计算机主模块的硬件电路设计技术、计算机主模块的软件设计技术、计算机主模块的加固散热设计技术等内容开... 为了更好地适应高性能加固计算机需求发展,提供基于六代Core i7的高性能平台,掌握基于六代Core i7加固计算机系统的设计技术。对计算机主模块的硬件电路设计技术、计算机主模块的软件设计技术、计算机主模块的加固散热设计技术等内容开展了研究,特别是基于六代Core i7处理器的电源设计技术、基于六代Core i7处理器的DDR4内存设计、基于CM236芯片组的外围接口电路设计技术等关键技术作了深入阐述。最终实现了基于六代Core i7处理器的加固计算机的研制,形成高性能加固计算机设计开发的技术基础,为其更好的发展作好技术铺垫。 展开更多
关键词 六代corei7 高性能 IPMI
下载PDF
用于单片机实验教学的红外激光气体检测仪 被引量:1
6
作者 郑传涛 华莹 +3 位作者 刘洋 刘大勇 宋芳 张宇 《实验室研究与探索》 CAS 北大核心 2024年第1期50-55,共6页
为了实现科研反哺教学、促进教学与科研的深度融合,研制了一种基于嵌入式多核处理器和数字信号处理器的实验教学用红外激光气体检测仪。该检测仪包括光学系统和电学系统,其中电学系统包含光谱信息感知模块和嵌入式控制模块。利用研制的... 为了实现科研反哺教学、促进教学与科研的深度融合,研制了一种基于嵌入式多核处理器和数字信号处理器的实验教学用红外激光气体检测仪。该检测仪包括光学系统和电学系统,其中电学系统包含光谱信息感知模块和嵌入式控制模块。利用研制的检测仪开展了氨制冷冷库现场的泄漏氨气浓度的检测应用。结果表明,与传统气体检测仪相比,该检测仪实现了检测仪的网络化与智能化,而且性能满足实验教学要求。 展开更多
关键词 红外吸收光谱 气体检测 多核处理器 数字信号处理器 微型处理器
下载PDF
Optimized Processor for Sensor Networks Applications
7
作者 Ali Elkateeb 《通讯和计算机(中英文版)》 2012年第3期311-316,共6页
关键词 嵌入式处理器 传感器节点 网络应用 优化 节点设计 软核处理器 可重构系统 核心处理器
下载PDF
MVSim:面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器
8
作者 刘仲 李程 +3 位作者 田希 刘胜 邓让钰 钱程东 《计算机工程与科学》 CSCD 北大核心 2024年第2期191-199,共9页
设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟... 设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟,采用多线程技术实现了多核处理器的高效和可扩展模拟。实验结果表明,MVSim能够准确模拟多核处理器的目标程序执行,模拟结果完全正确,具有良好的可扩展性。MVSim的平均模拟速度分别是RTL模拟和CCS的227倍和5倍,平均性能误差约为2.9%。 展开更多
关键词 体系结构模拟器 VLIW 多核向量处理器模型 性能模型 节拍精准模拟器
下载PDF
基于TDA4VM的疲劳状态实时检测系统设计
9
作者 付丽 滕召波 +2 位作者 张一帆 罗钧 王浩程 《实验室研究与探索》 CAS 北大核心 2024年第11期26-30,38,共6页
针对传统嵌入式平台疲劳状态检测系统识别精度低和实时性差的问题,设计了一种基于TDA4VM异构多核处理器的疲劳状态实时检测系统。TDA4VM嵌入式处理器通过摄像头获取图像并进行目标检测,STM32微控制器控制外设模块,包括GPS模块、GSM模块... 针对传统嵌入式平台疲劳状态检测系统识别精度低和实时性差的问题,设计了一种基于TDA4VM异构多核处理器的疲劳状态实时检测系统。TDA4VM嵌入式处理器通过摄像头获取图像并进行目标检测,STM32微控制器控制外设模块,包括GPS模块、GSM模块和语音模块。在目标检测算法方面,先在YOLOX目标检测算法中引入注意力机制模块CBAM(Convolutional Block Attention Module),再对激活函数进行改进,并优化小滑窗替换算法。将训练后的YOLOX模型部署在硬件平台上,实际车载实验结果表明,在不同环境下疲劳状态检测精度可达到95.3%,同时还实现了30帧/s的实时检测。该检测系统具备精度高、实时性强和教学简易等特点,在实验教学和工程应用方面具有一定的参考价值。 展开更多
关键词 疲劳检测 深度学习 异构多核 处理器 YOLOX算法
下载PDF
多核处理器公平共享并行总线的方法
10
作者 邵龙 《现代电子技术》 北大核心 2024年第3期25-28,共4页
针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每... 针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每核分配一个总线操作缓冲队列保障了同一核的总线操作先到先服务,而且通过单个读写操作周期的公平队列算法保障了每核总线操作的实时性。工程实践表明,该方法是一种多核处理器公平共享并行总线的有效方法。 展开更多
关键词 综合化电子系统 多核处理器 共享并行总线 冲突 公平队列算法 缓冲队列
下载PDF
基于疯狂自适应樽海鞘群优化算法的异构多核任务调度
11
作者 程小辉 刘天承 《计算机与数字工程》 2024年第10期2886-2889,2919,共5页
为了解决当前异构多核环境下的任务调度效率不能满足应用程序的多样性要求的问题,论文基于疯狂自适应的樽海鞘群优化算法(Crazy and Adaptive Salp Swarm Algorithm,CASSA),提出一种异构多核处理器任务调度算法。该算法以缩短全部任务... 为了解决当前异构多核环境下的任务调度效率不能满足应用程序的多样性要求的问题,论文基于疯狂自适应的樽海鞘群优化算法(Crazy and Adaptive Salp Swarm Algorithm,CASSA),提出一种异构多核处理器任务调度算法。该算法以缩短全部任务的完成时间为目标,根据任务优先权规则设计任务分配的编码方案,利用CASSA算法中领导者的全局搜索能力和追随者的局部搜索能力,使CASSA算法在异构多核任务调度问题上有更高的收敛效率和更高质量的解。实验表明,CASSA算法的性能优良,最优解的质量高,在异构多核处理器任务调度领域中具有良好的研究意义。 展开更多
关键词 异构多核处理器 任务调度 疯狂自适应的樽海鞘群优化算法
下载PDF
面向车载功能安全的低开销超标量双核锁步处理器架构设计 被引量:1
12
作者 张承译 王明羽 +1 位作者 虞志益 李兆麟 《汽车工程学报》 2024年第2期313-320,共8页
在车载功能安全领域,双核锁步架构是一种被广泛应用于解决处理器故障的冗余架构。为支持细粒度故障处理的超标量处理器提出一种新颖的双核锁步架构,通过以分支跳转指令的形式执行程序回滚,该架构能在故障发生的同一时钟周期内检测和纠... 在车载功能安全领域,双核锁步架构是一种被广泛应用于解决处理器故障的冗余架构。为支持细粒度故障处理的超标量处理器提出一种新颖的双核锁步架构,通过以分支跳转指令的形式执行程序回滚,该架构能在故障发生的同一时钟周期内检测和纠正故障,且不需要额外的专用硬件模块来满足细粒度回滚的需求。还提出一种虚拟写回机制,该机制将特定数据传送到只读寄存器以防止故障衍生,使处理器无需在程序执行期间持续保存现场,从而显著节省了面积开销。试验结果表明,该架构对注入处理器的故障实现了较彻底的故障覆盖,对处理器原型的性能影响很小,与先前双核锁步相关的工作相比,时间和面积开销更小。 展开更多
关键词 双核锁步 处理器 故障处理 程序回滚
下载PDF
国产SW26010-Pro处理器上3级BLAS函数众核并行优化 被引量:1
13
作者 胡怡 陈道琨 +5 位作者 杨超 马文静 刘芳芳 宋超博 孙强 史俊达 《软件学报》 EI CSCD 北大核心 2024年第3期1569-1584,共16页
BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发... BLAS(basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发挥处理器的计算性能有至关重要的作用.针对国产SW26010-Pro处理器研究BLAS 3级函数的众核并行优化技术.具体而言,根据SW26010-Pro的存储层次结构,设计多级分块算法,挖掘矩阵运算的并行性.在此基础上,基于远程内存访问(remote memory access,RMA)机制设计数据共享策略,提高从核间的数据传输效率.进一步地,采用三缓冲、参数调优等方法对算法进行全面优化,隐藏直接内存访问(direct memory access,DMA)访存开销和RMA通信开销.此外,利用SW26010-Pro的两条硬件流水线和若干向量化计算/访存指令,还对BLAS 3级函数的矩阵-矩阵乘法、矩阵方程组求解、矩阵转置操作等若干运算进行手工汇编优化,提高了函数的浮点计算效率.实验结果显示,所提出的并行优化技术在SW26010-Pro处理器上为BLAS 3级函数带来了明显的性能提升,单核组BLAS 3级函数的浮点计算性能最高可达峰值性能的92%,多核组BLAS 3级函数的浮点计算性能最高可达峰值性能的88%. 展开更多
关键词 BLAS 3级 SW26010-Pro众核处理器 直接内存访问 远程内存访问 浮点计算效率
下载PDF
基于交叉开关互连的多核堆栈处理器架构设计
14
作者 刘欢庆 周永录 +1 位作者 刘宏杰 代红兵 《计算机工程与设计》 北大核心 2024年第7期2212-2219,共8页
为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、... 为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、核间数据传输和中断响应操作。在Xilinx FPGA芯片上进行单核、双核和四核堆栈处理器的实现,通过矩阵乘法计算进行性能实验验证,在100 MHz时钟频率的情况下,四核堆栈处理器的最大性能相当于单核堆栈处理器的3.99倍。实验结果表明,基于交叉开关互连的多核堆栈处理器架构可较好发挥多核堆栈处理器中每一个核心的性能。 展开更多
关键词 堆栈处理器 多核处理器 交叉开关 高速缓存 一致性协议 中断控制器 现场可编程门阵列
下载PDF
基于约束规划的航空电子系统任务分配与调度方法
15
作者 曾清华 杨志斌 周勇 《小型微型计算机系统》 CSCD 北大核心 2024年第11期2576-2585,共10页
随着综合模块化航空电子系统(Integrated Modular Avionics,IMA)对计算性能要求的日趋提高,既能提供更强计算能力又能减少电子设备的体积、重量和功耗的多核处理器将在航空电子系统领域得到广泛应用.目前航空电子系统的任务分配和调度... 随着综合模块化航空电子系统(Integrated Modular Avionics,IMA)对计算性能要求的日趋提高,既能提供更强计算能力又能减少电子设备的体积、重量和功耗的多核处理器将在航空电子系统领域得到广泛应用.目前航空电子系统的任务分配和调度主要基于手工方式,较少考虑多核环境下共享资源竞争带来的时间延迟,并且当系统更新时需要重新编排,十分耗时耗力.本文提出一种基于约束规划(Constraint Programming,CP)的航空电子系统任务自动化分配与调度方法.首先,给出了多核环境下任务最坏执行时间(WCET)的分析方法;其次,给出了基于CP的任务分配和调度方法;最后,设计与实现了原型工具CP4IMA,并基于ARINC653操作系统平台进行案例分析,验证了本文所提方法的有效性. 展开更多
关键词 综合模块化航空电子系统 多核处理器 任务分配与调度 约束规划
下载PDF
面向SW26010Pro处理器的全局符号重定位优化
16
作者 钱宏 王飞 +3 位作者 刘沙 郑天宇 宋佳伟 安虹 《计算机系统应用》 2024年第2期62-71,共10页
申威异构众核处理器运算核心访问主存的延迟很大,程序中应尽量避免运算核心代码访问主存的操作.全局偏移表存放程序中全局变量和函数的地址,不适合保存在珍稀的运算核心局部存储空间中,并且其访问模式通常比较离散,因而也不适合对其做Ca... 申威异构众核处理器运算核心访问主存的延迟很大,程序中应尽量避免运算核心代码访问主存的操作.全局偏移表存放程序中全局变量和函数的地址,不适合保存在珍稀的运算核心局部存储空间中,并且其访问模式通常比较离散,因而也不适合对其做Cache预取,访问全局偏移表引入的访问主存操作对程序性能影响较大.本文针对异构众核程序静态链接与动态链接的使用场景,分析链接器relaxation优化的使用限制,通过“gp基地址+扩展偏移”的方法实现避免访问主存操作的全局符号重定位优化.实验结果表明,该重定位优化方法能够以增加少量代码为代价,在运算核心代码调用函数与访问全局变量时有效避免访问全局偏移表引入的访问主存的操作,提高众核程序的运行性能. 展开更多
关键词 众核处理器 全局偏移表 重定位 链接器优化 性能
下载PDF
神威超级计算机运行时故障定位方法
17
作者 高剑刚 郑岩 +6 位作者 于康 彭达佳 李宏亮 刘勇 何王全 陈德训 王飞 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期86-97,共12页
随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障... 随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障与异常、软件程序的错误等都会导致用户大规模并行应用的错误、挂死与退出.如何快速准确定位错误现场,让管理员或用户以此为基础查看异常发生的故障进行高精度、高效率的诊断,是维护高性能计算系统可靠性的重要基础.高性能计算机传统的故障定位主要通过硬件异常跟踪、系统日志分析和程序主动探测等方法,缺乏对无日志信息、无明显故障现象的程序挂死问题的定位手段,并且技术的扩展性也面临挑战.针对“新一代神威超级计算机”体系结构和SW26010-Pro众核处理器特点,提出一种运行时故障定位方法,包括基于消息传递的故障关联分析、基于全局聚合信息的在线综合分析诊断、面向申威众核处理器的异常线程过滤方法等关键技术,阐述了如何有效检测、收集、处理大量系统资源和并行进程的异常信息问题,为应对未来超大规模高性能计算中故障高效定位难题提供有效支撑. 展开更多
关键词 E级计算机 可靠性 错误定位 运行时 众核处理器
下载PDF
多核堆栈处理器研究与设计
18
作者 刘自昂 周永录 +1 位作者 代红兵 刘宏杰 《计算机工程与设计》 北大核心 2024年第4期1256-1263,共8页
为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以... 为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以该单核模型为内核,引入共享总线和十字开关互联方式的Wishbone总线、多端口存储器和面向多任务Forth系统的指令集,建立一种多核堆栈处理器模型L32-MC。利用该多核模型,在FPGA上实现4核和8核的L32-MC原型多核堆栈处理器。实验结果表明,4核和8核的L32-MC原型堆栈处理器满足高性能低功耗的多核处理器设计目标。 展开更多
关键词 多核堆栈处理器 Forth技术 Wishbone片上总线 多端口存储器 指令集 现场可编程门阵列 嵌入式
下载PDF
面向申威众核处理器的规则处理优化技术
19
作者 张振东 王彤 刘鹏 《计算机研究与发展》 EI CSCD 北大核心 2024年第1期66-85,共20页
高性能口令恢复系统是申威众核处理器的重要应用场景之一,规则处理是主流口令恢复工具中被广泛应用的一种口令生成方式.现有相关研究工作缺少对规则处理算法的优化,导致申威处理器上基于规则的口令生成速度成为口令恢复系统的性能瓶颈.... 高性能口令恢复系统是申威众核处理器的重要应用场景之一,规则处理是主流口令恢复工具中被广泛应用的一种口令生成方式.现有相关研究工作缺少对规则处理算法的优化,导致申威处理器上基于规则的口令生成速度成为口令恢复系统的性能瓶颈.通过分析规则处理算法的多层次可并行性,提出了面向申威众核处理器的线程级、数据级优化方案.在线程级优化方案中,探索了规则处理算法的最优任务映射方式,设计了主从核任务分配机制、从核缓冲区配比优化机制、负载均衡机制、变长规则存储机制等技术以提高并行效率;在数据级优化方案中,分析了规则处理算法中规则函数的计算模式,并通过申威SIMD指令集对规则函数进行向量优化以提高执行效率.在SW26010处理器上的实验结果表明,上述优化方案有效解除了规则处理的性能瓶颈,使规则模式下的口令恢复速度提升了30~101倍. 展开更多
关键词 申威众核处理器 口令恢复 规则处理 异构计算 单指令多数据流
下载PDF
一种空间多核操作系统容错调度算法
20
作者 王宇思 杨桦 徐建 《微电子学与计算机》 2024年第5期49-56,共8页
目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法... 目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法仅考虑任务分配问题,没有考虑到系统中某一核心出现故障时如何进行容错。FT-RTA算法是一种空间多核操作系统容错调度算法,当一个核心上出现瞬时故障,将故障核心上在故障时间段内的所有任务迁移至正常核心上执行,使计算机系统不会感知到此次核心故障,成功屏蔽故障。经过实际应用中的典型参数验证,算法可以成功屏蔽核心故障,进行系统无感知的容错。 展开更多
关键词 空间操作系统 多核处理器 容错调度算法 混合任务模型
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部