期刊文献+
共找到452篇文章
< 1 2 23 >
每页显示 20 50 100
Multi-core optimization for conjugate gradient benchmark on heterogeneous processors
1
作者 邓林 窦勇 《Journal of Central South University》 SCIE EI CAS 2011年第2期490-498,共9页
Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at t... Developing parallel applications on heterogeneous processors is facing the challenges of 'memory wall',due to limited capacity of local storage,limited bandwidth and long latency for memory access. Aiming at this problem,a parallelization approach was proposed with six memory optimization schemes for CG,four schemes of them aiming at all kinds of sparse matrix-vector multiplication (SPMV) operation. Conducted on IBM QS20,the parallelization approach can reach up to 21 and 133 times speedups with size A and B,respectively,compared with single power processor element. Finally,the conclusion is drawn that the peak bandwidth of memory access on Cell BE can be obtained in SPMV,simple computation is more efficient on heterogeneous processors and loop-unrolling can hide local storage access latency while executing scalar operation on SIMD cores. 展开更多
关键词 异构处理器 优化方案 共轭梯度 基准 多核 应用程序开发 内存访问 并行化
下载PDF
适用于S-NUCA异构处理器的任务调度与热管理系统
2
作者 周义涛 李阳 +3 位作者 韩超 赵玉来 汪玲 李建华 《计算机工程》 CAS CSCD 北大核心 2024年第2期196-205,共10页
异构多核处理器凭借其高性能、低功耗和广泛的应用场景而成为当前计算机平台的主流方案,且大容量的非均匀缓存架构(S-NUCA)具有较低的平均访问时间。然而,不断上升的晶体管规模给异构多核处理器的资源调度和功耗控制带来挑战,传统的调... 异构多核处理器凭借其高性能、低功耗和广泛的应用场景而成为当前计算机平台的主流方案,且大容量的非均匀缓存架构(S-NUCA)具有较低的平均访问时间。然而,不断上升的晶体管规模给异构多核处理器的资源调度和功耗控制带来挑战,传统的调度算法在面对基于S-NUCA的多核处理器时忽略了核心之间的缓存访问延迟,且传统热管理方案只提供芯片级功率约束,容易使得系统因核心使用率降低而造成性能下降。为此,提出一种适用于S-NUCA异构多核系统、满足热安全约束的动态线程调度机制TSCDM。利用基于动态每周期指令(IPC)值的阶段检测技术,并基于人工神经网络预测线程的IPC值,以获取线程与核心类型的最佳绑定关系,依据S-NUCA缓存特性获得最优映射和基于任务分类的任务迁移策略。在此基础上,TSCDM基于片上热模型为每个核心实时分配功率预算。在HotSniper上运行SPLASH-2性能测试套件进行实验,结果表明,相较于传统调度方案与基于机器学习的调度方案,TSCDM在加速比和资源利用率上均表现出优势,TSCDM中使用的基于瞬态温度的安全功率算法相比传统热安全功率算法能够降低核心热余量,同时处理器的全频段均有更高的能效比。 展开更多
关键词 异构多核处理器 人工神经网络 线程调度 阶段检测 热安全功率
下载PDF
基于GSLF-SSA的异构多核处理器任务调度
3
作者 刘齐坚 王韦刚 高鹏程 《计算机技术与发展》 2024年第7期48-54,共7页
为了提高异构多核处理器平台的计算性能,从任务调度的角度出发,提出了一种使用黄金正弦和莱维飞行机制改进的麻雀搜索算法(Fusion of Golden Sinusoidal and Levy Flight in Sparrow Search Algorithm,GSLF-SSA)来优化异构多核处理器的... 为了提高异构多核处理器平台的计算性能,从任务调度的角度出发,提出了一种使用黄金正弦和莱维飞行机制改进的麻雀搜索算法(Fusion of Golden Sinusoidal and Levy Flight in Sparrow Search Algorithm,GSLF-SSA)来优化异构多核处理器的任务调度。通过对异构任务调度的分析,将异构任务建模为DAG(Directed Acyclic Graph)任务模型,通过对其优先级进行随机编码分配,实现了GSLF-SSA算法求解域从连续到离散的映射,使该算法更能适用于异构多核任务调度之中。将DAG任务的最优调度长度作为算法的适应度值进行迭代寻优,通过与目前应用广泛的麻雀搜索算法(SSA)、混合式任务调度算法(IHSSA)、人工蜂群算法(ABC)等多种启发式算法在异构任务调度环境下的实验对比表明,GSLF-SSA能获得更优的调度长度与更短的调度执行时间。 展开更多
关键词 异构多核处理器 麻雀搜索算法 有向无环图 任务调度 黄金正弦 莱维飞行
下载PDF
Using Tensilica Xtensa configures a dual-core processor based-on SoC
4
作者 TU Jih -Fu WU Chang-Jo 《通讯和计算机(中英文版)》 2009年第2期1-10,共10页
关键词 多核心处理器 数字信号 计算机技术 虚拟内存
下载PDF
基于OpenMP的Multi-Critical分子动力学并行算法优化 被引量:4
5
作者 段振华 白明泽 豆育升 《计算机应用研究》 CSCD 北大核心 2012年第7期2432-2434,共3页
为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并... 为提高分子动力学模拟在多核共享内存式服务器上的运算速度,在现有的分子动力学并行算法基础上提出了Multi-Critical算法。该算法使用手动划分力矩阵的方法,使多个线程进入不同名的临界区,并使用分块叠加的方法优化了并行算法,提高了并行效率。实验结果表明,对比之前的Critical算法,该算法的加速比和并行效率均有较大幅度的提高。 展开更多
关键词 分子动力学 并行计算 多核处理器 开放式多处理 临界区
下载PDF
用于单片机实验教学的红外激光气体检测仪
6
作者 郑传涛 华莹 +3 位作者 刘洋 刘大勇 宋芳 张宇 《实验室研究与探索》 CAS 北大核心 2024年第1期50-55,共6页
为了实现科研反哺教学、促进教学与科研的深度融合,研制了一种基于嵌入式多核处理器和数字信号处理器的实验教学用红外激光气体检测仪。该检测仪包括光学系统和电学系统,其中电学系统包含光谱信息感知模块和嵌入式控制模块。利用研制的... 为了实现科研反哺教学、促进教学与科研的深度融合,研制了一种基于嵌入式多核处理器和数字信号处理器的实验教学用红外激光气体检测仪。该检测仪包括光学系统和电学系统,其中电学系统包含光谱信息感知模块和嵌入式控制模块。利用研制的检测仪开展了氨制冷冷库现场的泄漏氨气浓度的检测应用。结果表明,与传统气体检测仪相比,该检测仪实现了检测仪的网络化与智能化,而且性能满足实验教学要求。 展开更多
关键词 红外吸收光谱 气体检测 多核处理器 数字信号处理器 微型处理器
下载PDF
MVSim:面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器
7
作者 刘仲 李程 +3 位作者 田希 刘胜 邓让钰 钱程东 《计算机工程与科学》 CSCD 北大核心 2024年第2期191-199,共9页
设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟... 设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型;实现了指令集架构的节拍精准模拟,Cache、DMA和多核同步部件的高效功能模拟,采用多线程技术实现了多核处理器的高效和可扩展模拟。实验结果表明,MVSim能够准确模拟多核处理器的目标程序执行,模拟结果完全正确,具有良好的可扩展性。MVSim的平均模拟速度分别是RTL模拟和CCS的227倍和5倍,平均性能误差约为2.9%。 展开更多
关键词 体系结构模拟器 VLIW 多核向量处理器模型 性能模型 节拍精准模拟器
下载PDF
多核处理器公平共享并行总线的方法
8
作者 邵龙 《现代电子技术》 北大核心 2024年第3期25-28,共4页
针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每... 针对综合化电子系统中多个功能运行于同一多核处理器的不同核同时访问同一并行总线的冲突避免以及实时性问题,提出一种基于最小访问颗粒度的多核处理器公平共享并行总线的方法,并详细介绍了该方法的设计实现及验证。该方法不仅通过为每核分配一个总线操作缓冲队列保障了同一核的总线操作先到先服务,而且通过单个读写操作周期的公平队列算法保障了每核总线操作的实时性。工程实践表明,该方法是一种多核处理器公平共享并行总线的有效方法。 展开更多
关键词 综合化电子系统 多核处理器 共享并行总线 冲突 公平队列算法 缓冲队列
下载PDF
基于交叉开关互连的多核堆栈处理器架构设计
9
作者 刘欢庆 周永录 +1 位作者 刘宏杰 代红兵 《计算机工程与设计》 北大核心 2024年第7期2212-2219,共8页
为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、... 为满足堆栈处理器对于并行化程序应用的需求,提出一种多核堆栈处理器架构。在单核堆栈处理器的基础上,以交叉开关作为核间互连结构,通过对指令集、高速缓存器、一致性协议以及中断机制的设计,可在一个时钟周期内完成取指、译码、执行、核间数据传输和中断响应操作。在Xilinx FPGA芯片上进行单核、双核和四核堆栈处理器的实现,通过矩阵乘法计算进行性能实验验证,在100 MHz时钟频率的情况下,四核堆栈处理器的最大性能相当于单核堆栈处理器的3.99倍。实验结果表明,基于交叉开关互连的多核堆栈处理器架构可较好发挥多核堆栈处理器中每一个核心的性能。 展开更多
关键词 堆栈处理器 多核处理器 交叉开关 高速缓存 一致性协议 中断控制器 现场可编程门阵列
下载PDF
多核堆栈处理器研究与设计
10
作者 刘自昂 周永录 +1 位作者 代红兵 刘宏杰 《计算机工程与设计》 北大核心 2024年第4期1256-1263,共8页
为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以... 为满足日趋复杂的嵌入式环境对堆栈处理器和Forth技术的应用需求,在单核堆栈处理器模型研究的基础上,设计一种多核堆栈处理器模型。基于J1单核堆栈处理器模型,针对多核目标,增加计时器、中断等功能,形成新的L32单核堆栈处理器模型,并以该单核模型为内核,引入共享总线和十字开关互联方式的Wishbone总线、多端口存储器和面向多任务Forth系统的指令集,建立一种多核堆栈处理器模型L32-MC。利用该多核模型,在FPGA上实现4核和8核的L32-MC原型多核堆栈处理器。实验结果表明,4核和8核的L32-MC原型堆栈处理器满足高性能低功耗的多核处理器设计目标。 展开更多
关键词 多核堆栈处理器 Forth技术 Wishbone片上总线 多端口存储器 指令集 现场可编程门阵列 嵌入式
下载PDF
基于龙芯CPU的多核全系统模拟器SimOS-Goodson 被引量:15
11
作者 高翔 张福新 +3 位作者 汤彦 章隆兵 胡伟武 唐志敏 《软件学报》 EI CSCD 北大核心 2007年第4期1047-1055,共9页
随着片上多核结构成为当前高性能微处理器发展的趋势,目标工作负载也变得多样化,传统的用户级模拟器已不能适应未来体系结构的研究需要.基于SimOS全系统模拟环境,设计并实现了龙芯CPU的片上多核全系统模拟器SimOS-Goodson.在SimOS-Good... 随着片上多核结构成为当前高性能微处理器发展的趋势,目标工作负载也变得多样化,传统的用户级模拟器已不能适应未来体系结构的研究需要.基于SimOS全系统模拟环境,设计并实现了龙芯CPU的片上多核全系统模拟器SimOS-Goodson.在SimOS-Goodson的设计中运用了时序与功能分离的组织形式,并采用了一种新的值预测校验算法来解决模拟环境中的存储一致性问题.经过与真实硬件环境进行交叉校正,保证了模拟器的可信度与准确度.与用户级模拟器相比,SimOS-Goodson保持了高速、灵活的优点,又具备精确、全系统和易使用的特征.通过对完整Linux操作系统的移植,可在SimOS-Goodson所模拟的全系统环境中进行各类微体系结构和应用负载的分析与评估.在3.0GHz的Pentium4微机上,SimOS-Goodson的指令模拟速度超过300K/秒.SimOS-Goodson将会在基于龙芯CPU的片上多核体系结构研究中发挥重要作用. 展开更多
关键词 模拟器 龙芯2号处理器 全系统 多核 SimOS
下载PDF
一种面向多核处理器的高效并行PCA-SIFT算法 被引量:7
12
作者 刘仲 邢彬朝 陈跃跃 《国防科技大学学报》 EI CAS CSCD 北大核心 2012年第4期103-107,共5页
提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性。实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良... 提出一种面向多核处理器的并行PCA-SIFT算法,采用数据级并行方法实现并行的特征提取和特征点匹配,将计算任务分配到各个DSP核并行处理,充分开发多核处理器的多级并行性。实验结果表明,并行PCA-SIFT算法对各种不同图像形变的图像具有良好的适应性,具有接近串行PCA-SIFT算法的图像匹配能力,平均加速比达3.12。 展开更多
关键词 并行 PCA-SIFT 图像匹配 多核处理器
下载PDF
多核处理器YHFT-QDSP的调试系统 被引量:4
13
作者 扈啸 李杰 +1 位作者 陈莉丽 陈书明 《计算机工程与科学》 CSCD 2008年第9期116-118,136,共4页
YHFT-QDSP是一款多核处理器。为满足其并发调试和实时调试的需要,在原有单核调试系统的基础上设计实现了多核同步调试系统和片上实时追踪系统(片上Trace)。多核同步调试提供了命令广播和断点同步触发等并发程序协同调试的功能;片上Trac... YHFT-QDSP是一款多核处理器。为满足其并发调试和实时调试的需要,在原有单核调试系统的基础上设计实现了多核同步调试系统和片上实时追踪系统(片上Trace)。多核同步调试提供了命令广播和断点同步触发等并发程序协同调试的功能;片上Trace通过专用硬件记录程序执行路径和数据读写等信息实现非入侵实时调试。本文从原理、结构和软硬件实现等方面介绍了该调试系统。 展开更多
关键词 多核调试 实时调试 片上追踪 多核处理器
下载PDF
一种空间多核操作系统容错调度算法
14
作者 王宇思 杨桦 徐建 《微电子学与计算机》 2024年第5期49-56,共8页
目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法... 目前计算机系统逐步采用多核处理器来提升性能,空间操作系统如何管理多核资源是发挥处理器性能的关键。在航天等安全关键领域中,采用固定点任务与定期任务混合调度,在保证可靠性的前提下提高效率。现有针对混合任务模型的多核调度算法仅考虑任务分配问题,没有考虑到系统中某一核心出现故障时如何进行容错。FT-RTA算法是一种空间多核操作系统容错调度算法,当一个核心上出现瞬时故障,将故障核心上在故障时间段内的所有任务迁移至正常核心上执行,使计算机系统不会感知到此次核心故障,成功屏蔽故障。经过实际应用中的典型参数验证,算法可以成功屏蔽核心故障,进行系统无感知的容错。 展开更多
关键词 空间操作系统 多核处理器 容错调度算法 混合任务模型
下载PDF
基于多核DSP的星载双基FMCW SAR成像算法实现
15
作者 陈洋 肖国尧 +3 位作者 全英汇 任爱锋 别博文 邢孟道 《系统工程与电子技术》 EI CSCD 北大核心 2024年第1期121-129,共9页
调频连续波(frequency modulated continuous wave,FMCW)合成孔径雷达(synthetic aperture radar,SAR)降低了传感器的峰值传输功率,使系统的重量和成本最小化,被广泛应用于机载平台。将双基地构型与FMCW技术相结合,应用于星载平台,即构... 调频连续波(frequency modulated continuous wave,FMCW)合成孔径雷达(synthetic aperture radar,SAR)降低了传感器的峰值传输功率,使系统的重量和成本最小化,被广泛应用于机载平台。将双基地构型与FMCW技术相结合,应用于星载平台,即构成星载双基地FMCW SAR。本文对距离多普勒(range-Doppler,RD)算法进行改进,建立起一种高性能的适宜星载双基地平台的FMCW SAR成像频域算法,这种算法的处理精度明显提高,成像效果更好。基于多核数字信号处理器(digital signal processor,DSP)构建适用于星载双基SAR成像算法的并行处理架构,完成软硬件设计实现。验证了所提软件架构可以满足实时成像需求,以及算法工程化实现的可行性。 展开更多
关键词 调频连续波合成孔径雷达成像算法 星载双基 多核数字信号处理器 实时处理
下载PDF
一种多核处理器中混合关键级任务半分区调度算法
16
作者 李俊何 杨康 张凤登 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1264-1271,共8页
目前用于混合关键级系统的任务调度算法存在资源分配不合理、中低关键级任务的运行受限等情况,造成系统整体服务质量被降低.本文提出了有效改进系统服务质量的半分区调度算法,该调度算法将用于多核处理器的空闲资源回收计算,能够在触发... 目前用于混合关键级系统的任务调度算法存在资源分配不合理、中低关键级任务的运行受限等情况,造成系统整体服务质量被降低.本文提出了有效改进系统服务质量的半分区调度算法,该调度算法将用于多核处理器的空闲资源回收计算,能够在触发了高关键级模式的情况下,为被抛弃的低关键级任务分配空闲时间片.此外,该算法还可以利用系统中的空闲时间片推迟系统关键等级的提升,并提出系统关键等级平稳回落策略,两者可以确保系统关键等级不会过于频繁变化.最后,通过算法仿真和实验证明了本文所提方法在混合关键级任务调度问题上的有效性和优越性. 展开更多
关键词 混合关键级系统 动态需求边界函数 半分区划分算法 多核处理器 任务调度
下载PDF
模块化多电平换流器阀控装置录波功能研究
17
作者 周谷庆 仲浩 +1 位作者 赵玉灿 赵天恩 《电气技术》 2024年第1期79-84,共6页
模块化多电平换流器阀控装置的录波功能对观察子模块运行状态和分析子模块故障暂态过程具有重要作用,阀控装置集成内部录波功能有较大研究意义。针对阀控装置需接入海量子模块的工程应用需求,本文提出一种基于多核处理器和现场可编程门... 模块化多电平换流器阀控装置的录波功能对观察子模块运行状态和分析子模块故障暂态过程具有重要作用,阀控装置集成内部录波功能有较大研究意义。针对阀控装置需接入海量子模块的工程应用需求,本文提出一种基于多核处理器和现场可编程门阵列(FPGA)硬件架构的阀控装置内部录波方案,介绍阀控装置录波功能相关的硬件架构、软件架构和测试方法。本文采用模块化分层解耦设计方法,通过底层系统软件、图形化工具软件和上层应用软件共同实现装置录波功能。利用柔性直流仿真控制系统对阀控装置录波功能进行测试,结果表明该功能可以满足工程现场应用需求。 展开更多
关键词 模块化多电平换流器(MMC) 阀控装置 录波功能 多核处理器
下载PDF
嵌入式多核系统中的实时混合任务调度算法
18
作者 罗广 冒航 +1 位作者 朱扬烁 张凤登 《电子科技》 2024年第8期84-91,102,共9页
针对由周期任务和零星任务形成的实时混合任务集进行合理调度问题,文中提出了一种基于零松弛度边界公平(Boundary Fair until Zero Laxity,BFZL)的实时混合任务算法。该算法在改进边界公平(Improved Boundary Fair,I-BF)实时混合任务算... 针对由周期任务和零星任务形成的实时混合任务集进行合理调度问题,文中提出了一种基于零松弛度边界公平(Boundary Fair until Zero Laxity,BFZL)的实时混合任务算法。该算法在改进边界公平(Improved Boundary Fair,I-BF)实时混合任务算法基础上,通过引入最小松弛度优先(Least Laxity First,LLF)算法中的松弛度参数来改进判定任务的优先级,并提出基于松弛度与启发式策略相结合的启发式算法改进任务的分配策略。实验结果表明,BFZL算法能够满足系统实时性,并达到了算法优化目的。通过数据对比分析可知,该算法相比于原始算法,零星任务的平均响应时间降低了约26%,上下文切换减少了约28%,迁移减少了约50%。该算法在调度开销方面也具有一定优势。 展开更多
关键词 嵌入式系统 多核处理器 实时调度 混合任务 公平调度 公平性 划分 优先级
下载PDF
基三分层互连网络和2-D Mesh的比较 被引量:1
19
作者 乔保军 石峰 计卫星 《计算机科学》 CSCD 北大核心 2007年第9期253-255,共3页
多核处理器(multi-core processor)成为高性能处理器体系结构的研究发展方向,棱间的连接方式时多核处理器性能的发挥起着重要作用。从降低节点度、减少网络链路数和缩短网络直径的角度出发,提出了一种用于片上核间互连的新型分层互连网... 多核处理器(multi-core processor)成为高性能处理器体系结构的研究发展方向,棱间的连接方式时多核处理器性能的发挥起着重要作用。从降低节点度、减少网络链路数和缩短网络直径的角度出发,提出了一种用于片上核间互连的新型分层互连网络——基三分层互连网络(THIN),该网络拓扑简单,节点度数低,网络链路数相对较少,并具有明显的层次性和对称性以及良好的扩展性。深入比较了THIN和2-D Mesh的静态度量和无阻塞延迟,比较结果表明:在网络规模较小时,THIN比2-D Mesh更宜于用来构建片上核间的通信网络。 展开更多
关键词 多核处理器 片上互连网络 2-D MESH 网络拓扑
下载PDF
基于YHFT-QDSP的并行图像匹配算法 被引量:1
20
作者 刘仲 邢彬朝 扈啸 《计算机工程与科学》 CSCD 北大核心 2012年第4期47-51,共5页
提出一种基于YHFT-QDSP的并行图像匹配算法,采用数据级并行方法实现并行的特征提取和特征点匹配,充分开发了多核处理器的多级并行性。实现和评测了SIFT、SURF、PCA-SIFT的并行算法。实验结果表明,并行图像匹配算法对各种不同图像形变具... 提出一种基于YHFT-QDSP的并行图像匹配算法,采用数据级并行方法实现并行的特征提取和特征点匹配,充分开发了多核处理器的多级并行性。实现和评测了SIFT、SURF、PCA-SIFT的并行算法。实验结果表明,并行图像匹配算法对各种不同图像形变具有良好的适应性,具有接近串行算法的图像匹配能力,平均加速比达3.2。 展开更多
关键词 并行 SIFT 图像匹配 多核处理器
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部