期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
基于便笺式存储器的向量化SpMV算法的性能评估与分析
1
作者 张宗茂 董德尊 +3 位作者 王子聪 常俊胜 张晓云 王绍聪 《计算机工程与科学》 CSCD 北大核心 2024年第9期1521-1528,共8页
便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算... 便笺式存储器是一种结构简单、访问延迟固定且软件可直接控制的片上高速存储,在现代处理器设计中得到了广泛应用。稀疏矩阵向量乘SpMV是高性能计算、人工智能等应用领域重要的内核计算函数之一。在传统多级Cache处理器中,SpMV算法计算过程中对稠密输入向量的不规则访问操作会导致大量Cache访问请求失效,从而影响SpMV算法执行效率。为了评估便笺式存储器对SpMV向量算法的性能影响,使用ARM SVE指令对基于CSR格式的SpMV算法向量化,并将算法中的热点数据即稠密输入向量存储在便笺式存储器中,在集成了便笺式存储器的ARM架构处理器中对SpMV向量算法进行了性能分析。在gem5模拟器中针对来自真实应用程序的2562个稀疏矩阵进行了实验。实验结果表明,集成了便笺式存储器的处理器与传统多级Cache处理器相比,针对向量化SpMV算法能够实现的最大加速比为7.45,平均加速比为1.11。 展开更多
关键词 稀疏矩阵向量乘 便笺式存储器 CSR ARM SVE
下载PDF
基于SPM-LSTM算法的乒乓球空间轨迹预测研究 被引量:3
2
作者 陈鹏展 曾荣飞 卢伟清 《传感器与微系统》 CSCD 北大核心 2023年第2期59-63,共5页
针对乒乓球空间运动轨迹问题,提出了一种新的乒乓球运动轨迹预测方法。对于轨迹预测中的轨迹点跟踪问题,设计了一种基于深度学习的多目视觉轨迹提取系统,实现乒乓球精准轨迹跟踪。在轨迹提取的基础上,提出了一种结合简单物理运动(SPM)... 针对乒乓球空间运动轨迹问题,提出了一种新的乒乓球运动轨迹预测方法。对于轨迹预测中的轨迹点跟踪问题,设计了一种基于深度学习的多目视觉轨迹提取系统,实现乒乓球精准轨迹跟踪。在轨迹提取的基础上,提出了一种结合简单物理运动(SPM)模型和长短期记忆(LSTM)神经网络的轨迹预测模型(SPM-LSTM),利用SPM模型的乒乓球物理约束关系,采用LSTM神经网络迭代训练SPM模型预测值与真实轨迹值之间的偏差数据。实验结果表明:提出的轨迹预测方法能够实现乒乓球轨迹预测。 展开更多
关键词 轨迹提取 轨迹预测 长短期记忆 简单物理运动模型
下载PDF
针对能耗热点的SPM静态分配管理策略 被引量:4
3
作者 胡志刚 石金锋 蒋湘涛 《计算机工程与应用》 CSCD 北大核心 2010年第3期58-61,75,共5页
综合考虑程序的指令块、数据块、全局变量对程序执行能耗的影响,使用带权重扩展控制流图(WECFG)将应用程序划分成各类逻辑节点,通过SPM平均访问能耗值计算出逻辑节点平均能耗,以及各逻辑节点的能耗密度。以能耗热点为依据构造SPM分配的... 综合考虑程序的指令块、数据块、全局变量对程序执行能耗的影响,使用带权重扩展控制流图(WECFG)将应用程序划分成各类逻辑节点,通过SPM平均访问能耗值计算出逻辑节点平均能耗,以及各逻辑节点的能耗密度。以能耗热点为依据构造SPM分配的整数线性规划算法(ILP),转化成以能耗密度为优先权的0-1背包算法。仿真结果表明,使用该分配策略的SPM空间分配,比不使用SPM时的能耗量平均减少34.8%左右。 展开更多
关键词 能耗热点 片上存储器 静态分配策略
下载PDF
便笺式存储器中一种新颖的交错映射数据布局
4
作者 曾灵灵 张敦博 +1 位作者 沈立 窦强 《计算机工程》 CAS CSCD 北大核心 2024年第5期33-40,共8页
现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案... 现代计算机一直沿用传统的线性数据布局模式,该模式允许对使用行主序模式存储的二维矩阵进行高效的行优先数据访问,但是增加了高效执行列优先数据访问的复杂性,造成列优先访问的空间局部性较差。改善列优先数据访存效率的常见解决方案是对原始矩阵进行预先转置操作,将列优先访问的复杂性集中在一次矩阵转置运算中,然而矩阵转置不仅会引入额外的数据传输操作,而且会消耗额外的存储空间用于存储转置后的矩阵。为了在不引入额外开销的情况下使行优先与列优先数据访问具有同样高效的访存效率,提出一种新颖的交错映射(IM)数据布局,同时在不改变便笺式存储器(SPM)内部结构的基础上,在SPM的输入和输出(I/O)接口处添加循环移位单元和译码单元2个新组件,实现交错映射数据布局并定制访存指令,使程序员可通过定制的访存指令充分利用该数据布局。实验结果表明,应用交错映射数据布局的SPM在仅额外增加了1.73%面积开销的情况下获得了1.4倍的加速。 展开更多
关键词 矩阵转置 单指令多数据 便笺式存储器 数据布局 静态随机存储器
下载PDF
基于电路活跃度的SPM低功耗管理策略 被引量:1
5
作者 胡志刚 袁名举 蒋湘涛 《计算机工程》 CAS CSCD 北大核心 2010年第19期250-252,共3页
针对现有的功耗管理未考虑高速暂存存储器(SPM)中不同的地址访问序列对功耗的影响问题,提出一种基于电路活跃度的SPM低功耗管理策略。通过重新组织指令与数据在SPM中的布局,降低SPM中存储对象访问时的电路活跃度,从而降低功耗。实验结... 针对现有的功耗管理未考虑高速暂存存储器(SPM)中不同的地址访问序列对功耗的影响问题,提出一种基于电路活跃度的SPM低功耗管理策略。通过重新组织指令与数据在SPM中的布局,降低SPM中存储对象访问时的电路活跃度,从而降低功耗。实验结果表明,与不考虑电路活跃度的基本策略相比,该分配策略可平均减少功耗15%以上。 展开更多
关键词 电路活跃度 编译优化 功耗 高速暂存存储器
下载PDF
基于SPM的多核SoC访存结构设计与优化
6
作者 刘磊 严明 李思昆 《计算机工程》 CAS CSCD 北大核心 2009年第18期234-236,共3页
针对"一个RISC主处理器核+几个专用协处理器核"结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通过增加组传输和流水传输模式,对该结构进行优化。实验结果表明,该访存结构设计及优化方案的数... 针对"一个RISC主处理器核+几个专用协处理器核"结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通过增加组传输和流水传输模式,对该结构进行优化。实验结果表明,该访存结构设计及优化方案的数据传输效率高、实现开销小,并且对同类SoC系统,该设计具有良好的适用性。 展开更多
关键词 便签式存储器 多核SoC 访存
下载PDF
用于低功耗编译的SPM部件功耗模型研究
7
作者 蒋湘涛 胡志刚 贺建飚 《电子与信息学报》 EI CSCD 北大核心 2009年第4期963-967,共5页
为了获得SPM(Scratch-Pad Memory)部件最佳的使用效果,需要合适的SPM性能和功耗模型来指导编译优化过程。现有的功耗模型只提供SPM部件的平均访问功耗,没有反映电路实际功耗随电路不同输入而改变的特征,限制了更进一步的优化。该文提出... 为了获得SPM(Scratch-Pad Memory)部件最佳的使用效果,需要合适的SPM性能和功耗模型来指导编译优化过程。现有的功耗模型只提供SPM部件的平均访问功耗,没有反映电路实际功耗随电路不同输入而改变的特征,限制了更进一步的优化。该文提出依照电路结构生成SPM部件的基本功耗模型,并使用程序运行时信息生成模型中的参数因子,用来反映不同应用程序运行时电路的实际活跃度。实验结果表明,该功耗模型测量的能耗值在总体上与现有基于统计方法生成的功耗模型结果相一致,同时能反映不同应用程序访问SPM部件时的功耗差异,对编译器优化SPM部件的访问方式具有重要的指导意义。 展开更多
关键词 spm 低功耗 编译优化 功耗模型
下载PDF
一种SPM周期准确功耗模型分析与实现
8
作者 胡志刚 赵庆福 蒋湘涛 《计算机工程与应用》 CSCD 北大核心 2010年第2期63-65,173,共4页
功耗问题是限制嵌入式设备发展的瓶颈之一。嵌入式系统中,为了降低嵌入式处理器的整体功耗,使用SPM(Scratch-Pad Memory)部件来替换cache部件。提出了一个SPM周期准确功耗模型。模型通过扩展SimpleScalar模拟器模拟程序执行时对SPM的访... 功耗问题是限制嵌入式设备发展的瓶颈之一。嵌入式系统中,为了降低嵌入式处理器的整体功耗,使用SPM(Scratch-Pad Memory)部件来替换cache部件。提出了一个SPM周期准确功耗模型。模型通过扩展SimpleScalar模拟器模拟程序执行时对SPM的访问,获得电路输入状态,并利用集成到模拟器中周期准确的SPM功耗模型计算SPM功耗,模型克服了电路级模型可扩展性较差的缺陷,通过在SimpleScalar中配置相关参数,模拟不同大小和结构SPM的功耗。实验表明模型能够准确模拟SPM功耗(误差不超过10%)。对SPM低功耗设计和优化具有一定的指导意义。 展开更多
关键词 SimpleScalar模拟器 片上存储器 周期准确 功耗模型
下载PDF
SPM结构上冗余读延迟写优化的设计与实现
9
作者 文延华 冯冬明 尉红梅 《计算机应用与软件》 CSCD 2015年第2期10-13,共4页
随着微处理器架构的发展,将片上SRAM组织成SPM这种软件管理的非cache结构成为众多处理器的选择。SPM结构的特点是实现简单,访问延迟低、带宽高。要有效利用有限的片上SPM空间提升程序性能,必须由用户显式进行数据的布局和传送,或者由编... 随着微处理器架构的发展,将片上SRAM组织成SPM这种软件管理的非cache结构成为众多处理器的选择。SPM结构的特点是实现简单,访问延迟低、带宽高。要有效利用有限的片上SPM空间提升程序性能,必须由用户显式进行数据的布局和传送,或者由编译器进行高效的自动访存优化。冗余读延迟写优化从循环中多个主存访问之间的关联性出发,自动进行了数据传送和缓存优化,提高了SPM上的数据重用率。经过测试,可以有效提升程序性能。 展开更多
关键词 spm 访存优化 关联性 冗余读延迟写 数据重用
下载PDF
基于能耗热点的SPM静态分配策略
10
作者 胡志刚 石金锋 蒋湘涛 《微计算机应用》 2009年第1期57-63,共7页
提出一种基于能耗热点的片上存储器静态分配策略。该分配策略依据带权重扩展控制流图将应用程序划分成不同的逻辑节点,并通过SPM平均访问能耗值计算出逻辑节点被放入SPM后产生的访问能耗的大小,以及各节点的能耗密度。构造SPM空间分配... 提出一种基于能耗热点的片上存储器静态分配策略。该分配策略依据带权重扩展控制流图将应用程序划分成不同的逻辑节点,并通过SPM平均访问能耗值计算出逻辑节点被放入SPM后产生的访问能耗的大小,以及各节点的能耗密度。构造SPM空间分配的整数线性规划算法(ILP),转化成以能耗密度为优先权的0-1背包算法来选择要放入SPM的节点。实验结果表明,使用该分配策略来管理SPM空间分配,比不使用SPM时的能耗量平均减少34%左右。 展开更多
关键词 片上存储器 能耗热点 分配策略
下载PDF
利用虚存管理的思想实现基于SPM的动态能耗优化机制
11
作者 张阳 凌明 《电脑知识与技术》 2009年第8X期6777-6778,共2页
当代高性能SoC通常引入对程序员透明的片上Cache作为对主存数据的缓冲。然而传统数据Cache受制于其容量与组关联度,因此常出现冲突的问题。本研究通过新引入的、与数据Cache共存的另一款片上存储器SPM来消除这部分冲突。我们提出了一种... 当代高性能SoC通常引入对程序员透明的片上Cache作为对主存数据的缓冲。然而传统数据Cache受制于其容量与组关联度,因此常出现冲突的问题。本研究通过新引入的、与数据Cache共存的另一款片上存储器SPM来消除这部分冲突。我们提出了一种由MMU管理的、Cache与SPM共存的片上存储器架构。利用虚存管理的思想,将虚拟上连续、物理上离散的程序地址空间段通过的异构片上存储器进行缓冲,从而将容易引起数据Cache冲突的页,在程序执行的过程中重定位到SPM,最终得到了能耗和性能上的收益。 展开更多
关键词 spm动态管理 虚存管理 能耗
下载PDF
MPSoc上动静态结合的SPM分配策略 被引量:3
12
作者 罗飞 过敏意 陈英 《计算机工程》 CAS CSCD 北大核心 2010年第21期275-276,279,共3页
基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配... 基于片上多处理器系统,提出一种动静态结合的便签式内存分配策略,采用整数线性规划方法将全局变量静态地分配到SPM中,使用拓展的数据程序关系图来描述任务和数据,根据贪心算法将合适的局部变量动态的分配到SPM中。实验结果表明,该分配策略比纯静态分配策略平均减少程序执行时间27%,比不使用SPM时减少35%。 展开更多
关键词 片上多处理器系统 便签式内存 调度
下载PDF
一种基于随机采样的SPM管理机制 被引量:1
13
作者 邓宁 计卫星 +1 位作者 石峰 宋红 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期897-905,共9页
嵌入式系统对于功耗和面积具有很高的要求.便签存储器(scratchpad memory,SPM)与同等容量Cache相比具有能耗低、片上面积小等优点,现已成为嵌入式处理器中广泛采用的片上存储器.高效的SPM管理策略对于降低系统功耗具有重要意义.传统的SP... 嵌入式系统对于功耗和面积具有很高的要求.便签存储器(scratchpad memory,SPM)与同等容量Cache相比具有能耗低、片上面积小等优点,现已成为嵌入式处理器中广泛采用的片上存储器.高效的SPM管理策略对于降低系统功耗具有重要意义.传统的SPM管理策略通过编译器采用软件方式进行.随着移动设备及网络互联设备的发展,嵌入式程序的部署方式已趋于多样化,致使传统基于程序特征分析(profiling)的SPM管理方式在某些方面存在局限.提出了一种软硬件结合的基于随机采样(random sampling)的动态SPM管理策略,通过实时监控程序访存特征等手段在运行时动态预测核心工作集(core workingset).该方法区别于传统方法之处在于无需依赖profiling信息和编译器进行SPM管理,而通过跟踪程序运行时访存动态特征指导SPM管理.实验表明,该方法可以充分发挥SPM在功耗、面积等方面的优势;通过与一种经典的SPM管理策略相比,所提出的方法在保证系统性能不降低的前提下,提高了SPM管理的灵活性、通用性. 展开更多
关键词 嵌入式处理器 片上存储 核心工作集 便签存储器 随机采样
下载PDF
RRAM的氧空位与金属细丝机制SPM的比较 被引量:2
14
作者 李丛飞 傅兴华 +1 位作者 李良荣 赵海臣 《微纳电子技术》 CAS 北大核心 2014年第1期24-29,共6页
应用扫描探针显微镜(SPM)技术实现了氧化物阻变薄膜局部区域高低阻态的互相转变。通过电激励、编程和擦除等操作,控制细丝的产生和断裂,实现了阻变薄膜局域的重复编程/擦除操作。用该方法分别研究了氧空位机制与金属导电细丝机制的氧化... 应用扫描探针显微镜(SPM)技术实现了氧化物阻变薄膜局部区域高低阻态的互相转变。通过电激励、编程和擦除等操作,控制细丝的产生和断裂,实现了阻变薄膜局域的重复编程/擦除操作。用该方法分别研究了氧空位机制与金属导电细丝机制的氧化物薄膜的阻变特性,对两种机制做了对比研究。结果表明:在阻变存储器(RRAM)中氧空位机制在导电细丝和数据密度方面要高于金属细丝机制。同时,金属细丝机制阻变薄膜部分区域因编程/擦除操作发生了永久性形貌变化,可能对阻变器件的电极产生永久性破坏,这说明氧空位机制阻变薄膜在未来的高密度存储上具有较好的应用前景。 展开更多
关键词 阻变存储器(RRAM) 导电原子力显微镜(CAFM) 扫描探针显微镜(spm) 阻变机制 氧空位机制 金属细丝机制
下载PDF
一种基于访问计数的SPM管理策略 被引量:1
15
作者 李嘉欣 邓宁 《计算机工程》 CAS CSCD 2013年第9期109-113,共5页
传统便签存储器(SPM)管理方法依赖于编译器提供支持,不利于应用程序的移植和跨平台部署,且难以反映程序动态运行特征。为件,提出一种基于访问计数的SPM动态管理策略方法,通过在程序运行时对访存地址进行访问计数,预测程序核心工作集并指... 传统便签存储器(SPM)管理方法依赖于编译器提供支持,不利于应用程序的移植和跨平台部署,且难以反映程序动态运行特征。为件,提出一种基于访问计数的SPM动态管理策略方法,通过在程序运行时对访存地址进行访问计数,预测程序核心工作集并指导SPM动态分配。实验结果表明,与单纯Cache系统相比,该方法在保持程序执行性能稳定的基础上,能耗降低了约32.5%. 展开更多
关键词 嵌入式处理器 便签存储器 动态存储管理 核心工作集 能耗
下载PDF
Utilization-Aware Data Variable Allocation on NVM- Based SPM in Real-Time Embedded Systems
16
作者 Jin-Yu Zhan Yi-Xin Li +1 位作者 Wei Jiang Jun-Huan Yang 《Journal of Electronic Science and Technology》 CAS CSCD 2021年第2期163-172,共10页
With the development of the nonvolatile memory(NVM),using NVM in the design of the cache and scratchpad memory(SPM)has been increased.This paper presents a data variable allocation(DVA)algorithm based on the genetic a... With the development of the nonvolatile memory(NVM),using NVM in the design of the cache and scratchpad memory(SPM)has been increased.This paper presents a data variable allocation(DVA)algorithm based on the genetic algorithm for NVM-based SPM to prolong the lifetime.The lifetime can be formulated indirectly as the write counts on each SPM address.Since the differences between global variables and stack variables,our optimization model has three constraints.The constraints of the central processing unit(CPU)utilization and size are used for all variables,while no-overlay constraint is only used for stack variables.To satisfy the constraints of the optimization model,we use the greedy strategy to generate the initial population which can determine whether data variables are allocated to SPM and distribute them evenly on SPM addresses.Finally,we use the Mälardalen worst case executive time(WCET)benchmark to evaluate our algorithm.The experimental results show that the DVA algorithm can not only obtain close-to-optimal solutions,but also prolong the lifetime by 9.17% on average compared with SRAM-based SPM. 展开更多
关键词 Data variables allocation genetic algorithm nonvolatile momory(NVM) scratchpad memory(spm)
下载PDF
面向E级超算系统的众核片上存储层次研究 被引量:1
17
作者 方燕飞 刘齐 +5 位作者 董恩铭 李雁冰 过锋 王谛 何王全 漆锋滨 《计算机工程》 CAS CSCD 北大核心 2023年第12期10-24,共15页
当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓... 当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。首先按照不同的组织方式将片上存储层次分为多级Cache结构、SPM结构和SPM+Cache混合结构,并总结分析3种结构的优缺点。然后分析国际主流GPU、同构众核、国产众核等面向主流E级超算系统的众核处理器片上存储层次设计现状与发展趋势。最后从众核LLC管理与缓存一致性协议、SPM空间管理与数据移动优化、SPM+Cache混合结构的全局视角优化等角度综述国际上的存储层次设计与优化相关软硬件技术的研究现状。在此基础上,从软硬件及算法设计等不同角度展望了片上存储层次的未来研究方向。 展开更多
关键词 E级超算 众核处理器 存储层次 高性能计算 便签式存储器 末级缓存
下载PDF
一种面向多核DSP的小容量紧耦合快速共享数据池 被引量:13
18
作者 陈书明 汪东 +1 位作者 陈小文 万江华 《计算机学报》 EI CSCD 北大核心 2008年第10期1737-1744,共8页
该文结合片上便笺式存储器(SPM)的结构特点,提出了一种面向异构多核DSP的新型小容量紧耦合共享存储结构——快速共享数据池(FSDP).FSDP在存储层次上与一级Cache平行,可以被访存指令直接访问,采用多体并行的结构、交叉访问模式和基于硬... 该文结合片上便笺式存储器(SPM)的结构特点,提出了一种面向异构多核DSP的新型小容量紧耦合共享存储结构——快速共享数据池(FSDP).FSDP在存储层次上与一级Cache平行,可以被访存指令直接访问,采用多体并行的结构、交叉访问模式和基于硬件信号灯的自动同步机制,支持多个DSP核的并行访问与快速的核间数据交换,两核之间交换单个数据只需4拍.该文构建了FSDP的模拟模型,并进行了RTL级设计实现和分析.多种典型测试程序的验证表明,FSDP对于DSP核间细粒度共享数据的传输具有很高的效率,相比同类的VS-SPM结构能够将程序性能提高37%,与传统的共享数据Cache结合使用能够将异构多核DSP的性能提高13%. 展开更多
关键词 便笺存储器 共享存储 多核DSP 释放一致性
下载PDF
面向Linux内核的片上存储优化 被引量:2
19
作者 武建平 方攀 +1 位作者 凌明 张阳 《微电子学》 CAS CSCD 北大核心 2012年第1期87-91,96,共6页
便签存储器(SPM)作为主要的片上存储器之一,可以用来提升嵌入式Linux系统的性能,并降低其能耗。提出一种针对Linux内核的SPM管理及优化方案,实现了针对Linux内核热点代码段、数据段的SPM静态优化技术。利用虚存管理技术,建立以SPM页区... 便签存储器(SPM)作为主要的片上存储器之一,可以用来提升嵌入式Linux系统的性能,并降低其能耗。提出一种针对Linux内核的SPM管理及优化方案,实现了针对Linux内核热点代码段、数据段的SPM静态优化技术。利用虚存管理技术,建立以SPM页区为基础的动态SPM页框分配机制,并实现页框分配的通用接口函数。在优化热点小对象分配器(SLAB)的基础上,实现对Linux内核的动态优化。实验结果表明,该优化方案能明显降低能耗和提升性能,其内核代码段优化方案平均提升11%的系统性能。 展开更多
关键词 LINUX内核 内存管理 小对象分配器 便签存储器
下载PDF
嵌入式软硬件低功耗优化研究综述 被引量:16
20
作者 周宽久 迟宗正 西方 《计算机应用研究》 CSCD 北大核心 2010年第2期423-428,共6页
随着时代的进步,制约着嵌入式设备广泛应用的障碍不再是处理器的速度、芯片的工艺,而是设备功耗。如何在相同能量的供给情况下工作时间最长、完成的任务最多,或者是运行相同的程序使用较少的能量成为嵌入式领域备受关注的研究方向。从... 随着时代的进步,制约着嵌入式设备广泛应用的障碍不再是处理器的速度、芯片的工艺,而是设备功耗。如何在相同能量的供给情况下工作时间最长、完成的任务最多,或者是运行相同的程序使用较少的能量成为嵌入式领域备受关注的研究方向。从硬件级、指令级和编译过程三个层次,由各层次相应公式的各个参数展开,对国内外的功耗优化研究现状进行综述和评价,并最终结合实验室SPARC仿真项目,提出基于SPARC仿真功耗优化研究的三个方向。 展开更多
关键词 功耗优化 硬件级 指令级 编译优化 静态功耗 漏电流 内联优化 高速暂存区
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部