期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
层次化共享多通道便签存储器的嵌入式多核体系 被引量:1
1
作者 刘彩霞 石峰 +1 位作者 薛立成 宋红 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1390-1398,共9页
为了支持嵌入式应用的实时、低延迟访存,提出并实现了一种面向嵌入式应用的多核存储架构——HSMC-SPM.采用低地址多体交叉的硬件组织模式设计实现可共享多通道便签存储器,根据并发应用的大小自动分配共享便签存储器空间,以支持核间数据... 为了支持嵌入式应用的实时、低延迟访存,提出并实现了一种面向嵌入式应用的多核存储架构——HSMC-SPM.采用低地址多体交叉的硬件组织模式设计实现可共享多通道便签存储器,根据并发应用的大小自动分配共享便签存储器空间,以支持核间数据的流水传输并提高共享便签存储器体系存储空间的利用率.实验结果表明,无论与传统只共享Cache的多核体系相比,还是与其他使用片上便签存储器的多核体系相比,HSMC-SPM都是一种性能有效的低能耗多核架构. 展开更多
关键词 嵌入式多核系统 共享便签存储器体系 多通道便签存储器
下载PDF
面向嵌入式多核系统的可共享多通道便签存储器设计与实现 被引量:2
2
作者 刘彩霞 石峰 +2 位作者 谢小怡 薛建平 宋红 《小型微型计算机系统》 CSCD 北大核心 2010年第7期1338-1341,共4页
嵌入式多核系统性能提高的关键在于灵活的存储体系.文中提出并设计实现了一种可共享多通道便签存储器,所设计存储器可作为嵌入式多核系统中的共享存储器使用.该存储器采用模块化设计方法,利用多体交叉的连接方式提高存储器带宽并提供两... 嵌入式多核系统性能提高的关键在于灵活的存储体系.文中提出并设计实现了一种可共享多通道便签存储器,所设计存储器可作为嵌入式多核系统中的共享存储器使用.该存储器采用模块化设计方法,利用多体交叉的连接方式提高存储器带宽并提供两种访问模式.其中私有访问模式对非本地SPM通道的写禁止降低了存储一致性的维护开销.实验结果表明,与Cache存储器相比,该存储器应用于嵌入式多核系统可以提高程序运行性能约6%,节省约48%的功耗. 展开更多
关键词 嵌入式多核系统 共享存储体系 可共享多通道便签存储器(MC-SPM)
下载PDF
面向E级超算系统的众核片上存储层次研究 被引量:1
3
作者 方燕飞 刘齐 +5 位作者 董恩铭 李雁冰 过锋 王谛 何王全 漆锋滨 《计算机工程》 CAS CSCD 北大核心 2023年第12期10-24,共15页
当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓... 当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。首先按照不同的组织方式将片上存储层次分为多级Cache结构、SPM结构和SPM+Cache混合结构,并总结分析3种结构的优缺点。然后分析国际主流GPU、同构众核、国产众核等面向主流E级超算系统的众核处理器片上存储层次设计现状与发展趋势。最后从众核LLC管理与缓存一致性协议、SPM空间管理与数据移动优化、SPM+Cache混合结构的全局视角优化等角度综述国际上的存储层次设计与优化相关软硬件技术的研究现状。在此基础上,从软硬件及算法设计等不同角度展望了片上存储层次的未来研究方向。 展开更多
关键词 E级超算 众核处理器 存储层次 高性能计算 便存储器 末级缓存
下载PDF
面向Linux内核的片上存储优化 被引量:2
4
作者 武建平 方攀 +1 位作者 凌明 张阳 《微电子学》 CAS CSCD 北大核心 2012年第1期87-91,96,共6页
便签存储器(SPM)作为主要的片上存储器之一,可以用来提升嵌入式Linux系统的性能,并降低其能耗。提出一种针对Linux内核的SPM管理及优化方案,实现了针对Linux内核热点代码段、数据段的SPM静态优化技术。利用虚存管理技术,建立以SPM页区... 便签存储器(SPM)作为主要的片上存储器之一,可以用来提升嵌入式Linux系统的性能,并降低其能耗。提出一种针对Linux内核的SPM管理及优化方案,实现了针对Linux内核热点代码段、数据段的SPM静态优化技术。利用虚存管理技术,建立以SPM页区为基础的动态SPM页框分配机制,并实现页框分配的通用接口函数。在优化热点小对象分配器(SLAB)的基础上,实现对Linux内核的动态优化。实验结果表明,该优化方案能明显降低能耗和提升性能,其内核代码段优化方案平均提升11%的系统性能。 展开更多
关键词 LINUX内核 内存管理 小对象分配器 便签存储器
下载PDF
嵌入式Linux的片上存储动态优化 被引量:1
5
作者 武建平 方攀 +1 位作者 凌明 张阳 《应用科学学报》 EI CAS CSCD 北大核心 2012年第4期356-362,共7页
为了充分利用片上高速便签存储器(scratch-pad memory,SPM),提升嵌入式Linux系统性能并降低功耗,该文提出一种面向嵌入式Linux用户进程的SPM动态优化方案.利用虚存管理技术在Linux内核的内存模型中添加SPM页区,建立以SPM页区为基础的动... 为了充分利用片上高速便签存储器(scratch-pad memory,SPM),提升嵌入式Linux系统性能并降低功耗,该文提出一种面向嵌入式Linux用户进程的SPM动态优化方案.利用虚存管理技术在Linux内核的内存模型中添加SPM页区,建立以SPM页区为基础的动态SPM页框分配机制,并实现页框分配的通用接口函数.在实现对用户程序(包括代码段、栈和BSS段)优化的基础上,提出自主设计的自动采样交换器(auto profile and pageswap,APPS)优化方案.该方案能在内核态自动分析用户进程热点并通过专用DMA将其搬运到SPM中,最终实现多进程用户程序的动态SPM优化.实验结果表明,基于该优化方案的系统性能得到显著提升. 展开更多
关键词 LINUX 内存管理 便签存储器 自动采样交换器
下载PDF
一种基于随机采样的SPM管理机制 被引量:1
6
作者 邓宁 计卫星 +1 位作者 石峰 宋红 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期897-905,共9页
嵌入式系统对于功耗和面积具有很高的要求.便签存储器(scratchpad memory,SPM)与同等容量Cache相比具有能耗低、片上面积小等优点,现已成为嵌入式处理器中广泛采用的片上存储器.高效的SPM管理策略对于降低系统功耗具有重要意义.传统的SP... 嵌入式系统对于功耗和面积具有很高的要求.便签存储器(scratchpad memory,SPM)与同等容量Cache相比具有能耗低、片上面积小等优点,现已成为嵌入式处理器中广泛采用的片上存储器.高效的SPM管理策略对于降低系统功耗具有重要意义.传统的SPM管理策略通过编译器采用软件方式进行.随着移动设备及网络互联设备的发展,嵌入式程序的部署方式已趋于多样化,致使传统基于程序特征分析(profiling)的SPM管理方式在某些方面存在局限.提出了一种软硬件结合的基于随机采样(random sampling)的动态SPM管理策略,通过实时监控程序访存特征等手段在运行时动态预测核心工作集(core workingset).该方法区别于传统方法之处在于无需依赖profiling信息和编译器进行SPM管理,而通过跟踪程序运行时访存动态特征指导SPM管理.实验表明,该方法可以充分发挥SPM在功耗、面积等方面的优势;通过与一种经典的SPM管理策略相比,所提出的方法在保证系统性能不降低的前提下,提高了SPM管理的灵活性、通用性. 展开更多
关键词 嵌入式处理器 片上存储 核心工作集 便签存储器 随机采样
下载PDF
一种基于访问计数的SPM管理策略 被引量:1
7
作者 李嘉欣 邓宁 《计算机工程》 CAS CSCD 2013年第9期109-113,共5页
传统便签存储器(SPM)管理方法依赖于编译器提供支持,不利于应用程序的移植和跨平台部署,且难以反映程序动态运行特征。为件,提出一种基于访问计数的SPM动态管理策略方法,通过在程序运行时对访存地址进行访问计数,预测程序核心工作集并指... 传统便签存储器(SPM)管理方法依赖于编译器提供支持,不利于应用程序的移植和跨平台部署,且难以反映程序动态运行特征。为件,提出一种基于访问计数的SPM动态管理策略方法,通过在程序运行时对访存地址进行访问计数,预测程序核心工作集并指导SPM动态分配。实验结果表明,与单纯Cache系统相比,该方法在保持程序执行性能稳定的基础上,能耗降低了约32.5%. 展开更多
关键词 嵌入式处理器 便签存储器 动态存储管理 核心工作集 能耗
下载PDF
嵌入式视频解码器运动补偿的数据布局优化 被引量:1
8
作者 郭红星 王恒伟 +2 位作者 田婷 张爱华 余胜生 《计算机技术与发展》 2013年第4期24-28,共5页
针对数字信号处理器的片上存取结构特点,提出了一个优化视频解码运动补偿过程数据布局的方案。在片上便签式存储器(SPM)中设置一个乒乓缓冲存储区用于保存运动补偿所需的数据。在对当前宏块进行运动补偿的同时,预取后续运动补偿所需的... 针对数字信号处理器的片上存取结构特点,提出了一个优化视频解码运动补偿过程数据布局的方案。在片上便签式存储器(SPM)中设置一个乒乓缓冲存储区用于保存运动补偿所需的数据。在对当前宏块进行运动补偿的同时,预取后续运动补偿所需的数据替换其中不再使用的数据;同时,通过数据索引算法获得运动补偿所需的数据的地址,从而实现数据处理与数据存取的并行流水优化。基于TMS320DM642处理器的实验结果表明,优化后MPEG-4视频解码器的解码速度平均提高了6.7%,整个解码过程中DM642的片上二级缓存的能耗平均降低了18.5%。由此可见,对运动补偿过程进行数据布局优化确实可以提高解码性能并降低能耗。 展开更多
关键词 嵌入式系统 流计算 视频解码器 便存储器 数据布局
下载PDF
MACT:高通量众核处理器离散访存请求批量处理机制
9
作者 李文明 叶笑春 +5 位作者 王达 郑方 李宏亮 林晗 范东睿 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2015年第6期1254-1265,共12页
网络服务等新型高通量应用的迅速兴起给传统处理器设计带来了巨大的挑战.高通量众核处理器作为面向此类应用的新型处理器结构成为研究热点.然而,随着片上处理核数量的剧增,加之高通量应用的数据密集型特点,"存储墙"问题进一... 网络服务等新型高通量应用的迅速兴起给传统处理器设计带来了巨大的挑战.高通量众核处理器作为面向此类应用的新型处理器结构成为研究热点.然而,随着片上处理核数量的剧增,加之高通量应用的数据密集型特点,"存储墙"问题进一步加剧.通过分析高通量应用访存行为,发现此类应用存在着大量的细粒度访存,降低了访存带宽的有效利用率.基于此分析,在高通量处理器设计中通过添加访存请求收集表(memory access collection table,MACT)硬件机制,结合消息式内存机制,用于收集离散的访存请求并进行批量处理.MACT硬件机制的实现,提高了访存带宽的有效利用率,同时也提高了执行效率;并通过时间窗口机制,确保访存请求在最晚期限之前发送出去,保证任务的实时性.实验以典型高通量应用WordCount,TeraSort,Search为基准测试程序.添加MACT硬件机制后,访存数量减少约49%,访存带宽提高约24%,平均执行速度提高约89%. 展开更多
关键词 高通量处理器 访存请求收集表 时间窗口机制 高速缓冲存储器 便存储器
下载PDF
基于SPM的多核SoC访存结构设计与优化
10
作者 刘磊 严明 李思昆 《计算机工程》 CAS CSCD 北大核心 2009年第18期234-236,共3页
针对"一个RISC主处理器核+几个专用协处理器核"结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通过增加组传输和流水传输模式,对该结构进行优化。实验结果表明,该访存结构设计及优化方案的数... 针对"一个RISC主处理器核+几个专用协处理器核"结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通过增加组传输和流水传输模式,对该结构进行优化。实验结果表明,该访存结构设计及优化方案的数据传输效率高、实现开销小,并且对同类SoC系统,该设计具有良好的适用性。 展开更多
关键词 便存储器 多核SoC 访存
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部