期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
A write buffer design based on stable and area-saving embedded SRAM for flash applications
1
作者 CAO Hua Min HUO Zong Liang +7 位作者 WANG Yu LI Ting LIU Jing JIN Lei JIANG Dan-Dan ZHANG Deng Jun LI Di LIU Ming 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2015年第2期357-361,共5页
This paper presents an embedded SRAM design for write buffer applications in flash memories.The write buffer is implemented with a newly proposed self-adaptive timing control circuit,an area-saving sense-latch circuit... This paper presents an embedded SRAM design for write buffer applications in flash memories.The write buffer is implemented with a newly proposed self-adaptive timing control circuit,an area-saving sense-latch circuit and 6 T SRAM cell units.A 2 kb SRAM macro with the area of 135μm×180μm is implemented in and applied to a 128 Mb NOR flash memory with the SMIC 65 nm NOR flash memory process.Both simulation and chip test results show that the SRAM write buffer is beneficial to high-density flash memory design. 展开更多
关键词 write buffer embedded SRAM FLASH 65 nm technology 2 kb 128 Mb
原文传递
一种低功耗Cache设计技术的研究 被引量:5
2
作者 郑伟 姚庆栋 +4 位作者 张明 刘鹏 张子男 周莉 李东晓 《电路与系统学报》 CSCD 2004年第5期21-24,29,共5页
低功耗、高性能的cache系统设计是嵌入式DSP芯片设计的关键.本文在多媒体处理DSP芯片MD32的设计实践中,提出一种利用读/写缓冲器作为零级cache,减少对数据、指令cache的读/写次数,由于缓冲器读取功耗远远小于片上cache,从而减小cache相... 低功耗、高性能的cache系统设计是嵌入式DSP芯片设计的关键.本文在多媒体处理DSP芯片MD32的设计实践中,提出一种利用读/写缓冲器作为零级cache,减少对数据、指令cache的读/写次数,由于缓冲器读取功耗远远小于片上cache,从而减小cache相关功耗的方法.通过多种多媒体处理测试程序的验证,该技术可减少对指令cache或者数据cache 20%~40%的读取次数,以较小芯片面积的增加换取了较大的功耗降低. 展开更多
关键词 低功耗 CACHE设计 读/写缓冲器 DSP处理器
下载PDF
众核处理器中使用写掩码实现混合写回/写穿透策略 被引量:5
3
作者 林伟 叶笑春 +1 位作者 宋风龙 张浩 《计算机学报》 EI CSCD 北大核心 2008年第11期1918-1928,共11页
高速缓存采用写回策略,能极大地节省对片上网络和访存带宽的消耗,这对于片上众核(大于16核)的结构尤为重要.与通常多核系统中基于目录/总线的写无效或写更新协议不同,文中给出了片上实现域一致性存储模型和基于硬件锁的缓存一致性协... 高速缓存采用写回策略,能极大地节省对片上网络和访存带宽的消耗,这对于片上众核(大于16核)的结构尤为重要.与通常多核系统中基于目录/总线的写无效或写更新协议不同,文中给出了片上实现域一致性存储模型和基于硬件锁的缓存一致性协议的方案并提出了在L1高速缓存保存写掩码的方法,用以记录本地更新缓存块的字节位置,解决了写回策略下伪共享带来的缓存一致性问题.文中还进一步提出两种优化掩码存储空间开销的新方法:通过设定程序中较少出现的、长度为1-3字节的写指令为写穿透,在L1中每4字节设置一位写掩码,将写掩码的芯片面积开销压缩到字节粒度的27.9%;设计项数为L1缓存块总数12.5%的多路写掩码缓存,在不损失性能的情况下,将面积开销压缩到字节粒度的17.7%.搭建的众核平台Godson-T采用域一致性存储模型,使用写掩码实现混合写回/写穿透缓存策略(临界区内写穿透,临界区外写回).实验使用splash2的3个程序和2个生物计算程序进行评估.结果表明,相对于完全写穿透,混合写回策略在32和64线程的配置下普遍获得24%以上的性能提升,性能略优于完全写回,并且采用两种优化空间开销的新方法后性能无损失. 展开更多
关键词 众核 写掩码 写掩码缓存 域一致性 伪共享 写无效 写更新
下载PDF
基于周期粒度的级间寄存器备份机制 被引量:1
4
作者 王晶 申娇 +3 位作者 丁利华 杨星 邱柯妮 张伟功 《电子学报》 EI CAS CSCD 北大核心 2018年第10期2486-2494,共9页
单粒子翻转是空间环境下微处理器发生异常的重要诱因之一,随着集成电路特征尺寸的缩小,单粒子翻转不仅会引发单位错误,还会引发大量的多位错误,如何有效解决处理器所面临的多位故障是容错处理器设计面临的新挑战.本文提出了一种基于周... 单粒子翻转是空间环境下微处理器发生异常的重要诱因之一,随着集成电路特征尺寸的缩小,单粒子翻转不仅会引发单位错误,还会引发大量的多位错误,如何有效解决处理器所面临的多位故障是容错处理器设计面临的新挑战.本文提出了一种基于周期粒度的级间寄存器备份机制的容错方法,采用双流水线冗余结构,通过比较器对比两条流水线的级间寄存器以检测单粒子故障;以周期粒度对级间寄存器的内容进行备份,当检测到单粒子故障时,使用2个周期对流水线进行恢复;为避免脏数据流出流水线,在数据缓存和寄存器堆的入口设置写缓冲,通过延迟写入保证信息可靠性.本文基于实际的SPARC V8结构处理器,对提出的方法进行了具体实现,在实验平台上进行了仿真,仿真结果显示,本文提出的容错方法能够以一定的面积开销实现对SEU、SET、和MBU故障容错,加固处理器的主频最高可以提升70%. 展开更多
关键词 单粒子翻转 多位故障 容错 备份 写缓冲 流水线加固
下载PDF
分类的缓存数据延迟写技术 被引量:3
5
作者 魏文国 张凌 +1 位作者 董守斌 陈国华 《小型微型计算机系统》 CSCD 北大核心 2006年第11期2138-2141,共4页
根据缓存数据在缓冲区的活动性不同而设计和实现了一个分类的延迟写(Writebehind)技术.通过将不同活动性的数据分类缓存,并延迟刷新到磁盘来减少、合并写磁盘的次数,从而改进文件系统的写性能.初步的实现结果表明,分类的缓存延迟写技术... 根据缓存数据在缓冲区的活动性不同而设计和实现了一个分类的延迟写(Writebehind)技术.通过将不同活动性的数据分类缓存,并延迟刷新到磁盘来减少、合并写磁盘的次数,从而改进文件系统的写性能.初步的实现结果表明,分类的缓存延迟写技术比LRU的缓存策略有更短的系统响应时间,写文件的反馈时间减少了11.3%,并且使用RWB策略的缓存命中率比使用LRU策略高. 展开更多
关键词 文件系统 缓存 延迟写 算法
下载PDF
基于ARM存储结构的MP3程序性能优化 被引量:1
6
作者 李存 马燕 +1 位作者 李晓勇 白英彩 《计算机应用与软件》 CSCD 北大核心 2007年第9期74-76,共3页
针对ARM存储系统的结构和MP3解码程序的特性,提出在S3C24A0上通过TLB,Cache和Write Buffer的有效使用,实现MP3解码程序性能优化,并且通过量化的比较得到一个可靠的结论。同时分析数据一致性问题,针对各种引起数据不一致的情况提出相应... 针对ARM存储系统的结构和MP3解码程序的特性,提出在S3C24A0上通过TLB,Cache和Write Buffer的有效使用,实现MP3解码程序性能优化,并且通过量化的比较得到一个可靠的结论。同时分析数据一致性问题,针对各种引起数据不一致的情况提出相应的解决方案。 展开更多
关键词 存储管理单元 快表 数据缓存 指令缓存 写缓冲区 数据一致性
下载PDF
PCM混合主存系统的写感知主存管理算法 被引量:1
7
作者 何爱华 岳丽华 +1 位作者 吴章玲 郭有强 《计算机科学与探索》 CSCD 北大核心 2016年第6期799-810,共12页
相变存储器(phase change memory,PCM)凭借字节可寻址,读取速度快(纳秒级),高存储密度,低能耗等优点,在目前基于DRAM(dynamic random access memory)的主存扩展达到瓶颈的情形下,已经成为最具前途的主存存储介质之一,但是PCM有高写延迟... 相变存储器(phase change memory,PCM)凭借字节可寻址,读取速度快(纳秒级),高存储密度,低能耗等优点,在目前基于DRAM(dynamic random access memory)的主存扩展达到瓶颈的情形下,已经成为最具前途的主存存储介质之一,但是PCM有高写延迟,寿命有限等缺陷,因此出现了DRAM/PCM混合主存架构。提出了一种以减少PCM写和保持命中率为目标的混合主存管理算法——写感知的CLOCK算法(CLOCK with a write-aware strategy,CLOCKW)。已有研究主要基于写临近信息(recency of writes,RW)来预测页面写热度,CLOCKW引入内在写距离(inter-write-distance,IWD)概念,并结合写临近信息来预测页面写热度,从而把写密集页面放置在DRAM。此外,CLOCKW通过记录有限的历史写操作信息,将新置换进的页面放在合适的存储介质,避免不必要的页面迁移。最后,基于CLOCK算法的CLOCKW满足虚拟主存管理的低代价要求。实验显示,CLOCKW在保持命中率前提下,可以有效减少PCM写次数。 展开更多
关键词 相变存储器 混合主存 写感知 主存管理
下载PDF
基于对象存储系统的对象文件系统设计 被引量:4
8
作者 冯丹 史伟 +1 位作者 覃灵军 关卿 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第12期47-49,共3页
基于对象文件系统是建立在对象存储系统上的一种应用,它利用对象的特点对数据进行存储和管理.基于对象文件系统由客户端、元数据服务器和基于对象存储设备组成,通过对系统的各部分进行分析,设计并实现了基于对象文件系统.通过对不同文... 基于对象文件系统是建立在对象存储系统上的一种应用,它利用对象的特点对数据进行存储和管理.基于对象文件系统由客户端、元数据服务器和基于对象存储设备组成,通过对系统的各部分进行分析,设计并实现了基于对象文件系统.通过对不同文件大小、不同文件分块大小条件下文件系统的性能进行测试分析,找出系统的数据传输瓶颈,使用以对象属性为导向的缓存和预取技术以及聚合读写的方法对文件系统进行了优化.优化后读写吞吐率分别提高了60 Mbyte/s和40 Mbyte/s. 展开更多
关键词 对象存储 基于对象文件系统 预取与缓存 聚合读写
下载PDF
基于SOPC技术的LCD显示控制器设计研究 被引量:2
9
作者 邢红涛 许军 张新喜 《电子测量技术》 2008年第1期13-15,共3页
针对LCD显示控制器设计中显存读写冲突的问题,分析、比较了目前常用的解决显存读写冲突的三种方法;以FPGA为核心设计了一款Avalon流模式的LCD控制器,较好地解决了显存读写的冲突问题,增强了系统的实用性和灵活性。
关键词 SOPC LCD控制器 显存读写冲突
下载PDF
银河智能工具机后行写数缓冲站的设计与实现
10
作者 刘波 张晨曦 +1 位作者 王朴 张丽力 《计算机工程与设计》 CSCD 北大核心 1996年第5期3-8,共6页
数据缓冲部件是银河智能工具机的一大关键部件,本文对该部件的重要组成部分一后行写数缓冲站的功能、组成、设计思想以及实现该站所涉及的主要信号关系进行了详细叙述,并给出了产生有关信号的条件,可立即归纳出相应的逻辑式。硬件实... 数据缓冲部件是银河智能工具机的一大关键部件,本文对该部件的重要组成部分一后行写数缓冲站的功能、组成、设计思想以及实现该站所涉及的主要信号关系进行了详细叙述,并给出了产生有关信号的条件,可立即归纳出相应的逻辑式。硬件实现的结果证明,我们的设计思想完全正确,效果令人满意。 展开更多
关键词 智能工具机 写缓冲站 智能计算机
下载PDF
基于SRAM和PRAM混合主存设计
11
作者 姚英彪 陈越佳 《计算机工程与应用》 CSCD 北大核心 2016年第13期69-75,共7页
由于DRAM芯片超高的静态功耗,使得利用DRAM构建高性能计算机系统中的大容量主存遇到能耗过大问题,这激发了对新型大容量主存结构的研究。针对上述问题,设计了一种基于SRAM和PRAM的混合主存系统,该系统将SRAM作为PRAM的专用写缓存,并将... 由于DRAM芯片超高的静态功耗,使得利用DRAM构建高性能计算机系统中的大容量主存遇到能耗过大问题,这激发了对新型大容量主存结构的研究。针对上述问题,设计了一种基于SRAM和PRAM的混合主存系统,该系统将SRAM作为PRAM的专用写缓存,并将改进后的LRFU算法应用到SRAM写缓存,从而在对主存系统性能影响不大的前提下,有效降低主存系统的能耗和延长PRAM的可用时间。仿真结果显示,所设计的混合存储结构的能耗-延时积(EDP)为纯DRAM存储结构的40%;此外,与纯PRAM存储结构相比,可使PRAM的写操作次数下降28.5%,与将SRAM作为Cache相比,PRAM写次数下降13%。 展开更多
关键词 混合存储器 PRAM存储器 SRAM写缓存 低功耗 写操作次数 替换算法
下载PDF
MOSI:一种基于超长指令字处理器的同时多线程微体系结构
12
作者 万江华 陈书明 《计算机学报》 EI CSCD 北大核心 2006年第3期378-383,共6页
描述了一种基于超长指令字处理器的同时多线程微体系结构———MOSI(MultiOp Splitting Issue,多操作①分离发射).MOSI动态地发射同一多操作内的指令,并通过写回缓冲保证计算结果的写回顺序与编译器的视图一致,从而以较小的代价解决了SM... 描述了一种基于超长指令字处理器的同时多线程微体系结构———MOSI(MultiOp Splitting Issue,多操作①分离发射).MOSI动态地发射同一多操作内的指令,并通过写回缓冲保证计算结果的写回顺序与编译器的视图一致,从而以较小的代价解决了SMT技术中的关键问题.文中详细描述了写回缓冲的结构及算法,给出了多个线程的硬件模型,最后对硬件支持线程的个数及Cache的组织结构进行了讨论.实验结果表明,基于MOSI结构的双线程处理器能够将吞吐率提高40%. 展开更多
关键词 同时多线程 超长指令字 多操作 指令发射 写回缓冲
下载PDF
确定性分布式数据库中长事务处理方法研究 被引量:9
13
作者 李文昊 李海芳 《科学技术与工程》 北大核心 2016年第13期92-95,105,共5页
确定性分布式数据库Calvin在执行长事务时,面对长事务中交替出现的读写请求,容易发生读写冲突,并且长事务会导致缓冲区置换频率升高,这些会影响系统的吞吐量。提出一种基于数据访问规则的事务处理方法与一种事务访问文件。基于数据访问... 确定性分布式数据库Calvin在执行长事务时,面对长事务中交替出现的读写请求,容易发生读写冲突,并且长事务会导致缓冲区置换频率升高,这些会影响系统的吞吐量。提出一种基于数据访问规则的事务处理方法与一种事务访问文件。基于数据访问规则的事务处理方法通过对事务间的读写集合进行分析,利用数据记录更新映射表来生成事务的数据访问规则。事务访问文件对历史事务更新数据进行整理,有效降低缓冲区置换频率。实验证明,改进方法可以有效降低长事务对确定性分布式数据库Calvin吞吐量的影响。 展开更多
关键词 确定性数据库 缓冲区置换 长事务 读写冲突 数据访问规则
下载PDF
高效的自适应文件系统的原型设计
14
作者 谢桂园 魏文国 《计算机工程与设计》 CSCD 北大核心 2009年第10期2597-2598,F0003,共3页
为了改进文件系统的性能,提出的文件系统既具有自适应的RAID3和RAID5混合结构,又能根据缓存数据在缓冲区的活动性不同而分类缓存,数据被延迟刷新到磁盘来减少、合并写磁盘的次数,进一步采用自适应的文件条带策略来优化文件访问性能。研... 为了改进文件系统的性能,提出的文件系统既具有自适应的RAID3和RAID5混合结构,又能根据缓存数据在缓冲区的活动性不同而分类缓存,数据被延迟刷新到磁盘来减少、合并写磁盘的次数,进一步采用自适应的文件条带策略来优化文件访问性能。研究结果表明,该文件系统能按需自适应地读写多媒体数据和事务处理数据,当文件系统负载低时,可以尽量积极地将文件分布到所有磁盘来最小化I/O的反馈时间;反之,在系统负载高时,将文件分布的范围小一些以便最大化文件系统整体的吞吐量。 展开更多
关键词 文件系统 缓存 延迟写 文件条带化 自适应 RAID
下载PDF
存储器行缓冲区命中预测研究 被引量:1
15
作者 王得利 高德远 +1 位作者 王党辉 孙华锦 《计算机科学》 CSCD 北大核心 2010年第6期297-302,共6页
存储系统已经成为提高计算机系统性能的一个瓶颈。现利用DRAM存储器的访问特性来减少存储器访问操作的平均延迟。首先对存储器行缓冲区的控制策略进行研究,提出了读写分离式页模式预测器,并提出了双饱和计数器预测器和2级预测器等两种... 存储系统已经成为提高计算机系统性能的一个瓶颈。现利用DRAM存储器的访问特性来减少存储器访问操作的平均延迟。首先对存储器行缓冲区的控制策略进行研究,提出了读写分离式页模式预测器,并提出了双饱和计数器预测器和2级预测器等两种预测器方案;然后以SimpleScalar搭建的仿真平台对提出的预测方案进行了性能评估。结果显示,与缓冲区"关"策略相比,平均访问延迟减少了26%,IPC平均提高了4.3%;与缓冲区"开"策略相比,平均访问延迟减少了19.6%,IPC平均提高了2.5%。 展开更多
关键词 存储系统 行缓冲区 页模式预测 读写分离
下载PDF
动态容忍和检测非对称数据竞争 被引量:1
16
作者 王文文 武成岗 +4 位作者 Paruj Ratanaworabhan 远翔 王振江 李建军 冯晓兵 《计算机研究与发展》 EI CSCD 北大核心 2014年第8期1748-1763,共16页
非对称数据竞争是数据竞争中一种常见的类型.当一个线程在临界区内访问某个共享变量,另外一个线程在临界区外或不同的临界区内同时也访问这个共享变量时,就触发了非对称数据竞争.多线程程序中的非对称数据竞争往往是有害的.为了解决非... 非对称数据竞争是数据竞争中一种常见的类型.当一个线程在临界区内访问某个共享变量,另外一个线程在临界区外或不同的临界区内同时也访问这个共享变量时,就触发了非对称数据竞争.多线程程序中的非对称数据竞争往往是有害的.为了解决非对称数据竞争引入的问题,提出了ARace.它使用共享变量保护和写缓冲区来动态容忍和检测非对称数据竞争.其中,共享变量保护用于保护临界区内只读和先读后写的共享变量,防止这些变量在临界区外被修改;写缓冲区用于缓存临界区内对共享变量的写操作.ARace不仅可以容忍临界区内和临界区外之间的非对称数据竞争,还可以对并发临界区之间的非对称数据竞争进行检测.ARace既不依赖程序源代码和编译器的支持,也不依赖额外硬件的支持.此外,还提出了一种通过动态二进制插桩技术实现ARace的方法.实验结果表明,ARace在保证容忍和检测非对称数据竞争的同时,并未引入很大的性能开销和内存开销. 展开更多
关键词 非对称数据竞争 容忍和检测 写缓冲区 页保护 动态二进制插桩
下载PDF
基于写数据页聚簇的固态硬盘缓冲算法
17
作者 李顺芬 陈小刚 +3 位作者 周密 李鸽子 王玉婵 宋志棠 《计算机系统应用》 2014年第3期167-171,共5页
针对Flash写前需擦除,读写I/O开销不均衡等固有缺陷,研究面向闪存缓冲区管理,对提高基于Flash的固态硬盘(Solid State Disk,SSD)访问性能具有重要理论意义和应用价值.通过分析SSD关键技术及现有缓冲区管理算法,实现了一种适用于SSD的基... 针对Flash写前需擦除,读写I/O开销不均衡等固有缺陷,研究面向闪存缓冲区管理,对提高基于Flash的固态硬盘(Solid State Disk,SSD)访问性能具有重要理论意义和应用价值.通过分析SSD关键技术及现有缓冲区管理算法,实现了一种适用于SSD的基于写数据页聚簇缓冲算法.文章中详细介绍了该算法关键技术及原理,并通过FlashSim仿真平台实现SSD写缓冲.基于仿真结果与传统缓冲算法性能比对,分析得出该缓冲算法可降低SSD随机写次数和SSD数据存储分散性,并提升SSD响应速度. 展开更多
关键词 固态硬盘 缓冲管理 聚簇 置换策略 随机写
下载PDF
一种指令快速完成的ROB退休方案
18
作者 李晓明 杨军 孟建熠 《计算机工程与应用》 CSCD 北大核心 2015年第24期40-44,共5页
针对超标量处理器中长延时的指令长时占用重排序缓存的顶端引起流水线退休缓慢的问题,提出了一种将无异常风险的指令快速退休并将运算结果乱序回写的高效退休机制。该方案将结果缓存器与重排序缓存分离,其中结果缓存器作为运算结果回写... 针对超标量处理器中长延时的指令长时占用重排序缓存的顶端引起流水线退休缓慢的问题,提出了一种将无异常风险的指令快速退休并将运算结果乱序回写的高效退休机制。该方案将结果缓存器与重排序缓存分离,其中结果缓存器作为运算结果回写的缓存器,重排序缓存负责指令按序退休与精确异常的维护。重排序缓存单元在确认指令不会发生异常后,将指令从重排序缓存中快速退休,结果缓存器继续等待结果并进行乱序回写。实验结果表明,在硬件资源相同的情况下,通过提高重排序缓存器的使用效率,基于该方案的处理器相比于传统的按序退休处理器的性能平均提高33%。 展开更多
关键词 按序退休 重排序缓存 快速退休 乱序回写
下载PDF
语言书写机制的研究进展:来自失写症的证据 被引量:8
19
作者 刘洁 毕彦超 韩在柱 《心理科学进展》 CSSCI CSCD 北大核心 2008年第1期26-31,共6页
近年来人们采用认知神经心理学方法,通过研究失语症病人的选择性语言功能损伤取得了许多理论成果。该文主要介绍了当前比较认可的书写模型,简要阐述了书写过程中所涉及的认知成分,以及从刺激呈现到拼写出单词的简单动态过程,并回顾了模... 近年来人们采用认知神经心理学方法,通过研究失语症病人的选择性语言功能损伤取得了许多理论成果。该文主要介绍了当前比较认可的书写模型,简要阐述了书写过程中所涉及的认知成分,以及从刺激呈现到拼写出单词的简单动态过程,并回顾了模型建立的实验证据和逻辑思想。 展开更多
关键词 书写 词汇通路 亚词汇通路 整合假说 字形输出缓冲器
下载PDF
一种消除内存访问等待的DSP内存控制设计
20
作者 徐如淏 王兵 李宇飞 《计算机工程》 EI CAS CSCD 北大核心 2005年第5期38-40,共3页
随着数字信号处理器主频的不断提高,其中的运算单元已由单层流水线结构向多层流水线结构变迁。但随之带来了访问内存时出现等待周期的问题。文章提出了读写分层及硬件写回缓冲的设计,消除了访存单元等待周期,使访存单元获得100%的工作... 随着数字信号处理器主频的不断提高,其中的运算单元已由单层流水线结构向多层流水线结构变迁。但随之带来了访问内存时出现等待周期的问题。文章提出了读写分层及硬件写回缓冲的设计,消除了访存单元等待周期,使访存单元获得100%的工作效率。 展开更多
关键词 数字信号处理器 内存控制单元 写回缓冲 读写操作
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部