文章提出一种在片上系统(System on Chip,SoC)实现高吞吐率的有限状态熵编码(finite state entropy,FSE)算法。通过压缩率、速度、资源消耗、功耗4个方面对所提出的编码器和解码器与典型的硬件哈夫曼编码(Huffman coding,HC)进行性能比...文章提出一种在片上系统(System on Chip,SoC)实现高吞吐率的有限状态熵编码(finite state entropy,FSE)算法。通过压缩率、速度、资源消耗、功耗4个方面对所提出的编码器和解码器与典型的硬件哈夫曼编码(Huffman coding,HC)进行性能比较,结果表明,所提出的硬件FSE编码器和解码器具有显著优势。硬件FSE(hFSE)架构实现在SoC的处理系统和可编程逻辑块(programmable logic,PL)上,通过高级可扩展接口(Advanced eXtensible Interface 4,AXI4)总线连接SoC的处理系统和可编程逻辑块。算法测试显示,FSE算法在非均匀数据分布和大数据量情况下,具有更好的压缩率。该文设计的编码器和解码器已在可编程逻辑块上实现,其中包括1个可配置的缓冲模块,将比特流作为单字节或双字节配置输出到8 bit位宽4096深度或16 bit位宽2048深度的块随机访问存储器(block random access memory,BRAM)中。所提出的FSE硬件架构为实时压缩应用提供了高吞吐率、低功耗和低资源消耗的硬件实现。展开更多
计算机科学技术日新月异的发展,对存储器的集成度、读写速度、可靠性等方面提出了更高的要求.在这种形势下,一些传统存储器的缺陷逐步暴露出来,需要新一代存储器适应技术的发展和要求.与传统的存储器相比,磁阻式随机访问存储器(magnetic...计算机科学技术日新月异的发展,对存储器的集成度、读写速度、可靠性等方面提出了更高的要求.在这种形势下,一些传统存储器的缺陷逐步暴露出来,需要新一代存储器适应技术的发展和要求.与传统的存储器相比,磁阻式随机访问存储器(magnetic random access memory,MRAM)具有更好的性能,它同时具备静态随机访问存储器(static random access memory,SRAM)的高速读写性能、动态随机访问存储器(dynamic random access memory,DRAM)的高集成度与Flash存储器的非易失性等优点.为了研究MRAM用作主存时的各项性能,进一步探究MRAM作为DRAM主存替代品的可能性,根据MRAM的原理以及特点,设计并实现了一个MRAM仿真系统,由trace发生器、MRAM控制器和MRAM存储体3部分组成.MRAM仿真系统接收来自处理器(CPU)对主存的读写请求,并根据设计的地址映射算法,对请求进行调度,完成对MRAM存储器的读写请求.仿真结果表明,用MRAM做主存能够发挥出MRAM的优势,获得良好的请求响应时间、请求带宽等性能.展开更多
人工智能与物联网时代,大数据模型驱动的应用场景和计算任务层出不穷,极大促进了国家数字化发展.然而,传统冯·诺依曼(John von Neumann)体系架构的硬件系统由于存算分离的结构特点导致存储墙瓶颈,在数据密集型应用中消耗了大量的...人工智能与物联网时代,大数据模型驱动的应用场景和计算任务层出不穷,极大促进了国家数字化发展.然而,传统冯·诺依曼(John von Neumann)体系架构的硬件系统由于存算分离的结构特点导致存储墙瓶颈,在数据密集型应用中消耗了大量的数据搬运成本,抑制了能效性能提升.存算一体技术是后摩尔(Moore)时代背离传统架构系统的新型计算范式,利用存储单元器件、电路内在特性,将基本的计算逻辑任务融入存储单元之中,从而消除数据搬运开销,有望实现智能计算硬件平台能效性能的显著提升.本文以契合存算一体技术的存储器件电路为切入点,概述基于传统互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)和新型非易失存储器件代表铁电晶体管的存算一体电路,并从器件、架构芯片、算法应用等层次讨论存算一体电路的跨层次协同设计优化方法.展开更多
文摘文章提出一种在片上系统(System on Chip,SoC)实现高吞吐率的有限状态熵编码(finite state entropy,FSE)算法。通过压缩率、速度、资源消耗、功耗4个方面对所提出的编码器和解码器与典型的硬件哈夫曼编码(Huffman coding,HC)进行性能比较,结果表明,所提出的硬件FSE编码器和解码器具有显著优势。硬件FSE(hFSE)架构实现在SoC的处理系统和可编程逻辑块(programmable logic,PL)上,通过高级可扩展接口(Advanced eXtensible Interface 4,AXI4)总线连接SoC的处理系统和可编程逻辑块。算法测试显示,FSE算法在非均匀数据分布和大数据量情况下,具有更好的压缩率。该文设计的编码器和解码器已在可编程逻辑块上实现,其中包括1个可配置的缓冲模块,将比特流作为单字节或双字节配置输出到8 bit位宽4096深度或16 bit位宽2048深度的块随机访问存储器(block random access memory,BRAM)中。所提出的FSE硬件架构为实时压缩应用提供了高吞吐率、低功耗和低资源消耗的硬件实现。
文摘计算机科学技术日新月异的发展,对存储器的集成度、读写速度、可靠性等方面提出了更高的要求.在这种形势下,一些传统存储器的缺陷逐步暴露出来,需要新一代存储器适应技术的发展和要求.与传统的存储器相比,磁阻式随机访问存储器(magnetic random access memory,MRAM)具有更好的性能,它同时具备静态随机访问存储器(static random access memory,SRAM)的高速读写性能、动态随机访问存储器(dynamic random access memory,DRAM)的高集成度与Flash存储器的非易失性等优点.为了研究MRAM用作主存时的各项性能,进一步探究MRAM作为DRAM主存替代品的可能性,根据MRAM的原理以及特点,设计并实现了一个MRAM仿真系统,由trace发生器、MRAM控制器和MRAM存储体3部分组成.MRAM仿真系统接收来自处理器(CPU)对主存的读写请求,并根据设计的地址映射算法,对请求进行调度,完成对MRAM存储器的读写请求.仿真结果表明,用MRAM做主存能够发挥出MRAM的优势,获得良好的请求响应时间、请求带宽等性能.
文摘人工智能与物联网时代,大数据模型驱动的应用场景和计算任务层出不穷,极大促进了国家数字化发展.然而,传统冯·诺依曼(John von Neumann)体系架构的硬件系统由于存算分离的结构特点导致存储墙瓶颈,在数据密集型应用中消耗了大量的数据搬运成本,抑制了能效性能提升.存算一体技术是后摩尔(Moore)时代背离传统架构系统的新型计算范式,利用存储单元器件、电路内在特性,将基本的计算逻辑任务融入存储单元之中,从而消除数据搬运开销,有望实现智能计算硬件平台能效性能的显著提升.本文以契合存算一体技术的存储器件电路为切入点,概述基于传统互补金属氧化物半导体(complementary metal oxide semiconductor,CMOS)和新型非易失存储器件代表铁电晶体管的存算一体电路,并从器件、架构芯片、算法应用等层次讨论存算一体电路的跨层次协同设计优化方法.