基于新型非易失性存储器和存内计算架构的神经网络推理芯片在功耗、速度和存储密度等方面展现出突出的优势,使其在物联网和边缘计算等应用领域受到广泛关注.在本文中,我们详细介绍了一款基于可编程线性忆阻器(programmable linear rando...基于新型非易失性存储器和存内计算架构的神经网络推理芯片在功耗、速度和存储密度等方面展现出突出的优势,使其在物联网和边缘计算等应用领域受到广泛关注.在本文中,我们详细介绍了一款基于可编程线性忆阻器(programmable linear random-access memory, PLRAM)的存算一体化片上系统芯片的设计和实现方法.为了在资源受限条件下实现高效的推理计算,该系统结合了器件、电路和系统层面的一系列新技术,包括具备每单元7比特存储能力的新器件、数据自适应写入、电路失配补偿,以及基于残差模型训练的模型部署技术.这些新技术帮助该系统实现优越的整体性能,使其具有紧凑的外观尺寸,超过10 TOPS/W的能效和接近95%的计算精度,并被成功应用于一款低功耗、低成本的语音多关键词识别产品.展开更多