期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
Design and implementation of dual-mode configurable memory architecture for CNN accelerator
1
作者 山蕊 LI Xiaoshuo +1 位作者 GAO Xu HUO Ziqing 《High Technology Letters》 EI CAS 2024年第2期211-220,共10页
With the rapid development of deep learning algorithms,the computational complexity and functional diversity are increasing rapidly.However,the gap between high computational density and insufficient memory bandwidth ... With the rapid development of deep learning algorithms,the computational complexity and functional diversity are increasing rapidly.However,the gap between high computational density and insufficient memory bandwidth under the traditional von Neumann architecture is getting worse.Analyzing the algorithmic characteristics of convolutional neural network(CNN),it is found that the access characteristics of convolution(CONV)and fully connected(FC)operations are very different.Based on this feature,a dual-mode reronfigurable distributed memory architecture for CNN accelerator is designed.It can be configured in Bank mode or first input first output(FIFO)mode to accommodate the access needs of different operations.At the same time,a programmable memory control unit is designed,which can effectively control the dual-mode configurable distributed memory architecture by using customized special accessing instructions and reduce the data accessing delay.The proposed architecture is verified and tested by parallel implementation of some CNN algorithms.The experimental results show that the peak bandwidth can reach 13.44 GB·s^(-1)at an operating frequency of 120 MHz.This work can achieve 1.40,1.12,2.80 and 4.70 times the peak bandwidth compared with the existing work. 展开更多
关键词 distributed memory structure neural network accelerator reconfigurable arrayprocessor configurable memory structure
下载PDF
基于System Verilog的可重用验证平台 被引量:7
2
作者 山蕊 蒋林 李涛 《电子技术应用》 北大核心 2013年第5期128-131,共4页
采用System Verilog语言设计了一种具有层次化结构的可重用验证平台,该平台能够产生各种随机、定向、错误测试向量,并提供功能覆盖率计算。将验证平台在Synopsys公司的VCS仿真工具上运行,并应用到包交换芯片的仿真验证中。仿真结果显示... 采用System Verilog语言设计了一种具有层次化结构的可重用验证平台,该平台能够产生各种随机、定向、错误测试向量,并提供功能覆盖率计算。将验证平台在Synopsys公司的VCS仿真工具上运行,并应用到包交换芯片的仿真验证中。仿真结果显示,新设计的验证平台能通过修改随机信号约束条件和产生随机信号的权重值,使芯片的功能覆盖率达到100%。 展开更多
关键词 SYSTEM VERILOG 验证 层次化 可重用
下载PDF
一种通用片上网络适配器的设计与实现 被引量:5
3
作者 山蕊 蒋林 李平 《微电子学与计算机》 CSCD 北大核心 2011年第3期161-164,共4页
随着片上网络的结构和方法的提出,迫切需要一种接口电路来实现处理器,计算单元或者IP核与片上网络之间的通信.文中研究了不同时钟域之间进行数据传送的通信协议,详述了一种应用于片上网络的通用网络适配器的设计方法,并在Altera的strati... 随着片上网络的结构和方法的提出,迫切需要一种接口电路来实现处理器,计算单元或者IP核与片上网络之间的通信.文中研究了不同时钟域之间进行数据传送的通信协议,详述了一种应用于片上网络的通用网络适配器的设计方法,并在Altera的stratixⅢ系列FPGA开发板上进行了验证. 展开更多
关键词 片上网络 网络适配器 FPGA 异步电路
下载PDF
动态可重构阵列处理器数据流处理单元的设计与实现 被引量:3
4
作者 山蕊 李涛 蒋林 《微电子学与计算机》 CSCD 北大核心 2017年第1期106-109,共4页
阵列处理器是一种满足高效能需求、适应未来工艺发展的并行计算结构.基于动态可重构阵列处理器架构,提出了一种基于数据流驱动的处理单元高效硬件实现结构,并完成了四抽头低通滤波器的电路映射及仿真,最后基于Xilinx V6开发板的综合结... 阵列处理器是一种满足高效能需求、适应未来工艺发展的并行计算结构.基于动态可重构阵列处理器架构,提出了一种基于数据流驱动的处理单元高效硬件实现结构,并完成了四抽头低通滤波器的电路映射及仿真,最后基于Xilinx V6开发板的综合结果进行了性能分析. 展开更多
关键词 阵列处理器 动态可重构 数据流 并行计算
下载PDF
平方根升余弦滤波器的设计与FPGA实现 被引量:5
5
作者 山蕊 蒋林 杜慧敏 《西安邮电学院学报》 2011年第3期30-33,共4页
为了提高平方根升余弦滤波器的性能,采用FPGA技术,基于CSD编码和分布式计算两种算法,分别提出相应的硬件电路设计,并在QuartusII综合器中进行综合。结果显示采用分布式计算算法实现的平方根升余弦滤波器性能优于CSD编码方式。
关键词 平方根升余弦滤波器 CSD编码 分布式算法 FPGA
下载PDF
一种低延时片上网络路由器的设计与实现
6
作者 山蕊 蒋林 +1 位作者 杜慧敏 邓军勇 《电子设计工程》 2013年第10期51-54,58,共5页
通过分析流水线结构和单周期结构的片上网络路由器,提出了一种低延时片上网络路由器的设计,并在SMIC0.13um Mixed-signal/RF 1.2V/3.3V工艺进行流片验证。芯片测试结果表明,该路由器可以在300 MHz时钟频率下工作,并且在相同负载下,与其... 通过分析流水线结构和单周期结构的片上网络路由器,提出了一种低延时片上网络路由器的设计,并在SMIC0.13um Mixed-signal/RF 1.2V/3.3V工艺进行流片验证。芯片测试结果表明,该路由器可以在300 MHz时钟频率下工作,并且在相同负载下,与其他结构的路由器相比较,其能够在较低延时下完成数据包传送功能。 展开更多
关键词 片上网络 路由器 FPGA ASIC 低延迟
下载PDF
MIGPU-9多核交互式图形处理器的设计 被引量:11
7
作者 邓军勇 李涛 +8 位作者 蒋林 韩俊刚 杜慧敏 沈绪榜 黄光新 常立博 山蕊 黄虎才 马栋 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第9期1468-1478,共11页
鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理... 鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理器VSP、双模式的剪裁投影处理器PCPTC,以及数个像素染色处理器PSP等共计9个微处理器核;MIGPU-9将这9个具有不同功能和不同结构的微处理器核以及各种专用加速电路以双轨握手的流水线形式集成到一块XC6VLX550T FPGA上,实现了图形处理任务在不同处理器核及专用电路上的并行计算.测试结果表明,MIGPU-9支持OpenGL2.0和DirectDraw,像素填充率最高可达40 M/s,电路规模超过527万门. 展开更多
关键词 多核染色器 图形处理器 硬件流水线 操作并行
下载PDF
可重构视频阵列处理器簇内存储结构设计与实现 被引量:2
8
作者 郭佳乐 蒋林 +2 位作者 山蕊 崔朋飞 武鑫 《微电子学与计算机》 CSCD 北大核心 2017年第9期116-120,125,共6页
提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率20... 提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率200 MHz,访存峰值带宽6.25GB/s.最后对8×8二维离散余弦变换算法进行映射实现和性能比较发现,簇内存储结构能够为该算法提供312.2Msamples/s的数据访存带宽,相较于同类型阵列结构,执行周期数降低了31.67%,工作频率提高了一倍,访存带宽增加了192.60%. 展开更多
关键词 阵列处理器 存储结构 并行存储 视频编解码
下载PDF
Design and implementation of instruction-driven and data-driven self-reconfigurable cell array
9
作者 山蕊 XIA Xinyuan +3 位作者 YANG Kun CUI Xinyue LIAO Wang GAO Xu 《High Technology Letters》 EI CAS 2023年第1期31-40,共10页
The reconfigurable chip,which integrates the advantages of high performance,high flexibility,high parallelism,low power consumption,and low cost,has achieved rapid development and wide application.Generally,the contro... The reconfigurable chip,which integrates the advantages of high performance,high flexibility,high parallelism,low power consumption,and low cost,has achieved rapid development and wide application.Generally,the control part and the computing part of algorithm is accelerated based on different reconfigurable architectures,but it is difficult to obtain overall performance improvement.For improving efficiency of reconfigurable structure both for the control part and the computing part,a hybrid of instruction-driven and data-driven self-reconfigurable cell array is proposed.On instruction-driven mode,processing element(PE)works like a reduced instruction set computer(RSIC)machine,which is mainly for the control part of algorithm.On data-driven mode,data is calculated by flowing between the preconfigured PEs,which is mainly for the computing of algorithm.For verifying the efficiency of architecture,some high-efficiency video coding(HEVC)video compression algorithms are implemented on the proposed architecture.The proposed architecture has been implemented on Xilinx FPGA Virtex UltraScale VU440 develop board.The same circuitry is able to run at75 MHz.Compared with the architecture that only supports instruction-driven,the proposed architecture has better calculation efficiency. 展开更多
关键词 cell array configurable computing DATA-DRIVEN instruction-driven
下载PDF
视频阵列处理器数据访存电路的设计与实现
10
作者 宋辉 蒋林 +2 位作者 山蕊 郭佳乐 李雪婷 《微电子学与计算机》 CSCD 北大核心 2017年第2期83-86,共4页
为了降低远程数据访问延迟,提高并行度,针对视频阵列处理器设计了一种远程数据访存电路,通过网络适配器将阵列处理器与路由网络相连实现远程数据的访存.通过Xilinx的ZC706系列FPGA开发板测试表明:该数据访存电路显著提高了远程数据的传... 为了降低远程数据访问延迟,提高并行度,针对视频阵列处理器设计了一种远程数据访存电路,通过网络适配器将阵列处理器与路由网络相连实现远程数据的访存.通过Xilinx的ZC706系列FPGA开发板测试表明:该数据访存电路显著提高了远程数据的传送效率,并且与Intel 80核处理器的2D Mesh网络相比,可以降低1/3的通信延迟. 展开更多
关键词 视频阵列处理器 适配器 路由器 片上网络 现场可编程门阵列
下载PDF
视频阵列处理器HEVC去块滤波算法动态重构实现
11
作者 夏馨缘 山蕊 +2 位作者 杨坤 崔馨月 姬申涛 《计算机工程与设计》 北大核心 2023年第3期836-844,共9页
去块滤波算法是高效视频编码标准(high-efficiency video coding,HEVC)的重要组成部分,专用硬件实现的去块滤波电路结构难以满足不断革新的算法需求,可重构计算兼具计算高效性和编程灵活性成为研究热点。基于指令流与数据流混合驱动可... 去块滤波算法是高效视频编码标准(high-efficiency video coding,HEVC)的重要组成部分,专用硬件实现的去块滤波电路结构难以满足不断革新的算法需求,可重构计算兼具计算高效性和编程灵活性成为研究热点。基于指令流与数据流混合驱动可重构视频阵列处理器(reconfigurable video array processor,RVAP),提出一种可重构的HEVC编码去块滤波电路的并行化实现方法,依据数据流图分析实现去块滤波算法的最大化并行,提高计算效率;通过强/弱滤波方式的灵活切换,提高计算资源利用率。实验结果表明,所提方法在满足算法灵活切换和计算速度要求的同时,硬件资源减少了47.6%,时钟频率达167 MHz。 展开更多
关键词 动态可重构 阵列处理器 高效视频编码 去块滤波 并行映射 混合驱动 资源利用率
下载PDF
阵列处理器动态可配置分布式存储访问结构设计
12
作者 张园 刘有耀 山蕊 《现代电子技术》 2021年第12期11-15,共5页
为了提高可重构阵列处理器的灵活性,打破传统片上互连的单一性。基于可重构阵列处理器分布式存储结构,提出一种动态可配置分布式存储访问结构。该结构可动态地将簇内4×4个PE独立地配置为本地访问模式、局部访问模式和全局访问模式... 为了提高可重构阵列处理器的灵活性,打破传统片上互连的单一性。基于可重构阵列处理器分布式存储结构,提出一种动态可配置分布式存储访问结构。该结构可动态地将簇内4×4个PE独立地配置为本地访问模式、局部访问模式和全局访问模式,实现簇内4×4个PE对4×4个MB的并行访问。选用Xilinx公司的ZYNQ系列芯片XC7Z045 FFG900⁃2进行FPGA仿真。实验结果表明,该结构在无冲突访问模式下最高频率可达212.354 MHz,访问峰值带宽为7.125 GB/s。 展开更多
关键词 阵列处理器 存储结构 分布式存储 访问模式 并行访问 实时动态配置
下载PDF
PTN芯片中IP组播查找电路的设计与实现
13
作者 刘昊 山蕊 《光通信研究》 北大核心 2013年第5期34-36,共3页
网络数据量的急剧增加,带来了带宽的急剧消耗和网络拥挤问题,这些问题对分组传输网络芯片的转发容量、速率、拥塞避免和流量管理等方面提出了更高的要求。为了提高分组传输网络芯片中IP组播查找电路的工作速率和降低电路设计复杂度,采... 网络数据量的急剧增加,带来了带宽的急剧消耗和网络拥挤问题,这些问题对分组传输网络芯片的转发容量、速率、拥塞避免和流量管理等方面提出了更高的要求。为了提高分组传输网络芯片中IP组播查找电路的工作速率和降低电路设计复杂度,采用流水线结构,并利用RAM(随机访问存储器)记录查找中间状态信息等技术完成了对IP组播查找电路的设计。在Altera系列FPGA(现场可编程门阵列)开发板EP4SGX230KF40C2ES上进行了硬件验证,结果表明,该电路能够完成IP组播查找功能,并稳定工作在200MHz频率下。 展开更多
关键词 分组传输网络 IP组播 查找
下载PDF
视觉阵列处理器超越函数加速单元设计 被引量:1
14
作者 山蕊 李涛 +3 位作者 蒋林 邓军勇 杨博文 沈绪榜 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2018年第4期166-173,共8页
由于在计算机视觉算法中涉及大量超越函数的运算,为了加快算法在视觉阵列处理器上的运行速度,满足视觉应用的实时性需求,提出了一种调整截距分段线性逼近算法,并基于此设计了一种定点运算系统和对数运算系统混合的超越函数硬件流水线结... 由于在计算机视觉算法中涉及大量超越函数的运算,为了加快算法在视觉阵列处理器上的运行速度,满足视觉应用的实时性需求,提出了一种调整截距分段线性逼近算法,并基于此设计了一种定点运算系统和对数运算系统混合的超越函数硬件流水线结构.新算法实现了正余弦函数的近似计算,并通过对数/指数计算转换、采用对数运算系统实现了反正切、开平方根、指数运算、对数运算等超越函数的计算.通过数百个随机数据的仿真验证,表明该结构可有效地降低计算误差,提高吞吐率.基于SMIC 0.13μm CMOS集成电路工艺对混合计算系统进行了综合,电路工作频率达200MHz. 展开更多
关键词 视觉阵列处理器 超越函数 定点数运算 对数运算系统 流水线
下载PDF
Design of a clustered data-driven array processor for computer vision 被引量:2
15
作者 山蕊 Deng Junyong +3 位作者 Jiang Lin Zhu Yun Wu Haoyue He Feilong 《High Technology Letters》 EI CAS 2020年第4期424-434,共11页
Computer vision(CV)is widely expected to be the next big thing in emerging applications.So many heterogeneous architectures for computer vision emerge.However,plenty of data need to be transferred between different st... Computer vision(CV)is widely expected to be the next big thing in emerging applications.So many heterogeneous architectures for computer vision emerge.However,plenty of data need to be transferred between different structures for heterogeneous architecture.The long data transfer delay becomes the mainly problem to limit the processing speed for computer vision applications.For reducing data transfer delay and fasting computer vision applications,a clustered data-driven array processor is proposed.A three-level pipelining processing element is designed which supports two-buffer data flow interface and 8 bits,16 bits,32 bits subtext parallel computation.At the same time,for accelerating transcendental function computation,a four-way shared pipelining transcendental function accelerator is designed,which is based on Y-intercept adjusted piecewise linear segment algorithm.A distributed shared memory structure based on unified addressing is also employed.To verify efficiency of architecture,some image processing algorithms are implemented on proposed architecture.Simultaneously the proposed architecture has been implemented on Xilinx ZC 706 development board.The same circuitry has been synthesized using SMIC 130 nm CMOS technology.The circuitry is able to run at 100 MHz.Area is 26.58 mm2. 展开更多
关键词 array processor DATA-DRIVEN adjacent interconnection distributed memory computer vision(CV)
下载PDF
Design and implementation of near-memory computing array architecture based on shared buffer 被引量:1
16
作者 山蕊 GAO Xu +3 位作者 FENG Yani HUI Chao CUI Xinyue CHAI Miaomiao 《High Technology Letters》 EI CAS 2022年第4期345-353,共9页
Deep learning algorithms have been widely used in computer vision,natural language processing and other fields.However,due to the ever-increasing scale of the deep learning model,the requirements for storage and compu... Deep learning algorithms have been widely used in computer vision,natural language processing and other fields.However,due to the ever-increasing scale of the deep learning model,the requirements for storage and computing performance are getting higher and higher,and the processors based on the von Neumann architecture have gradually exposed significant shortcomings such as consumption and long latency.In order to alleviate this problem,large-scale processing systems are shifting from a traditional computing-centric model to a data-centric model.A near-memory computing array architecture based on the shared buffer is proposed in this paper to improve system performance,which supports instructions with the characteristics of store-calculation integration,reducing the data movement between the processor and main memory.Through data reuse,the processing speed of the algorithm is further improved.The proposed architecture is verified and tested through the parallel realization of the convolutional neural network(CNN)algorithm.The experimental results show that at the frequency of 110 MHz,the calculation speed of a single convolution operation is increased by 66.64%on average compared with the CNN architecture that performs parallel calculations on field programmable gate array(FPGA).The processing speed of the whole convolution layer is improved by 8.81%compared with the reconfigurable array processor that does not support near-memory computing. 展开更多
关键词 near-memory computing shared buffer reconfigurable array processor convolutional neural network(CNN)
下载PDF
基于阵列处理器的最小均方误差检测算法并行设计与实现 被引量:2
17
作者 刘帅 蒋林 +3 位作者 李远成 山蕊 朱育琳 王欣 《计算机应用》 CSCD 北大核心 2022年第5期1524-1530,共7页
针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较... 针对大规模多输入多输出(MIMO)系统中,最小均方误差(MMSE)检测算法在可重构阵列结构上适应性差、计算复杂度高和运算效率低的问题,基于项目组开发的可重构阵列处理器,提出了一种基于MMSE算法的并行映射方法。首先,利用Gram矩阵计算时较为简单的数据依赖关系,设计时间上和空间上可以高度并行的流水线加速方案;其次,根据MMSE算法中Gram矩阵计算和匹配滤波计算模块相对独立的特点,设计模块化并行映射方案;最后,基于Xilinx Virtex-6开发板对映射方案进行实现并统计其性能。实验结果表明,该方法在MIMO规模为128×4、128×8和128×16的正交相移键控(QPSK)上行链路中,加速比分别2.80、4.04和5.57;在128×16的大规模MIMO系统中,可重构阵列处理器比专用硬件减少了42.6%的资源消耗。 展开更多
关键词 大规模多输入多输出 最小均方误差算法 并行映射 阵列处理器 可重构
下载PDF
自适应二进制算术编码的动态可重构实现研究 被引量:2
18
作者 刘尧 蒋林 +1 位作者 李远成 山蕊 《电子测量技术》 北大核心 2022年第19期50-55,共6页
针对H.266/VVC视频编码标准下的上下文自适应二进制算术编码器编码速度慢、资源开销大的问题,面向可重构结构依据算法的内在并行特性优化了编码架构,并基于动态可重构阵列处理器设计实现了CABAC编码器常规编码模式下的并行映射方法,阵... 针对H.266/VVC视频编码标准下的上下文自适应二进制算术编码器编码速度慢、资源开销大的问题,面向可重构结构依据算法的内在并行特性优化了编码架构,并基于动态可重构阵列处理器设计实现了CABAC编码器常规编码模式下的并行映射方法,阵列结构能够根据编码输入对优化后的算法进行动态重构,在避免专用硬件编码器较高的资源开销情况下利用软件重构的方法实现熵编码过程,保证编码准确性的同时提高了视频数据流编码效率,为此类运算密集型算法的硬件实现提供了更为灵活高效的参考途径。仿真结果表明,映射实现的编码过程中每个编码周期完成5个二进制序列的编码,平均编码效率达到384.13 Mbin/s。基于FPGA的测试结果表明,软件重构方法与专用硬件实现的编码器相比,资源开销降低且编码效率提升5.47%,与同类型可重构视频编码结构相比,编码效率提升7.03%。 展开更多
关键词 可重构计算 自适应二进制算术编码 并行映射 阵列处理器 熵编码
下载PDF
可重构视频阵列处理器测试平台设计与实现 被引量:7
19
作者 蒋林 贺飞龙 +3 位作者 山蕊 王帅 吴皓月 武鑫 《系统仿真学报》 CAS CSCD 北大核心 2020年第5期792-800,共9页
针对可重构视频阵列处理器的设计要求及传统测试方法测试视频编解码系统时速度慢、精度低和可观测性不强的问题。开发了基于Qt的用户界面,设计实现了以现场可编程门阵列(Field programmable gate-array,FPGA)为核心的软硬件协同测试平... 针对可重构视频阵列处理器的设计要求及传统测试方法测试视频编解码系统时速度慢、精度低和可观测性不强的问题。开发了基于Qt的用户界面,设计实现了以现场可编程门阵列(Field programmable gate-array,FPGA)为核心的软硬件协同测试平台。在PC端实现以软件仿真为基础的数据传输与图像重现,在FPGA端实现以可重构视频阵列处理器为基础的视频编解码算法并行映射。实验结果表明,在工作频率为100 MHz时,FPGA与PC之间可正确传输数据并满足算法测试时不同测试用例的更换需求,具有较好的可观测性。 展开更多
关键词 测试平台 软硬件协同 用户界面 视频编解码 可重构视频阵列处理器
下载PDF
视频阵列处理器多层次分布式存储结构设计 被引量:4
20
作者 蒋林 崔朋飞 +2 位作者 山蕊 武鑫 田汝佳 《计算机工程与应用》 CSCD 北大核心 2018年第12期57-62,共6页
随着视频编解码标准的不断演进,算法处理的数据量也随之剧增。多核结构并行化处理技术在提升算法计算速度的同时,使得存储结构成为了整个编解码系统性能的瓶颈。针对视频编解码算法访存的局部性、各算法之间数据交互频繁性、算法内部大... 随着视频编解码标准的不断演进,算法处理的数据量也随之剧增。多核结构并行化处理技术在提升算法计算速度的同时,使得存储结构成为了整个编解码系统性能的瓶颈。针对视频编解码算法访存的局部性、各算法之间数据交互频繁性、算法内部大量临时数据不交互性的特点,设计并实现了由私有存储层和共享存储层构成的多层次分布式存储结构。通过Xilinx公司的Virtex-6系列xc6vlx550T开发板对设计进行测试,实验结果表明,该结构在保持简洁性和可扩展性的同时,最高可提供9.73 GB/s的访存带宽,能够满足视频编解码算法数据访存的需求。 展开更多
关键词 视频阵列处理器 分布式存储结构 目录协议 高速缓存 层次化
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部