期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
Energy-efficient reconfigurable processor for QC-LDPC via adaptive coding-voltage-frequency tuning
1
作者 Chang Libo Hu Yiqing +1 位作者 Du Huimin Wang Jihe 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2024年第2期72-84,共13页
To apply a quasi-cyclic low density parity check(QC-LDPC)to different scenarios,a data-stream driven pipelined macro instruction set and a reconfigurable processor architecture are proposed for the typical QC-LDPC alg... To apply a quasi-cyclic low density parity check(QC-LDPC)to different scenarios,a data-stream driven pipelined macro instruction set and a reconfigurable processor architecture are proposed for the typical QC-LDPC algorithm.The data-level parallelism is improved by instructions to dynamically configure the multi-core computing units.Simultaneously,an intelligent adjustment strategy based on a programmable wake-up controller(WuC)is designed so that the computing mode,operating voltage,and frequency of the QC-LDPC algorithm can be adjusted.This adjustment can improve the computing efficiency of the processor.The QC-LDPC processors are verified on the Xilinx ZCU102 field programmable gate array(FPGA)board and the computing efficiency is measured.The experimental results indicate that the QC-LDPC processor can support two encoding lengths of three typical QC-LDPC algorithms and 20 adaptive operating modes of operating voltage and frequency.The maximum efficiency can reach up to 12.18 Gbit/(s·W),which is more flexible than existing state-of-the-art processors for QC-LDPC. 展开更多
关键词 quasi-cyclic low density parity check(QC-LDPC) dynamic voltage and frequency scaling(DVFS) reconfigurable computing coarse-grained reconfigurable arrays(cgras)
原文传递
一种基于模拟退火的动态发射型CGRA编译方法
2
作者 杨伟东 《现代计算机》 2021年第10期29-33,40,共6页
粗粒度可重构阵列(CGRA)因为其灵活性和高能效比受到广泛关注,动态发射型CGRA提供一种更为高效的实现模式,针对其编译技术的研究可以充分发挥其计算能力。动态发射型CGRA的编译问题转化为一个关于调度的组合优化问题,使用模拟退火算法... 粗粒度可重构阵列(CGRA)因为其灵活性和高能效比受到广泛关注,动态发射型CGRA提供一种更为高效的实现模式,针对其编译技术的研究可以充分发挥其计算能力。动态发射型CGRA的编译问题转化为一个关于调度的组合优化问题,使用模拟退火算法实现调度空间的产生和探索。实验结果表明,相比之前的编译技术,可以获得平均19.80%的性能提高。 展开更多
关键词 粗粒度可重构阵列 组合优化问题 模拟退火 调度空间探索
下载PDF
基于粗粒度可重构架构的并行FFT算法实现 被引量:3
3
作者 曹鹏 杨锦江 梅晨 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第6期1174-1179,共6页
为了提升并行 FFT 算法的计算性能,基于粗粒度可重构架构 REMUS_LPP(reconfigurable embedded multimedia system,low performance processor)提出了一种新的复数 FFT 实现方法.在实现 FFT 算法过程中,首先通过局部串行方式完成... 为了提升并行 FFT 算法的计算性能,基于粗粒度可重构架构 REMUS_LPP(reconfigurable embedded multimedia system,low performance processor)提出了一种新的复数 FFT 实现方法.在实现 FFT 算法过程中,首先通过局部串行方式完成低阶部分,然后交换低阶部分结果后并行执行高阶部分.针对 RCA 内和 RCA 间的数据流优化,提出了流水气泡消除技术和数据块重排技术,从而提升了算法实现性能并降低了片上存储需求.芯片实测结果表明,提出的 FFT 算法实现方法的执行速度是其他同类并行计算架构的2.15~13.60倍,片上存储减少为其他方法的7.0%~28.1%. 展开更多
关键词 粗粒度可重构架构 并行FFT算法 REMUS_LPP
下载PDF
基于存储划分和路径重用的粗粒度可重构结构循环映射算法 被引量:2
4
作者 张兴明 袁开坚 高彦钊 《电子与信息学报》 EI CSCD 北大核心 2018年第6期1520-1524,共5页
目前针对粗粒度可重构结构循环映射的研究主要集中在操作布局和临时数据路由,缺乏考虑数据映射的研究,该文提出一种基于存储划分和路径重用的模调度映射流程。首先进行细粒度的存储划分找到合适的数据映射,提高数据存取的并行性,再用模... 目前针对粗粒度可重构结构循环映射的研究主要集中在操作布局和临时数据路由,缺乏考虑数据映射的研究,该文提出一种基于存储划分和路径重用的模调度映射流程。首先进行细粒度的存储划分找到合适的数据映射,提高数据存取的并行性,再用模调度寻找操作布局和临时数据路由,最后利用构建的路由开销模型平衡存储器路由和处理单元路由的使用,引入路径重用策略优化路由资源。实验结果表明,该方法在循环的启动间隔、每周期指令数和执行延迟等方面均具有良好的性能。 展开更多
关键词 粗粒度可重构结构 循环映射 存储划分 路径重用
下载PDF
面向媒体的粗粒度可重构架构层次化存储设计
5
作者 曹鹏 梅晨 刘波 《上海交通大学学报》 EI CAS CSCD 北大核心 2014年第10期1389-1393,1399,共6页
为了优化粗粒度可重构架构REMUS-II(Reconfigurable Multimedia System 2)的数据流通路,使其能够完成高性能媒体解码,针对媒体算法的数据访问特征,对REMUS-II的片上存储与片外存储访问模块进行优化.片上存储通过二维数据传输和转置等访... 为了优化粗粒度可重构架构REMUS-II(Reconfigurable Multimedia System 2)的数据流通路,使其能够完成高性能媒体解码,针对媒体算法的数据访问特征,对REMUS-II的片上存储与片外存储访问模块进行优化.片上存储通过二维数据传输和转置等访问模式进行优化,片上数据传输效率分别平均提高了69.6%和15.1%.片外存储通过块缓存设计优化参考帧访问,平均减少37%的外存访问时间.经过层次化存储设计,REMUS-II数据流可满足计算需求,在200MHz主频下实现H.264算法和MPEG2算法高级档次的1 920像素×1 080像素高清分辨率实时解码. 展开更多
关键词 粗粒度可重构架构 媒体应用 层次化存储 高清解码
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部