基于CUDA的任意非结构化LDPC码的高吞吐量并行译码设计与实现

Design and implementation of high through put parallel decoding of any unstructured LDPC code based on CUDA

下载PDF

导出

摘要由于非结构化的低密度奇偶校验码(LDPC)具有更优异的纠错性能而受到广泛关注,但其非零元素分布较不规律且没有循环或准循环的子矩阵的构造方式,增加了译码器实现的设计难度.本文提出了基于CUDA的译码器设计,用于支持任意非结构化LDPC码的高吞吐量并行译码.利用校验矩阵压缩重排、优化信息存储等手段,设计实现GPU上高效的并行译码内核进行多帧译码.在GTX1660Ti GPU平台上的结果表明,基于TPMP流程的LLR-BP和NMSA译码内核设计吞吐量可分别达到78.88~360.25 Mbps和174.38~1323.75 Mbps,实现了面向任意非结构化LDPC码的高效并行译码. Unstructured low-density parity-check(LDPC)code,which have better error correction performance,has received widespread attention.However,its irregular distribution of non-zero elements with no cyclic or quasi-cyclic structure in sub-matrix increases the complexity of the decoder implementation.Based on CUDA,a LDPC decoder design is proposedto support high throughput parallel decoding for any unstructured LDPC code.By means of compression and rearrangement of LDPC check matrix and optimization of message storage,an efficient parallel decoding kernel on GPU is designed and implemented for multi-frame decoding.The results on GTX1660Ti GPU platform show that the throughput of LLR-BP and NMSA decoding kernels based on TPMP schedule can achieve 78.88~360.25Mbps and 174.38~1323.75 Mbps,realizing efficient parallel decoding for any unstructured LDPC codes.

作者王若天沙金 WANG Ruotian;SHA Jin(Electronic Science and Engineering School,Nanjing University,Nanjing 210023,China)

机构地区南京大学电子科学与工程学院

出处《微电子学与计算机》 2022年第1期54-61,共8页 Microelectronics & Computer

基金国家自然科学基金(61370040) 江苏省重点研发计划(BE2017153)。

关键词低密度奇偶校验码(LDPC) 非结构化LDPC 置信度传播算法统一计算设备架构异构计算 Low-Density Parity-Check(LDPC) unstructured LDPC belief propagation(BP)algorithm CUDA heterogeneous computing

分类号 TP911.2 [自动化与计算机技术]

引文网络
相关文献

参考文献1

1任计林,车书玲,郑征.规则LDPC码在GPU上的加速译码[J].西安电子科技大学学报,2017,44(3):25-30. 被引量：3

共引文献2

1孔飞跃,蒋学芹,万雪芬,陈思井,崔剑,杨义.基于GPU的LDPC增强准最大似然译码器并行实现[J].计算机工程,2020,46(5):207-215. 被引量：4
2徐启迪,刘争红,郑霖.基于GPU的低密度奇偶校验码译码加速技术[J].计算机应用,2022,42(12):3841-3846.

1张超,何卫锋.面向NAND闪存的高能效LDPC译码器结构设计[J].现代计算机,2021,27(17):75-80.
2ZoRRo(文/图).以技术驱动生态,构建全新数智生活记2021 OPPO开发者大会[J].微型计算机,2021,41(32):28-29.
3构建全新数智生活直击2021 OPPO开发者大会[J].数字家庭,2021(11):24-25.
4倪永婧,郭巍,张静涛.权重优化的短码长LDPC译码器[J].无线电工程,2021,51(7):557-562. 被引量：1
5郭兆宏,何术,李强.用户反映无线网慢的故障排查[J].网络安全和信息化,2021(8):161-163.
6郭兆宏,何术,李强.某信息点只能设为100 Mbps的故障[J].网络安全和信息化,2021(7):161-163.
7宁成明,蔡恒雨,郑启龙,耿锐.HXDSP异构计算框架的设计与优化[J].小型微型计算机系统,2022,43(1):179-185. 被引量：4
8孙梧雨,刘杰,徐园,蒲永材,李竞择.国产大容量eMMC芯片的数据记录系统设计[J].单片机与嵌入式系统应用,2022,22(2):60-63. 被引量：3
9王洋,崔健,廖希,曾彦志,张杰.基于信号检测的光无线轨道角动量复用系统研究[J].电子与信息学报,2021,43(11):3156-3165. 被引量：2
10肖骁,吴学智,隗小斐.基于LDPC码的水声扩频通信性能仿真[J].舰船电子工程,2021,41(8):155-158. 被引量：1

微电子学与计算机

2022年第1期

浏览历史

内容加载中请稍等...

基于CUDA的任意非结构化LDPC码的高吞吐量并行译码设计与实现

参考文献1

共引文献2

相关作者

相关机构

相关主题

浏览历史