基于OpenCL的Gzip数据压缩算法被引量：8

OpenCL-based optimization for Gzip algorithm

下载PDF

导出

摘要目前,数据压缩算法主要基于串行编程模型设计和实现,导致数据压缩速率较低,因而无法满足大数据分析和处理等应用的实时性需求。为了解决这个问题,以常用数据压缩算法Gzip为蓝本,提出一种实现无损数据压缩算法的专用硬件电路。首先,采用多字典并行查找的设计方案提高重复数据的查找速率;接着,采用匹配长度拼接技术提升数据的压缩效果;最后,采用开放计算语言(Open CL)实现了所提出的专用硬件电路。基于现场可编程门阵列(FPGA)进行功能验证和性能评测,结果表明:与基于串行编程模型设计和实现的数据压缩算法相比,所提出的硬件电路在取得适当压缩率的同时,显著地提高了数据的压缩速率,压缩速率可达12 Gb/s。 Data compression algorithms are usually designed and implemented by using the sequential programming model, resulting in a very low data compression speed when they are deployed on general-purpose processors, which cannot satisfy the real-time requirement of applications such as big data analytics. To address this problem, a specialized lossless data compression circuit that implemented the Gzip algorithm was proposed. First of all, a parallelized lookup structure with multiple dictionaries was designed to increase the speed of searching for repeated data. Then, a match length splicing technique was proposed to improve the compression ratio. Finally, the circuit was implemented by using Open Computing Language （OpeuCL）. Results verified on the Field-Programming Gate Array （FPGA） show that the proposed circuit can achieve moderate compression ratio and dramatically improve the data compression speed, which can be as high as 12 Gb/s.

作者赵雅倩李龙郭跃超史宏志郭振华魏士欣陈继承 ZHAO Yaqian;LI Long;GUO Yuechao;SHI Hongzhi;GUO Zhenhua;WEI Shixin;CHEN Jicheng(State Key Laboratory of High-End Server ＆ Storage Technology（lnspur Group Corporation Limited）,Beijing 100085,China)

机构地区高效能服务器和存储技术国家重点实验室(浪潮集团有限公司)

出处《计算机应用》 CSCD 北大核心 2018年第A01期112-115,130,共5页 journal of Computer Applications

关键词数据压缩开放计算语言 Gzip算法现场可编程门阵列硬件加速 data compression Open Computing Language （OpenCL） Gzip algorithm Field-Programmable Gate Array （FPGA） hardware acceleration

分类号 TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1李冰,王超凡,顾巍,董乾.Gzip压缩的硬件加速电路设计[J].电子学报,2017,45(3):540-545. 被引量：8

共引文献7

1朱嘉,刘红侠.无损高压缩率电路设计[J].西安电子科技大学学报,2019,46(2):35-40. 被引量：2
2王飞,李钊,尹晓华,雷振江,曹智,范赛龙.高速数据压缩及加密硬件加速电路研究[J].计算机与数字工程,2020,48(1):212-216. 被引量：3
3包晓安,李刚,文艺霏,李嘉钰,陈迪荣,杜鹏.基于压缩和差分算法的嵌入式平台远程更新设计与分析[J].浙江理工大学学报（自然科学版）,2020,43(4):535-541. 被引量：10
4张林.Web应用防火墙关于gzip文件的检测研究[J].电子设计工程,2020,28(19):113-117. 被引量：4
5黄海,邢琳,那宁,张国良,赵石磊,刘志伟.有限状态熵编码的VLSI设计与实现[J].计算机辅助设计与图形学学报,2021,33(4):640-648.
6尹明,孙国庆.一种ARGB数据无损压缩解压算法的FPGA设计[J].计算机测量与控制,2024,32(2):317-324.
7王雪,李文青,张婷婷,张福新,王剑,敖琪.基于紧耦合加速器的高性能Java压缩系统[J].高技术通讯,2024,34(4):386-395.

同被引文献85

1雷闪耀,梁昭峰,朱启晨.IEC101/104规约在生态小水电一体化LCU中的应用[J].微计算机信息,2006,22(02S):226-228. 被引量：6
2汤大立,熊坚.基于压缩传输组件的WebGIS海量数据传输方案[J].计算机工程与设计,2006,27(6):1048-1051. 被引量：3
3方婵婵,叶兵,吴彪.Huffman并行解码结构及硬件实现[J].合肥工业大学学报（自然科学版）,2007,30(7):854-858. 被引量：2
4刘坚,李胜乐,王子影.基于LZMA的数据库压缩存储应用研究[J].大地测量与地球动力学,2009,29(6):144-147. 被引量：10
5陈钧,刘爱华.基于Zlib的图像差异压缩算法研究与实现[J].东华理工大学学报（自然科学版）,2010,33(1):92-96. 被引量：8
6郑翠芳.几种常用无损数据压缩算法研究[J].计算机技术与发展,2011,21(9):73-76. 被引量：47
7屈志坚,郭亮,刘明光,陈秋琳,蒋俊俊.智能配电网量测信息变断面柔性压缩新算法[J].中国电机工程学报,2013,33(19):191-199. 被引量：10
8徐效宁,李一楠,李辉,宋志丹,刘德超.融合轨道电路信息的CTCS-4级列控系统研究[J].铁道工程学报,2018,35(11):82-86. 被引量：9
9张东霞,苗新,刘丽平,张焰,刘科研.智能电网大数据技术发展研究[J].中国电机工程学报,2015,35(1):2-12. 被引量：622
10杨仁忠,张洁,韦宏卫,石璐.基于GPU的Landsat8实时解压缩处理技术[J].计算机工程,2016,42(3):301-307. 被引量：2

引证文献8

1沙梦钒,徐兰梅,滕庆勇,王小林.面向互联网应用的大规模数据实时查询优化方法研究[J].软件工程,2020,23(11):17-20.
2李博,袁兴峰,李隆.一种基于GZIP的压缩与高效解压系统[J].电子设计工程,2021,29(8):48-52. 被引量：4
3王周恺,张炯,马维纲,王怀军.面向高速列车监测数据的并行解压缩算法[J].计算机应用,2021,41(9):2586-2593.
4骆元家.测绘仪器设备状态监测数据实时压缩方法[J].地理空间信息,2022,20(2):143-146. 被引量：1
5田志宇,曾庆化,许睿,宦国耀,邱文旗.机载PHM通信中的BDS优先级分包传输方法研究[J].电光与控制,2022,29(8):79-83. 被引量：3
6徐晨,顾曦华,盛银波,金军.基于流量分析的XML嵌套数据流无损压缩算法[J].信息技术,2023,47(8):130-136. 被引量：1
7屈志坚,帅诚鹏,吴广龙,梁家敏,李迪.基于遗传优化聚类的GRU无损电力监测数据压缩[J].电力系统及其自动化学报,2024,36(4):1-8.
8李世豪,曾锃,缪巍巍,夏元轶,周忠冉,张俊杰.基于云边协同的电力物联终端数据轻量化处理方法[J].计算机技术与发展,2024,34(9):23-29.

二级引证文献9

1刘胜娃,曹湘华.石油钻井作业数据远传系统设计与实现[J].电子元器件与信息技术,2021,5(12):1-2.
2孙湛冬,董松,焦娇,李伟,李志鹏,张晓龙.基于BIMBase技术的GIM模型数据轻量化方法研究[J].电力信息与通信技术,2023,21(4):9-15. 被引量：4
3赵宝,吕壮壮,王亚军,成庶.基于重载铁路的PHM平台建设方法[J].电工技术,2023(16):37-41.
4熊风光,陈霖,韩慧妍,张元,庞敏,焦世超.基于MQTT协议的轻量化文本信息分发技术研究[J].计算机技术与发展,2024,34(2):90-97. 被引量：1
5张发兴,李永宁,肖勇,杜宁,员航,吕航,秦卫鹏,李鸿翔,胡鑫钰,韩艳蓉.基于北斗三号DGNSS/RDSS/INS的高性能轻量级导弹编队基线测量方法[J].空军工程大学学报,2024,25(2):115-122.
6张恒,林江伟,唐昊.内外业协同的网络化数字测图平台研究与实现[J].城市勘测,2024(3):29-34.
7顾建兵,姚淑萍,马宁.基于DZZ5气象仪器设备维护及保障措施研究[J].自动化与仪器仪表,2024(7):60-65.
8江忠涛,肖达,卢贤玲.物联网下激光传感器节点最优通信线路选择[J].激光杂志,2024,45(9):103-107.
9赵武清,柏姗姗,李承钊,耿新,李科德.基于深度学习算法的智能网卡数据流卸载模型[J].粘接,2024,51(11):139-142.

1董骁,姜雨生,李娜.基于潜油电泵监测数据的ILZW压缩算法的研究[J].福建电脑,2018,34(4):14-16. 被引量：1
2刘怡鹏,崔磊,杨素娣.基于WiFi网络的PM2.5监控系统的设计与实现[J].淮阴师范学院学报（自然科学版）,2018,17(2):143-147.
3张航,马军.大数据平台数据压缩比和压缩效率研究[J].科技经济导刊,2018(17):33-33.
4丁方迪.新建智能变电站如何进行现场调试及提高问题查找速率[J].科技经济导刊,2017(27):103-103. 被引量：1
5何海江.基于线性分类算法的软件错误定位模型[J].计算机工程与应用,2017,53(21):42-48. 被引量：2
6Liang WANG,Zhiwen YU,Bin GUO,Fei YI,Fei XIONG.Mobile crowd sensing task optimal allocation： a mobility pattern matching perspective[J].Frontiers of Computer Science,2018,12(2):231-244. 被引量：9
7赵贺辉.基于FPGA的异构加速卡OpenCL架构研究及性能优化[J].信息与电脑,2018,30(11):30-32.
8崔方送.基于二叉树存储结构的LZW改进算法[J].太原学院学报（自然科学版）,2018,36(1):29-32. 被引量：4
9詹民民,代欣,俞经虎.基于压缩速率的琼脂凝胶力学性能研究[J].制造业自动化,2018,40(4):73-76. 被引量：3
10范欢欢,严军,赵勇,蒋莉,孟伟.基于时间相关性的差分消零数据压缩算法研究[J].电子测量技术,2018,41(12):49-52. 被引量：1

计算机应用

2018年第A01期

浏览历史

内容加载中请稍等...

基于OpenCL的Gzip数据压缩算法被引量：8

参考文献1

共引文献7

同被引文献85

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的Gzip数据压缩算法 被引量：8

参考文献1

共引文献7

同被引文献85

引证文献8

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的Gzip数据压缩算法被引量：8