期刊文献+

中文文本压缩的LZW算法 被引量:9

Compression algorithm LZW on Chinese text
下载PDF
导出
摘要 结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。 This paper presents a compression algorithm for Chinese text which is improved from LZW algorithm. By modify-ing LZW algorithm’s dictionary size, basic set and the output way of dictionary code, the improved algorithm LZW_CH demonstrates about 19%higher compression ratio than LZW19’s with almost the same execution speed. LZW_CH doesn’t need any pre-processing work for the compressing data. As a single compression algorithm, LZW_CH’s compression with long Chinese text has closed or exceeded the professional compression utility WinRAR.
出处 《计算机工程与应用》 CSCD 2014年第3期112-116,共5页 Computer Engineering and Applications
基金 中南大学自由探索计划(No.201011200121)
关键词 中文文本 数据压缩 压缩算法 编码 LZW Chinese text data compression compression algorithm encoding LZW
  • 相关文献

参考文献10

  • 1Welch T A.A technique for high-performance data com- pression[J].Computer, 1984,17(6) :8-19.
  • 2Ziv J, Lempel A.Compression of individual sequences via variable-rate coding[J].IEEE Transactions on Information Theory, 1978,24(5) : 530-536.
  • 3Fiala E R, Green D H.Data compression with finite Windows[J].Communications of the ACM, 1989,32(1) : 490-505.
  • 4Yokoo H.Improved variations relating the ziv-lempel and welch-type algorithms for sequential data compression[J]. IEEE Transactions on Information Theory, 1992,38 (1) :73-81.
  • 5Miller V, Wegman M.Variations on a theme by Ziv and Lempel[J].Combinationtorial Algorithms on Words.Berlin: Springer, 1985.
  • 6Ziv J,Lempel A.A universal algorithm for sequential data compression[J].IEEE Transactions on Information Theory, 1977,23(3) :337-343.
  • 7常为领,方滨兴,云晓春,王树鹏,余翔湛.一种支持ANSI编码的中文文本压缩算法[J].中文信息学报,2010,24(5):96-105. 被引量:5
  • 8王忠效.汉语文本压缩研究及其应用[J].中文信息学报,1997,11(3):57-64. 被引量:9
  • 9徐秉铮,吴立忠,Victor K.Wei.中文文本压缩的LZW算法[J].华南理工大学学报(自然科学版),1989,17(3):1-9. 被引量:6
  • 10华强.中西文文本压缩的LZWCH算法[J].计算机工程与应用,1999,35(3):22-23. 被引量:7

二级参考文献44

  • 1贺前华,徐秉铮,彭磊.中文文本压缩的自适应算法[J].中文信息学报,1993,7(3):46-54. 被引量:4
  • 2王忠效,姜丹.关于Lempel-Ziv 77压缩算法及其实现的研究[J].计算机研究与发展,1996,33(5):329-340. 被引量:19
  • 3吴军,王作英.汉语信息熵和语言模型的复杂度[J].电子学报,1996,24(10):69-71. 被引量:14
  • 4吴乐南.数据压缩技术及C语言实例[M].北京:电子工业出版社,1995..
  • 5Huffman,D.A.A Method for the Construction of Minimum-Redundancy Codes[C]//Proc.IRE 40,9(Sept.),1952:1098-1101.
  • 6Ziviani,N.,Moura,E.,Navarro,G.,& BaezaYates,R.Compression:a key for next-generation text retrieval systems[J].IEEE Computer,2000,33(11):37-44.
  • 7Witten,I.,Moffat,A.,& Bell,T.Managing gigabytes 2nd[M].Morgan Kaufmann Publishers.1999.
  • 8Ziv,J.,and Lempel,A.A Universal Algorithm for Sequential Data Compression[J].IEEE Transactions on Information Theory,1977,23(3):337-343.
  • 9Ziv,J.,and Lempel,A.Compression of Individual Sequences via Variable-Rate Coding[J].IEEE Transactions on Information Theory,1978,24(5):530-536.
  • 10J.A.Storer and T.G.Szymanski.Data Compression via Textual Substitution[J].Journal of the ACM,1982,29:928-951.

共引文献20

同被引文献72

引证文献9

二级引证文献28

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部