期刊文献+

通用简易中文文本压缩方法研究 被引量:1

RESEARCH ON UNIVERSAL AND SIMPLE COMPRESSION METHOD FOR CHINESE TEXTS
下载PDF
导出
摘要 该文把GB2 312 - 80的汉字转换为从 0至 6767的短整型数 ,这些短整型数据有一个共同的存储特点 :它们的 2字节中的高 3位 (称为冗余位 )皆为 0 .删除冗余位而重组其余位即可形成压缩文本 .这种压缩方法显然是简单、快捷、容易实现和对GB2 312 - In this paper, the chinese characters of GB2312-80 are transformed into short integral numbers distributing from 0 to 6767. Every one of these short integral numbers is stored in a cell of two bytes, and the 3 higher bits, named redundance bits, in the cell are always zero. Omitting the redundance bits and reorganizing the others, the compression text of chinese characters is formed. The compression method is simple, quick, easy to implement and universal for all texts of chinese characters of GB2312-80.
出处 《华南师范大学学报(自然科学版)》 CAS 2001年第2期84-88,共5页 Journal of South China Normal University(Natural Science Edition)
关键词 文本压缩 LZ算法 按位与运算 汉字数值化 短整型数据 冗余位 无损压缩 coding, compression of texts, LZ algorithm, bits, AND operation bit-by-bit
  • 相关文献

参考文献2

二级参考文献16

  • 1王忠效,计算机研究与发展,1996年,5期
  • 2王忠效,计算机应用,1995年,1期
  • 3贺前华,中文信息学报,1993年,3期
  • 4徐秉铮,华南理工大学学报,1989年,3期
  • 5冯志伟,现代汉字和计算机,1989年
  • 6王忠效,中文信息处理国际会议论文集,1987年
  • 7团体著者,现代汉语频率词典,1986年
  • 8郭平欣,汉字信息处理技术,1985年
  • 9石贵青,电子学报,1984年,4期
  • 10王世宁,中国电子学会信息论会议文集,1983年

共引文献16

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部