期刊文献+

基于变长编码集合扩展的中文文本压缩算法 被引量:2

Compression Algorithm for Unfixed Length Encoding Set Expansion
下载PDF
导出
摘要 为了获取压缩中文文本的高压缩比 ,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点 ,以不等长高概率汉字串为单位 ,定义固定字典集 ,同时寻求高压缩率的匹配方式进行编码 .算法的编码转换过程适应了自然语言中的部分马尔可夫过程 ,相对于不同文本长度及文体风格压缩比分布均衡 . In order to get high compression ratio for a compresed Chinese text, the compression algorithm for unfixed length encoding set expansion encodes the text by matching for high compression ratio, based on a set of fixed dictionaries that comprise unfixed length and high frequency Chinese character strings following features of the Chinese language. This algorithm fits the Chinese character string as Markov message source. It also suits different lengths and the language style of the source data. This algorithm can result in higher compression ratio.
出处 《北京理工大学学报》 EI CAS CSCD 北大核心 2001年第4期480-484,共5页 Transactions of Beijing Institute of Technology
关键词 中文文本 数据压缩 压缩算法 无损压缩 变长编码集合 压缩率 编码转换 Chinese text data compression compression algorithm lossless compression
  • 相关文献

参考文献3

二级参考文献6

  • 1吴军,电子学报,1996年,24卷,10期
  • 2王忠效,计算机研究与发展,1996年,33卷,5期
  • 3吴乐南,数据压缩的原理与应用,1995年
  • 4侯阳,数据压缩的原理及应用,1994年
  • 5贺前华,中文信息学报,1993年,7卷,3期
  • 6徐秉铮,华南理工大学学报,1989年,17卷,3期

共引文献11

同被引文献6

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部