摘要
本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编码,对短文本的压缩有显著的效果;2、建立—删除规则,当码本加满以后对码本进行删除整理,使编码过程一直能够积累输入文本的相关信息,对较长文本,其压缩效果比基本LZM算法有显著改善。
This paper discusses the storage_charateristics of Chinese text, and uses them incompessing Chinese text. Improvements of LZW (Lemple_Ziv_Welch) algorithm aremade: (1).Using variable_length coding instead of fixed length coding, which contributesmuch to the compresive rate of short text; (2). A set of deleting rule is proposed, the code table will be adjusted when it gets full, so the algorithm could accomulate the relativity of the input text all the time, which contributes much to long text than the basic LZW algorithm.
出处
《中文信息学报》
CSCD
1993年第3期46-54,共9页
Journal of Chinese Information Processing
基金
国家自然科学基金