摘要
XML(可扩展标记语言)是一种广泛应用于网络的数据存储交换格式,采用通用标记语言,具有良好的数据存储和分析能力,其缺点是XML文档存在结构冗余。伴随着XML在网络上应用的扩展,XML压缩成为目前关注的研究问题。从压缩、存储两方面研究了XML文件的压缩算法。根据重复出现权重,基于Huffman树生成对应的编码(0、1数字表示),减少XML文件结构重复导致的冗余。存储文件时,把n位编码(二进制)转化为一个ASCII字符存储(n不是8倍数即补位),节省了存储空间。大量实验证明:算法具有良好的可行性和研究价值。
出处
《软件导刊》
2014年第7期41-43,共3页
Software Guide