期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于流量分析的XML嵌套数据流无损压缩算法
1
作者 徐晨 顾曦华 +1 位作者 盛银波 金军 《信息技术》 2023年第8期130-136,共7页
为避免基体的反复压缩操作,提出一种基于流量分析的XML嵌套数据流无损压缩算法。利用GDDStream算法对高相似度的XML嵌套数据流进行聚类分析,并表述成“簇中心(基体)+个体差异量”形式,分解数据流,完成一次基体压缩;仅对差异量进行压缩,... 为避免基体的反复压缩操作,提出一种基于流量分析的XML嵌套数据流无损压缩算法。利用GDDStream算法对高相似度的XML嵌套数据流进行聚类分析,并表述成“簇中心(基体)+个体差异量”形式,分解数据流,完成一次基体压缩;仅对差异量进行压缩,极大减少对基体的反复压缩操作;利用改进LZW算法实现XML嵌套数据流无损压缩。实验结果表明,压缩后不仅数据完整性得到了保证,数据量也大幅减少,数据冗余度降低,与压缩前数据相比,压缩后数据未出现变化,说明压缩算法性能较好。 展开更多
关键词 流量聚类 可扩展标记语言 嵌套数据流 无损压缩 串表压缩算法
下载PDF
基于密度划分的数据存储方法与技术 被引量:14
2
作者 赵会群 李春良 《计算机工程与设计》 北大核心 2020年第9期2482-2487,共6页
目前数据量越来越大,存储空间不足,但数据源中带有重复性质的数据比例过高,导致数据的冗余度偏高。为解决这一问题,提出一种基于数据源中数据密度分布不同的密度区域划分算法。将数据源中高密度数据区域进行筛选提取,对此区域中的具有... 目前数据量越来越大,存储空间不足,但数据源中带有重复性质的数据比例过高,导致数据的冗余度偏高。为解决这一问题,提出一种基于数据源中数据密度分布不同的密度区域划分算法。将数据源中高密度数据区域进行筛选提取,对此区域中的具有高度重复性质的数据进行降低冗余度的擦除动作,达到降低数量级压缩数据源的目的。实验结果表明,相比传统的数据压缩LZW算法,该算法的数据压缩策略在压缩率与数据适用性上更具优势与灵活性。 展开更多
关键词 数据存储 数据压缩 数据冗余 串表压缩算法 密度区域划分
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部