-
题名基于流量分析的XML嵌套数据流无损压缩算法
被引量:1
- 1
-
-
作者
徐晨
顾曦华
盛银波
金军
-
机构
嘉兴恒创电力集团有限公司华创信息科技分公司
国网浙江嘉兴供电公司
-
出处
《信息技术》
2023年第8期130-136,共7页
-
文摘
为避免基体的反复压缩操作,提出一种基于流量分析的XML嵌套数据流无损压缩算法。利用GDDStream算法对高相似度的XML嵌套数据流进行聚类分析,并表述成“簇中心(基体)+个体差异量”形式,分解数据流,完成一次基体压缩;仅对差异量进行压缩,极大减少对基体的反复压缩操作;利用改进LZW算法实现XML嵌套数据流无损压缩。实验结果表明,压缩后不仅数据完整性得到了保证,数据量也大幅减少,数据冗余度降低,与压缩前数据相比,压缩后数据未出现变化,说明压缩算法性能较好。
-
关键词
流量聚类
可扩展标记语言
嵌套数据流
无损压缩
串表压缩算法
-
Keywords
traffic clustering
extensible markup language
nested data stream
lossless compression
list compression algorithm
-
分类号
TP14
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于密度划分的数据存储方法与技术
被引量:16
- 2
-
-
作者
赵会群
李春良
-
机构
北方工业大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2020年第9期2482-2487,共6页
-
基金
国家自然科学基金项目(61672041)。
-
文摘
目前数据量越来越大,存储空间不足,但数据源中带有重复性质的数据比例过高,导致数据的冗余度偏高。为解决这一问题,提出一种基于数据源中数据密度分布不同的密度区域划分算法。将数据源中高密度数据区域进行筛选提取,对此区域中的具有高度重复性质的数据进行降低冗余度的擦除动作,达到降低数量级压缩数据源的目的。实验结果表明,相比传统的数据压缩LZW算法,该算法的数据压缩策略在压缩率与数据适用性上更具优势与灵活性。
-
关键词
数据存储
数据压缩
数据冗余
串表压缩算法
密度区域划分
-
Keywords
data storage
data compression
data redundancy
LZW
density area division
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-