-
题名指纹极值的双层重复数据删除算法
- 1
-
-
作者
王青松
葛慧
-
机构
辽宁大学信息学院
-
出处
《辽宁大学学报(自然科学版)》
CAS
2018年第3期201-207,共7页
-
基金
国家自然科学基金资助项目(61502215)
-
文摘
为提高重复数据删除算法的重删率,减少CDC算法边界硬分块,使重复数据删除率和性能之间得到平衡,提出了指纹极值的双层重复数据删除算法(DDFE).首先在第一层重复数据删除模型中使用较大的分块大小,保证重删操作的速度;然后将第一层模型重删后的不重复数据输入到分块大小较小的第二层重复数据删除模型,保证重复数据删除的精度.数据分块时,在可容忍范围内,提出了指纹极值的分块算法,减少了硬分块对重复删除的影响.在多种分块组合下的实验结果表明,与任何传统的单层重复数据删除算法相比,DDFE能够较好地防止硬分块、平衡性能和时间,在大量小数据块和频繁变化的数据间有效地消除更多的重复数据.
-
关键词
重复数据删除
指纹极值
备份系统
Hadoop
数据存储
-
Keywords
deduplication
Fingerprint extremum
standby system
Hadoop
data storage
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-