-
题名基于数据位图的滑动分块算法
被引量:2
- 1
-
-
作者
邓雪峰
孙瑞志
张永瀚
聂娟
-
机构
中国农业大学农业部农业信息获取技术重点实验室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第S2期30-38,共9页
-
基金
中央高校基本科研业务费专项资金项目(2013YJ008)
国家科技支撑计划资助项目(2012BAH26B01)
-
文摘
网络中相似的数据文件进行同步与存储的过程中,对数据进行分块是检测数据重复的重要步骤之一,在有效地对数据分块的基础上才能更准确地定位数据间的差异部分.就数据分块方法予以分析总结,在滑动分块算法的基础上,重新将数据文件组织成类似位图的排列形式,对数据位图以列向读取数据信息,形成新的数据分块,并计算列向读取数据的分块指纹信息,以列向数据指纹作为补充校正滑动分块算法定位差异数据能力的不足之处,从而获得更精确的数据差异信息.经实验证明,本方法在同源文件的数据重复检测中效果好于相同条件下的滑动分块方法.
-
关键词
滑动分块算法
重复数据检测
数据位图
数据差异
数据同步
-
Keywords
sliding blocking algorithm
duplicate data detection
data bitmap
data difference
data synchronization
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
-