-
题名指纹极值的双层重复数据删除算法
- 1
-
-
作者
王青松
葛慧
-
机构
辽宁大学信息学院
-
出处
《辽宁大学学报(自然科学版)》
CAS
2018年第3期201-207,共7页
-
基金
国家自然科学基金资助项目(61502215)
-
文摘
为提高重复数据删除算法的重删率,减少CDC算法边界硬分块,使重复数据删除率和性能之间得到平衡,提出了指纹极值的双层重复数据删除算法(DDFE).首先在第一层重复数据删除模型中使用较大的分块大小,保证重删操作的速度;然后将第一层模型重删后的不重复数据输入到分块大小较小的第二层重复数据删除模型,保证重复数据删除的精度.数据分块时,在可容忍范围内,提出了指纹极值的分块算法,减少了硬分块对重复删除的影响.在多种分块组合下的实验结果表明,与任何传统的单层重复数据删除算法相比,DDFE能够较好地防止硬分块、平衡性能和时间,在大量小数据块和频繁变化的数据间有效地消除更多的重复数据.
-
关键词
重复数据删除
指纹极值
备份系统
Hadoop
数据存储
-
Keywords
deduplication
fingerprint extremum
standby system
Hadoop
data storage
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于极值点分块的重复数据检测算法
- 2
-
-
作者
谢垂益
卿斯汉
-
机构
韶关学院数学与信息科学学院
中国科学院软件研究所
-
出处
《信息网络安全》
2013年第8期10-12,共3页
-
基金
国家自然科学基金[60970135
61170282]
+1 种基金
韶关市创新资金项目[201210]
韶关学院科研项目[201202]
-
文摘
重复数据检测技术能够大幅降低数据中心的存储量,节省网络带宽,减少建设和运维成本。为了克服基于内容分块(CDC)方法容易出现超长块的缺点,文章提出了基于极值点分块(EDC)的重复数据检测算法。EDC算法先计算出所有右边界在数据块上下限范围内的滑动窗口中数据的指纹,找出最后一个指纹极值,所对应的滑动窗口结束位置作为数据块的分界点,再计算该数据块的哈希值并判断是否重复块。实验结果表明,EDC算法的重复数据检测率、磁盘利用率分别是CDC算法的1.48倍和1.12倍,改进效果显著。
-
关键词
重复数据检测
基于内容分块
基于极值点分块
指纹
-
Keywords
duplicated data detection
content defined chunking
extremum defined chunking
fingerprint
-
分类号
TP308
[自动化与计算机技术—计算机系统结构]
TP274
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名一种指纹图像置信阈值极值化处理算法
被引量:2
- 3
-
-
作者
李建春
周克栋
曹雏清
赫雷
-
机构
南京理工大学机械工程学院
-
出处
《兵工自动化》
2019年第2期64-67,共4页
-
文摘
针对传统方法存在适应性差、计算量大等特点,提出一种指纹图像置信极值化的处理方法。采用图像均衡化与置信阈值极值化结合对图像进行强化,对每个小区域的像素点进行灰度值求均值和方差,并采用VisualC++平台对算法进行实验验证。实验结果表明,该算法具有处理效果好、适应性强的特点。
-
关键词
置信阈值极值化
图像均衡化
图像处理
指纹图像
-
Keywords
extremum of confidence threshold
image equalization
image processing
fingerprint image
-
分类号
TP391.411
[自动化与计算机技术—计算机应用技术]
-