-
题名相似性—局部性方法相关参数分析
被引量:3
- 1
-
-
作者
张星煜
张建
辛明军
-
机构
上海大学计算机工程与科学学院
-
出处
《计算机技术与发展》
2014年第11期47-50,共4页
-
基金
国家自然科学基金资助项目(61074135)
-
文摘
大数据时代到来,备份数据量增大给存储空间带来新的挑战。重复数据删除技术在备份存储系统中正逐渐流行,但大量数据访问,造成了磁盘的很大负担。针对重复数据删除技术存在的块索引查询磁盘瓶颈问题,文中提出了文件相似性与数据流局部性结合方法改善磁盘I/O性能。该方法充分发挥了各自的优势,相似性优化了索引查找,可以检测到相同数据检测技术不能识别的重复数据;而数据局部性保留了数据流的序列,使得cache的命中率提高,减少磁盘访问次数。布鲁过滤器存储数据块索引可节省大量查询时间和空间开销。对于提出的解决方法所涉及的重要参数如块大小、段大小以及对误判率的影响做了深入分析。通过相关实验评估与性能分析,实验数据与结果为进一步系统性能优化问题提供了重要的数据依据。
-
关键词
重复数据删除技术
相似性与局部性
布鲁过滤器
磁盘瓶颈
-
Keywords
data deduplication technique
similarity-locality
Bloom filter
disk bottleneck
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-