-
题名位置敏感哈希函数数据结构的概率分析
- 1
-
-
作者
陆可镜
王洪亚
-
机构
东华大学计算机科学与技术学院
-
出处
《智能计算机与应用》
2016年第5期9-10,16,共3页
-
基金
国家自然科学基金(61370205)
上海市自然科学基金(13ZR1400800)
中央高校基本科研业务费专项资金
-
文摘
对于高维空间的近邻查找问题,位置敏感哈希(LSH)在查询代价和磁盘空间利用上有着出色表现。在传统分析模型下,LSH被视作随机算法,唯一不确定因素就是哈希函数的选择。研究中将这种模型下得到的碰撞概率称为基于哈希函数的碰撞概率。在本文中,使用了不同的分析模型对LSH作了理论分析。此工作的出发点有2个:1)在现有的分析模型下,用户为了达到理论的效果,必须对每个查询点产生随机的数据结构,这在实际应用中是不现实的。2)用户所关心的性能指标是随机查询点在一个数据结构上的期望碰撞概率。基于此,本篇论文即推导了在汉明距离下,随机点对在任意单个哈希函数上的碰撞概率。研究将此模型下推导出的碰撞概率称为基于随机查询的碰撞概率。同时也一并证明了在汉明空间中,2种碰撞概率完全相同。
-
关键词
位置敏感哈希函数
碰撞率
算法的概率分析
-
Keywords
Locality Sensitive Hashing
the probability of collision
the probabilistic analysis of algorithms
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-