-
题名面向缺失数据的布鲁姆近似成员查询算法
被引量:1
- 1
-
-
作者
吴佳雯
王宇科
裴书玉
谢鲲
刘楚达
-
机构
湖南大学信息科学与工程学院
湖南大学校园信息化建设与管理办公室
长沙航空职业技术学院
-
出处
《电子技术应用》
2022年第3期78-82,87,共6页
-
基金
国家自然科学基金项目(61972144)
湖南省科教联合基金项目(2019JJ70031)。
-
文摘
随着网络的发展,越来越多的场景需要在不完整数据下进行近似成员查询,传统成员查询的布鲁姆过滤器不能满足上述要求。提出面向缺失数据的布鲁姆近似查询算法,先对高维不完整数据的缺失部分进行预填充,通过PCA算法,将高维数据转换到低维数据,使用局部敏感哈希函数与标准哈希函数结合的方式将低维数据存储到布鲁姆过滤器中。使用两个真实数据集验证了所提算法的功能,所提面向缺失数据的布鲁姆近似查询算法,能有效地解决存在缺失数据的近似成员查询问题。
-
关键词
布鲁姆过滤器
近似成员查询
查询算法
-
Keywords
Bloom filter
approximate membership query
query algorithm
-
分类号
TP393.0
[自动化与计算机技术—计算机应用技术]
-
-
题名基于P-稳定分布的布隆过滤器近似成员查询算法
- 2
-
-
作者
肖晨凯
-
机构
福建师范大学数学与信息学院
-
出处
《数字技术与应用》
2020年第1期102-103,共2页
-
文摘
布隆过滤器是近似成员查询的主流算法之一。但是迄今为止还少有针对高维度、大规模数据的近似成员查询算法。在这篇文章中,将提出一种新的基于P-稳定分布的布隆过滤器算法(P-Stable Distributions Bloom Filter Algorithm,PSDBF)。
-
关键词
布隆过滤器
近似成员查询
P稳定分布
-
Keywords
bloom filter
approximate membership query
P-Stable
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名大数据下近似成员关系查询方法研究进展
- 3
-
-
作者
胡会南
陈华辉
-
机构
宁波大学
-
出处
《数据通信》
2017年第2期27-34,共8页
-
基金
国家自然科学基金资助项目(No.61572266)
-
文摘
近似成员关系查询(Approximate Membership Query,AMQ)要快速回答类似"数据对象q是否和给定的大数据集合S中的至少一个元素相似?",即"q是否是S的近似成员"问题。AMQ在图像检索、数据挖掘、模式识别、生物检测等领域有许多应用。对AMQ问题及其处理方法进行了综述介绍。从AMQ的定义出发,对处理AMQ问题的相关基础技术进行了介绍,讨论了目前主要的AMQ算法,分析比较了各算法的区别和优缺点,最后探讨了AMQ处理中尚需进一步研究的若干问题。
-
关键词
大数据
近似成员关系查询
布鲁姆过滤器
位置敏感哈希
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名过滤器数据结构研究综述
被引量:1
- 4
-
-
作者
王瀚橙
戴海鹏
陈树森
陈志鹏
陈贵海
-
机构
计算机软件新技术国家重点实验室(南京大学)
-
出处
《计算机科学》
CSCD
北大核心
2024年第1期35-40,共6页
-
基金
国家自然科学基金(62272223)。
-
文摘
过滤器数据结构可以近似地判断某个元素是否属于给定集合。典型的过滤器数据结构,如布隆过滤器、布谷鸟过滤器、商过滤器,以牺牲查询准确性为代价换取更低的内存空间消耗和查询时间开销。因此,得益于空间时间高效性,过滤器数据结构现已被广泛应用于计算机网络、物联网、数据库系统、文件系统、生物信息学、机器学习等领域的近似成员资格查询操作中。自20世纪70年代以来,过滤器数据结构受到了广泛的研究,在诸多领域取得了重要的进展,其研究思路也在不断变化。文中整理了近五十年来关于过滤器数据结构的经典研究成果,从过滤器数据结构的原理出发对已有工作进行分类总结,并比较不同工作之间的引证关系和改进思路,最后讨论了过滤器数据结构的未来研究方向。
-
关键词
过滤器
近似成员资格查询
概率数据结构
布隆过滤器
布谷鸟过滤器
商过滤器
-
Keywords
Filter
Approximate membership query
Probabilistic data structure
Bloom filter
Cuckoo filter
Quotient filter
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名学习型过滤器综述
- 5
-
-
作者
李猛
戴海鹏
眭永熙
顾荣
陈贵海
-
机构
计算机软件新技术国家重点实验室(南京大学)
-
出处
《计算机科学》
CSCD
北大核心
2024年第1期41-49,共9页
-
基金
国家自然科学基金(62272223)。
-
文摘
作为一种高效的概率性结构,过滤器可以高效地解决近似集合成员查询问题。近年来,随着机器学习技术的发展,一些学习型过滤器表现出色,超越了传统的过滤器。这些学习型过滤器考虑数据分布信息,将集合成员查询问题视为二分类问题,实现了超越传统过滤器的性能。受此启发,学习型过滤器研究领域迅速发展,出现了多个变种。然而,目前还缺乏对近些年相关工作的系统性回顾和比较。为了填补上述空缺,文中全面回顾了近年来的学习型过滤器相关工作,并展望了未来的发展方向。
-
关键词
近似成员资格查询
机器学习
BLOOM过滤器
学习型过滤器
假阳率
-
Keywords
Approximate membership query
Machine learning
Bloom filter
Learning-based filter
False positive rate
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名布隆过滤器研究综述
被引量:5
- 6
-
-
作者
华文镝
高原
吕萌
谢平
-
机构
青海师范大学计算机学院
青海省物联网重点实验室
省部共建藏语智能信息处理及应用国家重点实验室
高原科学与可持续发展研究院
-
出处
《计算机应用》
CSCD
北大核心
2022年第6期1729-1747,共19页
-
基金
国家自然科学基金资助项目(61762075)
青海省自然科学基金资助项目(2020⁃ZJ⁃926)。
-
文摘
布隆过滤器(BF)是一种基于哈希策略的二进制向量数据结构,凭借分摊哈希碰撞的思想、存在单向误判性的特点以及极小常数查询时间复杂度,常用于表示集合元素并作为进行集合元素查询操作的“加速器”。作为计算机工程中解决集合元素查询问题最好的数学工具,BF在网络工程、存储系统、数据库、文件系统、分布式系统等领域得到了广泛的应用和发展。近几年来,为了适用于各种硬件环境和应用场景,BF出现了大量基于改变结构、优化算法等思想的变种方案。随着大数据时代的发展,对BF自身特点和操作逻辑进行改进已经成为现有集合元素查询研究的一个重要方向。
-
关键词
布隆过滤器
集合元素查询
近似成员查询结构
哈希策略
误判率
-
Keywords
Bloom Filter(BF)
membership query
Approximate Membership Query(AMQ)structure
hashing strategy
False Positive Rate(FPR)
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-