-
题名一种高维大数据全k近邻查询算法
被引量:3
- 1
-
-
作者
王忠伟
陈叶芳
肖四友
钱江波
-
机构
宁波大学信息科学与工程学院
-
出处
《电信科学》
北大核心
2015年第7期52-62,共11页
-
基金
国家自然科学基金资助项目(No.61472194)
浙江省自然科学基金资助项目(No.LY13F020040)
+2 种基金
宁波市自然科学基金资助项目(No.2014A610023
No.2015A610119)
"信息与通信工程"浙江省重中之重学科开放基金资助项目(No.xkxl1423)~~
-
文摘
全k近邻(all k-nearest neighbor,AkNN)查询,是k近邻查询的一个变型,旨在在一个查询过程中为给定数据集的每个对象确定k个最近邻。提出了一种在Hadoop分布式平台下处理高维大数据的AkNN查询算法。首先使用行条化思想结合p-stable LSH算法将高维数据对象降维,然后结合空间填充曲线Z-order的优良特性,把降维后的数据嵌入一维空间中,接着进行范围查询。整个过程使用MapReduce框架分布式并行处理。实验结果表明。所提出的算法可以高效处理高维大数据的AkNN查询。
-
关键词
高维
aknn
MAPREDUCE
行条化
局部敏感散列
Z—order
-
Keywords
high-dimensional, aknn, MapReduce, banding, locality sensitive hashing, Z-order
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-