期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种基于学习的高维数据c-近似最近邻查询算法 被引量:18
1
作者 袁培森 沙朝锋 +1 位作者 王晓玲 周傲英 《软件学报》 EI CSCD 北大核心 2012年第8期2018-2031,共14页
针对高维数据近似最近邻查询,在过滤-验证框架下提出了一种基于学习的数据相关的c-近似最近邻查询算法.证明了数据经过随机投影之后,满足语义哈希技术所需的熵最大化准则.把经过随机投影的二进制数据作为数据的类标号,训练一组分类器用... 针对高维数据近似最近邻查询,在过滤-验证框架下提出了一种基于学习的数据相关的c-近似最近邻查询算法.证明了数据经过随机投影之后,满足语义哈希技术所需的熵最大化准则.把经过随机投影的二进制数据作为数据的类标号,训练一组分类器用来预测查询的类标号.在此基础上计算查询与数据集中数据对象的海明距离.最后,在过滤后的候选数据集上计算查询的最近邻.与现有方法相比,该方法对空间需求更小,编码长度更短,效率更高.模拟数据集和真实数据集上的实验结果表明,该方法不仅能够提高查询效率,而且方便调控在查询质量和查询处理时间方面的平衡问题. 展开更多
关键词 随机投影 c-近似最近邻查询 支持向量机分类器 高维数据 熵最大化准则 位置敏感哈希
下载PDF
一种LSH索引的自动参数调整方法 被引量:6
2
作者 卢炎生 饶祺 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第11期38-40,57,共4页
针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进... 针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进行查询时不增加额外的时间空间开销.模拟实验表明,和使用原始LSH算法相比较,使用该方法进行最近邻查询得到结果集的相似性可以提高10%左右,相似偏差可以减小8%左右;并且由于参数调整过程在查询过程之前,因此改进LSH算法和原始LSH算法在进行查询时有相同的时间空间性能. 展开更多
关键词 高维数据索引 相似度查询 近似最近邻查询
下载PDF
基于深度学习的散列检索技术研究进展 被引量:1
3
作者 袁明汶 钱江波 +1 位作者 董一鸿 陈华辉 《电信科学》 2018年第10期104-115,共12页
大数据时代,数据呈现维度高、数据量大和增长快等特点。面对大量的复杂数据,如何高效地检索相似近邻数据是近似最近邻查询的研究热点。散列技术通过将数据映射为二进制码的方式,能够显著加快相似性计算,并在检索过程中节省存储和通信开... 大数据时代,数据呈现维度高、数据量大和增长快等特点。面对大量的复杂数据,如何高效地检索相似近邻数据是近似最近邻查询的研究热点。散列技术通过将数据映射为二进制码的方式,能够显著加快相似性计算,并在检索过程中节省存储和通信开销。近年来深度学习在提取数据特征方面表现出速度快、精度高等优异的性能,使得基于深度学习的散列检索技术得到越来越广泛的运用。总结了深度学习散列的主要方法和前沿进展,并对未来的研究方向展开简要探讨。 展开更多
关键词 大数据 近似最近邻查询 深度学习散列
下载PDF
APPROXIMATE QUERY AND CALCULATION OF RNN_k BASED ON VORONOI CELL 被引量:1
4
作者 郝忠孝 李博涵 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2009年第2期154-161,共8页
Reverse k nearest neighbor (RNNk) is a generalization of the reverse nearest neighbor problem and receives increasing attention recently in the spatial data index and query. RNNk query is to retrieve all the data po... Reverse k nearest neighbor (RNNk) is a generalization of the reverse nearest neighbor problem and receives increasing attention recently in the spatial data index and query. RNNk query is to retrieve all the data points which use a query point as one of their k nearest neighbors. To answer the RNNk of queries efficiently, the properties of the Voronoi cell and the space-dividing regions are applied. The RNNk of the given point can be found without computing its nearest neighbors every time by using the rank Voronoi cell. With the elementary RNNk query result, the candidate data points of reverse nearest neighbors can he further limited by the approximation with sweepline and the partial extension of query region Q. The approximate minimum average distance (AMAD) can be calculated by the approximate RNNk without the restriction of k. Experimental results indicate the efficiency and the effectiveness of the algorithm and the approximate method in three varied data distribution spaces. The approximate query and the calculation method with the high precision and the accurate recall are obtained by filtrating data and pruning the search space. 展开更多
关键词 computational geometry approximation query filtrating reverse k nearest neighbor (RNNk) Voronoi cell
下载PDF
深度学习哈希研究与发展 被引量:3
5
作者 孙瑶 《数据通信》 2018年第2期49-54,共6页
在很多实际应用中,如何查找到最相似的近邻数据是计算机学科中的一个基础研究内容,而由于数据集规模的迅速增长,直接比较查询的计算复杂度极高,所需要的存储空间也极大,因此基于哈希技术的近似最近邻查询成为了一个研究热点。哈希学习... 在很多实际应用中,如何查找到最相似的近邻数据是计算机学科中的一个基础研究内容,而由于数据集规模的迅速增长,直接比较查询的计算复杂度极高,所需要的存储空间也极大,因此基于哈希技术的近似最近邻查询成为了一个研究热点。哈希学习技术通过将数据映射成二进制编码的形式,显著减少了数据的存储开销以及计算复杂度,有效提高了大规模数据集下的检索效率。近年来,由于深度学习在特征提取上优异的表现,基于深度学习的哈希方法在数据检索中取得了显著的进展。本文分析了深度学习哈希的主要方法和研究进展,对深度学习哈希进行了介绍,并提出了其未来的研究方向。 展开更多
关键词 大规模数据检索 近似最近邻查询 深度学习哈希
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部