期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
Optimized high order product quantization for approximate nearest neighbors search 被引量:1
1
作者 Linhao LI Qinghua HU 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第2期259-272,共14页
Product quantization is now considered as an effective approach to solve the approximate nearest neighbor(ANN)search.A collection of derivative algorithms have been developed.However,the current techniques ignore the ... Product quantization is now considered as an effective approach to solve the approximate nearest neighbor(ANN)search.A collection of derivative algorithms have been developed.However,the current techniques ignore the intrinsic high order structures of data,which usually contain helpful information for improving the computational precision.In this paper,aiming at the complex structure of high order data,we design an optimized technique,called optimized high order product quantization(O-HOPQ)for ANN search.In O-HOPQ,we incorporate the high order structures of the data into the process of designing a more effective subspace decomposition way.As a result,spatial adjacent elements in the high order data space are grouped into the same subspace.Then,O-HOPQ generates its spatial structured codebook,by optimizing the quantization distortion.Starting from the structured codebook,the global optimum quantizers can be obtained effectively and efficiently.Experimental results show that appropriate utilization of the potential information that exists in the complex structure of high order data will result in significant improvements to the performance of the product quantizers.Besides,the high order structure based approaches are effective to the scenario where the data have intrinsic complex structures. 展开更多
关键词 PRODUCT QUANTIZATION high order structured data tensor theory approximate nearest neighbor search
原文传递
基于分区层次图的海量高维数据学习索引构建方法
2
作者 华悦琳 周晓磊 +2 位作者 范强 王芳潇 严浩 《计算机工程与科学》 CSCD 北大核心 2024年第7期1193-1201,共9页
学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保... 学习索引是破解海量高维数据近似最近邻搜索问题的关键。然而,现有学习索引技术结果仅局限于单个分区中,且依赖于近邻图的构建。随着数据维度和规模的增长,索引难以对分区边界数据进行精确判断,并且构建时间复杂度增大,可扩展性难以保障。针对上述问题,提出了基于分区层次图的学习索引方法PBO-HNSW。该方法对分区边界数据进行重新分配,并行构建分布式图索引结构,从而有效应对近似最近邻搜索问题所面临的挑战。实验结果表明,该方法能够在百万级海量高维数据上实现毫秒级的索引构建。当召回率为0.93时,PBO-HNSW方法构建时间仅为基线方法的36.4%。 展开更多
关键词 近似最近邻搜索 学习索引 层次可导航小世界图 分区学习 索引结构
下载PDF
结合K均值聚类和KD-Tree搜索的快速分形编码方法 被引量:6
3
作者 陈作平 叶正麟 +1 位作者 赵红星 郑红婵 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2006年第7期965-970,共6页
利用部分失真搜索求解传统K均值聚类算法中的最近邻搜索问题,显著地减少了传统算法的乘法次数,从而提高了聚类速度;然后用改进后的聚类算法来加速分形编码:首先将定义域块聚类并为每个类建立一棵KD-Tree,编码时对每个值域块先后用部分... 利用部分失真搜索求解传统K均值聚类算法中的最近邻搜索问题,显著地减少了传统算法的乘法次数,从而提高了聚类速度;然后用改进后的聚类算法来加速分形编码:首先将定义域块聚类并为每个类建立一棵KD-Tree,编码时对每个值域块先后用部分失真搜索与近似最近邻搜索得到与其距离最近的若干KD-Tree及其上的若干最近邻,而其最优匹配块即由后者产生.实验结果表明,相对于全局搜索,该方法能大幅度地提高编码速度和较大地提高压缩比,而解码质量只有很小的下降;相对于同类方法,在相同压缩比下有更好的加速效果和解码质量. 展开更多
关键词 分形图像压缩 K均值聚类 部分失真搜索 KD-TREE 近似最近邻搜索
下载PDF
基于随机森林的哈希检索算法 被引量:5
4
作者 花强 郭欣欣 +1 位作者 张峰 董春茹 《计算机科学与探索》 CSCD 北大核心 2019年第7期1174-1183,共10页
从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中... 从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻算法效率降低,而近似最近邻算法发挥了越来越重要的作用。其中哈希算法以其在存储空间和计算时间上的优势受到了广泛关注。提出了一种基于随机森林的哈希算法。该算法通过构建随机森林,将原始空间的样本映射为海明空间的二进制哈希码,并在哈希空间上定义了顺序敏感的海明距离,以最大程度保持数据在原空间的近邻关系不变。由于随机森林中不同决策树所使用的特征空间和学习过程是独立的,可以以增量的方式灵活地确定哈希码的长度。此外基于随机森林的哈希编码算法天然适合并行部署,从而可以大大提高算法速度。最后,在MNIST和CIFAR-10数据集对所提算法进行了实验验证,结果表明了算法的有效性和出色性能。 展开更多
关键词 近似近邻检索(annS) 哈希编码 随机森林 顺序敏感的海明距离
下载PDF
二次式距离上基于SVD的高维图像索引方法 被引量:5
5
作者 崔江涛 孙君顶 +1 位作者 付少锋 周利华 《中国图象图形学报》 CSCD 北大核心 2006年第4期498-503,共6页
向量近似方法(vector approxim ation file)是解决高维索引中维数灾难问题的一种有效方法,但是它不能直接支持二次式距离上的近邻搜索,为此,提出一种基于奇异值分解(SVD)的二次式距离上的向量近似方法,通过奇异值分解技术将二次式距离... 向量近似方法(vector approxim ation file)是解决高维索引中维数灾难问题的一种有效方法,但是它不能直接支持二次式距离上的近邻搜索,为此,提出一种基于奇异值分解(SVD)的二次式距离上的向量近似方法,通过奇异值分解技术将二次式距离变换为欧氏距离形式,对变换后的特征向量进行近似得到近似向量。进行近邻搜索时采用低维过滤算法,先在较高能量的低维子空间内计算近似距离进行过滤,再对过滤结果进行高维距离计算。实验结果表明,低维过滤算法可以过滤掉大部分特征向量,而只有小部分数据需要进行高维距离运算,该方法可以显著提高大型高维图像数据库的近邻搜索性能。 展开更多
关键词 维数灾难 二次式距离 近邻搜索 奇异值分解 向量近似
下载PDF
基于FAST和SURF的图像配准算法 被引量:22
6
作者 安维胜 余让明 伍玉铃 《计算机工程》 CAS CSCD 北大核心 2015年第10期232-235,239,共5页
尺度不变特征变换(SIFT)和加速鲁棒特征(SURF)方法在进行角点检测和特征点匹配时的时间较长。为此,提出一种改进的图像配准算法。建立参考图像与待配准图像的高斯图像金字塔,在金字塔各层图像进行检测,得到具有不同尺度的加速分割测试特... 尺度不变特征变换(SIFT)和加速鲁棒特征(SURF)方法在进行角点检测和特征点匹配时的时间较长。为此,提出一种改进的图像配准算法。建立参考图像与待配准图像的高斯图像金字塔,在金字塔各层图像进行检测,得到具有不同尺度的加速分割测试特征(FAST)点,采用SURF算法为各特征点分配方向,并计算各特征点的描述向量,使用快速近似最近邻搜索算法获取图像间的初始匹配点对,用随机抽样一致性算法剔除误匹配点对,同时得到2幅图像之间的几何变换矩阵。实验结果表明,与SURF算法和SIFT算法相比,该算法的特征检测速度和匹配速度较快,匹配正确率较高。 展开更多
关键词 图像配准 加速分割测试特征 加速鲁棒特征 近似最近邻 随机抽样一致性
下载PDF
一种LSH索引的自动参数调整方法 被引量:6
7
作者 卢炎生 饶祺 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第11期38-40,57,共4页
针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进... 针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进行查询时不增加额外的时间空间开销.模拟实验表明,和使用原始LSH算法相比较,使用该方法进行最近邻查询得到结果集的相似性可以提高10%左右,相似偏差可以减小8%左右;并且由于参数调整过程在查询过程之前,因此改进LSH算法和原始LSH算法在进行查询时有相同的时间空间性能. 展开更多
关键词 高维数据索引 相似度查询 近似最近邻查询
下载PDF
一种相似性保持的线性嵌入哈希方法 被引量:2
8
作者 王秀美 丁利杰 高新波 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2016年第1期94-98,共5页
在图像检索技术中,针对高维特性海量的图像数据检索速度慢、数据存储容量大及图像和其哈希编码之间相关性差的缺点,将相关性预测函数引入到哈希算法中,提出了一种相似性保持的线性嵌入哈希方法.该方法利用相关性预测函数保持高维数据与... 在图像检索技术中,针对高维特性海量的图像数据检索速度慢、数据存储容量大及图像和其哈希编码之间相关性差的缺点,将相关性预测函数引入到哈希算法中,提出了一种相似性保持的线性嵌入哈希方法.该方法利用相关性预测函数保持高维数据与其编码之间的邻近关系,使边界损失代价最小化,构建线性哈希映射矩阵,获得紧致的哈希编码,提高了图像与编码间的相关性,实现了高精度的图像检索.通过与现存经典的哈希算法相对比,实验结果验证了线性嵌入哈希方法在查全率和查准率上的有效性. 展开更多
关键词 相似最近邻搜索 哈希 相关性预测函数 查准率 查全率
下载PDF
基于投影残差量化哈希的近似最近邻搜索 被引量:3
9
作者 杨定中 陈心浩 《计算机工程》 CAS CSCD 北大核心 2015年第12期161-165,170,共6页
针对投影哈希中投影误差较大,二进制编码时原始信息丢失严重等问题,提出一种近似最近邻搜索方法。该方法通过多阶段量化策略减少编码过程中的投影及量化误差。在每阶段训练时,对前一阶段的量化残差采用投影、按维度训练码书及量化、反... 针对投影哈希中投影误差较大,二进制编码时原始信息丢失严重等问题,提出一种近似最近邻搜索方法。该方法通过多阶段量化策略减少编码过程中的投影及量化误差。在每阶段训练时,对前一阶段的量化残差采用投影、按维度训练码书及量化、反投影等运算生成各阶段的子量化器。子量化器按投影后数据的维度提供多个哈希函数,最终的哈希函数由各阶段哈希函数共同构成。在最近邻搜索时,给二进制编码加上权重以便对搜索结果进行重排,提高搜索精度。实验结果表明,基于投影残差量化哈希的近似最近邻的搜索性能优于当前主流的哈希方法。 展开更多
关键词 投影残差量化哈希 大规模搜索 近似最近邻搜索 编码权重 多阶段量化
下载PDF
基于KD-Tree搜索和SURF特征的图像匹配算法研究 被引量:33
10
作者 杜振鹏 李德华 《计算机与数字工程》 2012年第2期96-98,126,共4页
针对图像匹配时进行特征检测和匹配的搜索时间长的问题,文章研究了基于KD-Tree搜索和SURF特征的图像匹配算法。该算法首先提取得到图像的SURF特征并生成特征描述向量,然后为这些特征描述向量建立KD-Tree索引,最后通过计算每个特征点的... 针对图像匹配时进行特征检测和匹配的搜索时间长的问题,文章研究了基于KD-Tree搜索和SURF特征的图像匹配算法。该算法首先提取得到图像的SURF特征并生成特征描述向量,然后为这些特征描述向量建立KD-Tree索引,最后通过计算每个特征点的与其距离最近的若干个KD-Tree上的最近邻点,完成特征匹配工作。实验结果表明,与SIFT算法相比,SURF算法进行特征检测的速度要快2~3倍;与全局最近邻搜索相比,基于KD-Tree索引的近似最近邻搜索大大减少了计算量,较大地提高了SURF算法的匹配速度。 展开更多
关键词 KD-TREE SURF 图像匹配 特征提取 近似最近邻搜索
下载PDF
基于距离的相似最近邻搜索算法研究 被引量:2
11
作者 姜大光 孙贺娟 易军凯 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第5期94-98,共5页
为了提高相似最近邻搜索(ANN)算法的精度,提出了一种在度量空间下基于距离的相似最近邻搜索算法—优化的VP森林(OVF)算法。在传统VP树(VT)算法的基础上,首先采用改进的选择优势点的方法,通过从数据集采样优势点候选集,对其进行评估,选... 为了提高相似最近邻搜索(ANN)算法的精度,提出了一种在度量空间下基于距离的相似最近邻搜索算法—优化的VP森林(OVF)算法。在传统VP树(VT)算法的基础上,首先采用改进的选择优势点的方法,通过从数据集采样优势点候选集,对其进行评估,选取其中区分度大的点作为优势点;然后提出构建多棵VP树的新方法,改进距离优势点远的子树中最近邻不紧凑问题;接着提出使用优先队列与剪枝搜索方法结合的新搜索方法查找最近邻,减少了很多不必要的距离计算。最后通过实验结果表明,本文方法在数据维度、数据集大小、返回不同邻居个数、不同的距离函数及建树个数方面精度有了很大的提高。 展开更多
关键词 相似最近邻搜索(ann)算法 VP树 优化的VP森林(OVF)算法 剪枝方法
下载PDF
熵选择多重二进制编码 被引量:1
12
作者 赵宏伟 王振 +1 位作者 杨文迪 刘萍萍 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2017年第1期218-226,共9页
为了解决查询高维浮点型数据的近邻点需要计算代价昂贵的欧式距离,内存占用率较高的问题,将高维浮点型数据通过哈希映射函数映射为低维二进制编码,并保证同一样本点在两种空间内的归一化距离满足相似性。从而在实现近邻检索任务时,可使... 为了解决查询高维浮点型数据的近邻点需要计算代价昂贵的欧式距离,内存占用率较高的问题,将高维浮点型数据通过哈希映射函数映射为低维二进制编码,并保证同一样本点在两种空间内的归一化距离满足相似性。从而在实现近邻检索任务时,可使用代价较低的汉明距离替换欧式距离,达到降低检索复杂度的目的。为保证由哈希函数生成的二进制编码具有较优的近邻检索性能,本文首先基于查找机制得到数据集适应空间分布特性的二进制标签,然后利用SVM算法得到二进制标签的分类平面,并选择其中具有最大熵值的平面函数作为最终的哈希映射函数。为了进一步提高近邻检索性能,在训练阶段,初始化多种不同的编码中心点用以生成多重二进制标签,并得到与此相应的多重哈希函数和多重二进制编码。在检索过程中,建立了基于多重二进制编码的近邻检索体系,返回具有较小平均汉明距离的样本点作为最终检索结果。实验结果表明:与其他现存优秀算法相比,本文算法可以快速、有效地将浮点型数据转化为二进制编码,而且基于这些二进制编码的近邻检索性能较优。 展开更多
关键词 计算机应用 近邻检索 二进制特征 哈希编码
下载PDF
近似最近邻搜索算法——位置敏感哈希 被引量:8
13
作者 高毫林 徐旭 李弼程 《信息工程大学学报》 2013年第3期332-340,共9页
寻找查询点的最近邻是信息处理相关领域的主要任务之一。在数据规模较大时需要采用快速检索算法,常用的快速检索算法主要是基于树的算法,但是当数据点维数较高时,这些算法的效率会变低。位置敏感哈希是当前解决高维搜索的最快的算法,文... 寻找查询点的最近邻是信息处理相关领域的主要任务之一。在数据规模较大时需要采用快速检索算法,常用的快速检索算法主要是基于树的算法,但是当数据点维数较高时,这些算法的效率会变低。位置敏感哈希是当前解决高维搜索的最快的算法,文章对汉明空间、欧式空间下的位置敏感哈希算法的实现方案进行了详细分析,对算法中数据点冲突概率、空间时间消耗、参数调整对算法性能的影响进行了详尽的研究和试验,最后讨论算法的优点和缺点,说明了算法应用于视觉聚类的可能性。 展开更多
关键词 近似最近邻搜索 位置敏感哈希 精确欧式距离位置敏感哈希 视觉聚类
下载PDF
基于相关反馈的高维图像检索方法 被引量:1
14
作者 崔江涛 孙君顶 周利华 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2006年第1期62-65,共4页
传统索引方法在高维情况下会面临维数灾难问题,基于向量近似的索引方法是有效的高维检索方法.对向量近似方法中k近邻搜索算法加以改进,应用到基于相关反馈的交互式图像检索系统中.根据反馈过程前后的距离变化特性,在进行k近邻搜索过程中... 传统索引方法在高维情况下会面临维数灾难问题,基于向量近似的索引方法是有效的高维检索方法.对向量近似方法中k近邻搜索算法加以改进,应用到基于相关反馈的交互式图像检索系统中.根据反馈过程前后的距离变化特性,在进行k近邻搜索过程中,将上轮次的查询结果和用户反馈信息用作过滤信息,可减少特征向量的访问数量.在大容量真实图像数据库上的实验表明,将新算法应用于相关反馈过程的图像检索中,可提高k近邻搜索速度. 展开更多
关键词 基于内容的图像检索 高维索引 相关反馈 向量近似 k近邻搜索
下载PDF
基于SIFT的图像盲取证方法 被引量:2
15
作者 李峰 蔡琼 《计算机工程》 CAS CSCD 北大核心 2011年第14期233-235,共3页
采用一种基于尺度不变特征变换的算法提取图像特征,使用乘积量化的近似最近邻搜索方法对子空间分别进行量化,运用非对称距离算法计算特征向量之间的欧氏距离,提出一种新的数字图像复制粘贴被动盲取证方法。实验结果表明,该方法能够准确... 采用一种基于尺度不变特征变换的算法提取图像特征,使用乘积量化的近似最近邻搜索方法对子空间分别进行量化,运用非对称距离算法计算特征向量之间的欧氏距离,提出一种新的数字图像复制粘贴被动盲取证方法。实验结果表明,该方法能够准确地对复制区域经过预处理的伪造进行检测,减少内存的使用量和空间复杂度,缩短搜索时间。 展开更多
关键词 尺度不变特征变换 乘积量化 近似最近邻搜索 非对称距离计算 复制粘贴盲取证
下载PDF
基于最优密度估计的密度峰值聚类算法 被引量:2
16
作者 覃华 刘政 苏一丹 《计算机工程与设计》 北大核心 2020年第7期1877-1883,共7页
针对密度峰值聚类算法(clustering by fast search and find of density peaks,DPC)聚类无特定形状的实际数据集时聚类精度欠佳的问题,提出一种最优化密度估计的密度峰聚值类算法。使用最优Oracle逼近(Oracle approximating shrinkage,... 针对密度峰值聚类算法(clustering by fast search and find of density peaks,DPC)聚类无特定形状的实际数据集时聚类精度欠佳的问题,提出一种最优化密度估计的密度峰聚值类算法。使用最优Oracle逼近(Oracle approximating shrinkage,AS)计算出最优协方差矩阵,利用最优协方差矩阵构造马氏距离,通过最优协方差矩阵提高DPC对数据相似度的区分能力,在此基础上结合K近邻算法,实现数据样本密度最优估计,利用最优密度估计提高DPC对实际数据集的聚类精度。在人工数据集和UCI真实数据集上进行仿真实验,实验结果表明,改进DPC算法的思路是可行的。 展开更多
关键词 密度峰值聚类算法 K近邻 协方差矩阵 最优Oracle估计 最优密度估计
下载PDF
量化编码的分层可通航小世界图算法 被引量:1
17
作者 李秋珍 白兴强 +1 位作者 李立夏 王赢 《计算机工程与科学》 CSCD 北大核心 2019年第4期618-625,共8页
随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界... 随着大数据和人工智能的高速发展,针对多媒体数据的结构化处理与基于内容的检索受到极大的关注,面对多媒体数据结构化后的海量高维特征向量,如何快速、准确地检索是人工智能处理大规模数据所必须解决的问题。最近提出的分层可通航小世界图HNSW检索算法在多个公开数据集取得了最佳的性能表现,但该算法存在内存开销大的问题。而基于量化编码的检索算法能够压缩数据集向量,大幅度降低内存占用。将量化编码和分层可通航小世界图算法结合,提出了2种基于量化编码改进的HNSW算法,分别是使用标量量化编码向量的HNSWSQ算法和使用乘积量化编码向量的HNSWPQ算法,2种算法使用不同的量化策略存储原始向量编码,以降低内存开销,再通过HNSW算法建立索引达到缩短检索耗时的目的。其中HNSWSQ算法在多个数据集上获得了与HNSW算法相近的查全率和平均检索耗时,而内存开销大幅降低。实验结果表明,HNSWSQ算法在SIFT-1M和GIST-1M数据集上的内存开销比HNSW算法分别降低了45.1%和70.4%。 展开更多
关键词 近似最近邻检索 分层可通航小世界图算法 乘积量化 标量量化 相似性搜索 高维数据索引
下载PDF
基于Hadamard变换的高维图像检索方法
18
作者 崔江涛 周水生 周利华 《计算机科学》 CSCD 北大核心 2006年第3期212-214,共3页
传统索引方法对高维数据进行近邻搜索时会面临维数灾难问题,向量近似方法是一种有效的高维检索方法。提出一种 Hadamard 变换域上的向量近似方法,在变换域能量最大的分量上建立顺序索引,然后建立近似向量文件。同时提出低維过滤算法,可... 传统索引方法对高维数据进行近邻搜索时会面临维数灾难问题,向量近似方法是一种有效的高维检索方法。提出一种 Hadamard 变换域上的向量近似方法,在变换域能量最大的分量上建立顺序索引,然后建立近似向量文件。同时提出低維过滤算法,可以在近邻搜索过程中高效排除不匹配近似向量,减少 I/O 访问时间,提高查询效率。在大型高维图像特征库上的实验表明,该方法性能优于小波变换域的向量近似方法。 展开更多
关键词 图像数据库 维数灾难 k-近邻搜索 向量近似 HADAMARD变换
下载PDF
HL-DAQ:一种Hash学习的动态自适应量化编码
19
作者 赵亮 王永利 +1 位作者 杜仲舒 陈广生 《计算机研究与发展》 EI CSCD 北大核心 2018年第6期1294-1307,共14页
现有基于Hash学习二进制编码方法通常学习一组用于数据投影的超平面,并且简单地对来自每个超平面划分的结果进行二值化编码,而忽视了信息可能不均匀地分布在整个投影中且每一维投影中数据取值范围可能不一样的事实.为了解决此问题提出... 现有基于Hash学习二进制编码方法通常学习一组用于数据投影的超平面,并且简单地对来自每个超平面划分的结果进行二值化编码,而忽视了信息可能不均匀地分布在整个投影中且每一维投影中数据取值范围可能不一样的事实.为了解决此问题提出一种动态自适应编码量化方法,根据投影维度的信息量动态地为该维度分配相应的二进制编码位数,并通过动态规划方法使得所有投影的总信息量最大,以尽可能地保留原始数据的近邻结构.经实验验证,动态自适应编码量化方法较传统的Hash量化方法有显著的改进,理论证明:动态自适应编码方法和距离度量方式对原始数据的近邻结构保持优于传统固定位数量化编码及海明距离度量方式. 展开更多
关键词 量化 近似最近邻 动态自适应编码 动态规划 动态自适应距离 二进制编码
下载PDF
一种新的不确定性时间序列概率相似查找方法
20
作者 廖建平 《计算机系统应用》 2013年第4期138-141,124,共5页
针对传统的数据管理中的数据表示、存储与索引、查询与挖掘等所有技术,不能直接应用于不确定性时间序列数据的相似性查找的不足.研究了可用于不确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术,针对不确定性时间序列数据... 针对传统的数据管理中的数据表示、存储与索引、查询与挖掘等所有技术,不能直接应用于不确定性时间序列数据的相似性查找的不足.研究了可用于不确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术,针对不确定性时间序列数据结构的复杂性,首次给出了不确定性时间序列上的概率最近邻的定义;将不确定性时间序列进行了PLA降维,转换到PLA空间,并提出了三个引理,用以加速查找效率;基于该三个引理,提出了概率K最近邻查找算法PKNNS.通过实验,验证了PKNNS算法的有效性和效率. 展开更多
关键词 不确定性时间序列 分段线性逼近 相似性查找 最近邻查找
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部