期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
ML组合的CYGNSS海面风速反演质量控制模型
1
作者 张云 赵星宇 +3 位作者 杨树瑚 孙聪 韩彦岭 尹继伟 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第1期20-29,共10页
卷积神经网络(CNN)可用于气旋全球导航卫星系统(CYGNSS)的海面风速反演。虽然在模型训练前设置了质量控制指标来检测和削弱CYGNSS的异常观测数据,但CYGNSS观测数据中仍存在异常值导致模型反演精度降低,甚至出现错误反演结果。因此,提出... 卷积神经网络(CNN)可用于气旋全球导航卫星系统(CYGNSS)的海面风速反演。虽然在模型训练前设置了质量控制指标来检测和削弱CYGNSS的异常观测数据,但CYGNSS观测数据中仍存在异常值导致模型反演精度降低,甚至出现错误反演结果。因此,提出一种基于机器学习(ML)组合的海面风速反演模型。在基于CNN回归模型的CYGNSS反演海面风速基础上,ML分类模型生成CNN回归结果的质量标志位,该标志位可以检测并删除CNN回归结果的异常值,进一步提高风速反演结果的数据质量,ML分类模型能够更好地考虑各种数据误差之间的相互作用,而不是单独使用每个条件的阈值,以达到更优的海面风速反演精度的效果。实验对比了Logistic回归(LR)、决策树(DT)、朴素贝叶斯模型、K最邻近(KNN)算法、神经网络(NN)模型、支持向量机(SVM)算法等6个分类模型,其中,基于KNN算法的分类模型对风速反演质量控制的效果最优。所提风速反演组合模型显著提高了反演结果的精度,在0~20 m/s区间内,异常样本过滤率为81.27%,在所有被过滤的数据中,过滤正确率为86.03%;风速反演误差的均方根误差从无ML分类模型的1.7 m/s降低到有ML分类模型的1.44 m/s,其中,训练样本为0~10 m/s的反演结果精度提升效果较为明显,证明了所提风速反演组合模型对风速质量控制的有效性。 展开更多
关键词 气旋全球导航卫星系统 风速反演 质量控制 机器学习组合模型 卷积神经网络 K最邻近算法
下载PDF
基于密文KNN检索的室内定位隐私保护算法
2
作者 欧锦添 乐燕芬 施伟斌 《数据采集与处理》 CSCD 北大核心 2024年第2期456-470,共15页
在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于... 在定位请求服务中,如何保护用户的位置隐私和位置服务提供商(Localization service provider,LSP)的数据隐私是关系到WiFi指纹定位应用的一个具有挑战性的问题。基于密文域的K-近邻(K-nearest neighbors,KNN)检索,本文提出了一种适用于三方的定位隐私保护算法,能有效提升对LSP指纹信息隐私的保护强度并降低计算开销。服务器和用户分别完成对指纹信息和定位请求的加密,而第三方则基于加密指纹库和加密定位请求,在隐私状态下完成对用户的位置估计。所提算法把各参考点的位置信息随机嵌入指纹,可避免恶意用户获取各参考点的具体位置;进一步利用布隆滤波器在隐藏接入点信息的情况下,第三方可完成参考点的在线匹配,实现对用户隐私状态下的粗定位,可与定位算法结合降低计算开销。在公共数据集和实验室数据集中,对两种算法的安全、开销和定位性能进行了全面的评估。与同类加密算法比较,在不降低定位精度的情况下,进一步增强了对数据隐私的保护。 展开更多
关键词 隐私保护 指纹定位 密文K-近邻检索 布隆滤波器 WIFI
下载PDF
基于均衡聚类索引的近似最近邻检索方法
3
作者 吕宏伟 李博 +3 位作者 刘普凡 刘识 李继伟 刘俊健 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第2期99-108,共10页
大数据时代,深度学习通过将复杂对象表示为高维特征向量,并使用向量之间的距离度量来衡量样本的相似性,在推荐系统、用户画像、数据中台管理等场景中得到了广泛的应用.但是,随着数据规模的不断增加,海量特征数据的相似向量检索面临着检... 大数据时代,深度学习通过将复杂对象表示为高维特征向量,并使用向量之间的距离度量来衡量样本的相似性,在推荐系统、用户画像、数据中台管理等场景中得到了广泛的应用.但是,随着数据规模的不断增加,海量特征数据的相似向量检索面临着检索模型占用内容大、特征检索算法召回率较低的严重挑战.如何在保证检索精度的前提下,设计紧凑型索引图结构,降低特征检索的内存消耗,对于提升大数据系统的近邻检索效率具有重要的作用.因此,本文提出了一种均衡感知的快速K均值近邻聚类的特征数据分桶及其图结构紧凑型索引用于海量数据近邻检索.首先,设计了均衡感知的快速K-均值聚类算法,通过在图索引构建过程中海量特征数据的均衡分桶,将高维向量压缩成轻量级紧凑型图索引结构,随后通过量化操作进一步压缩高维向量样本,提升其在候选集上的最近邻检索速度.在基准数据集上实验验证结果表明,本文提出的方法能够在保证较高检测召回率的同时,有效加快索引构建速度,可以用于支持高维特征数据的高效最近邻检索. 展开更多
关键词 大数据检索与分析 最近邻搜索 均衡感知
下载PDF
Precipitation Retrieval from Himawari-8 Satellite Infrared Data Based on Dictionary Learning Method and Regular Term Constraint 被引量:2
4
作者 Wang Gen Ding Conghui Liu Huilan 《Meteorological and Environmental Research》 CAS 2019年第3期61-65,68,共6页
In this paper,the application of an algorithm for precipitation retrieval based on Himawari-8 (H8) satellite infrared data is studied.Based on GPM precipitation data and H8 Infrared spectrum channel brightness tempera... In this paper,the application of an algorithm for precipitation retrieval based on Himawari-8 (H8) satellite infrared data is studied.Based on GPM precipitation data and H8 Infrared spectrum channel brightness temperature data,corresponding "precipitation field dictionary" and "channel brightness temperature dictionary" are formed.The retrieval of precipitation field based on brightness temperature data is studied through the classification rule of k-nearest neighbor domain (KNN) and regularization constraint.Firstly,the corresponding "dictionary" is constructed according to the training sample database of the matched GPM precipitation data and H8 brightness temperature data.Secondly,according to the fact that precipitation characteristics in small organizations in different storm environments are often repeated,KNN is used to identify the spectral brightness temperature signal of "precipitation" and "non-precipitation" based on "the dictionary".Finally,the precipitation field retrieval is carried out in the precipitation signal "subspace" based on the regular term constraint method.In the process of retrieval,the contribution rate of brightness temperature retrieval of different channels was determined by Bayesian model averaging (BMA) model.The preliminary experimental results based on the "quantitative" evaluation indexes show that the precipitation of H8 retrieval has a good correlation with the GPM truth value,with a small error and similar structure. 展开更多
关键词 Himawari-8(H8) retrieval of PRECIPITATION k-nearest neighbor (KNN) REGULAR TERM constraints DICTIONARY method Bayesian model average (BMA)
下载PDF
随机森林法在母型船选型中的应用研究 被引量:1
5
作者 张明霞 赵桐鸣 王思沂 《应用科技》 CAS 2023年第5期126-132,174,共8页
船型技术经济论证中首先需要选择合适的母型船作为初始方案,在此基础上进行船型变换及优选。如何快速地从大量实船方案中筛选出最接近设计方案的船型,是技术经济论证工作智能化不可回避的问题。文中以油轮为例,收集了617艘船舶主尺度等... 船型技术经济论证中首先需要选择合适的母型船作为初始方案,在此基础上进行船型变换及优选。如何快速地从大量实船方案中筛选出最接近设计方案的船型,是技术经济论证工作智能化不可回避的问题。文中以油轮为例,收集了617艘船舶主尺度等相关要素,建立实船案例库;采用随机森林加权算法获取特征属性的权重,检索出与目标方案最近的方案作为母型船;为验证有效性,与普通权重法、熵权法及层次分析法–熵权法的组合权重法进行比较。结果表明,基于随机森林加权的最近邻算法平均准确率最大值高1%~2%,平均宏观f1分数最大值高1%~6%,检索出的方案与目标方案相似度最高。随机森林法的准确度高,实现了母型船案例检索的智能化与自动化。 展开更多
关键词 母型船检索 智能化 知识工程 基于案例推理 K最近邻算法 随机森林算法 组合赋权法 分类性能评估
下载PDF
融合多重实例关系的无监督跨模态哈希检索
6
作者 李志欣 侯传文 谢秀敏 《软件学报》 EI CSCD 北大核心 2023年第11期4973-4988,共16页
大多数跨模态哈希检索方法仅使用余弦相似度进行特征匹配,计算方式过于单一,没有考虑到实例的关系对于性能的影响.为此,提出一种基于多重实例关系图推理的方法,通过构造相似度矩阵,建立全局和局部的实例关系图,充分挖掘实例之间的细粒... 大多数跨模态哈希检索方法仅使用余弦相似度进行特征匹配,计算方式过于单一,没有考虑到实例的关系对于性能的影响.为此,提出一种基于多重实例关系图推理的方法,通过构造相似度矩阵,建立全局和局部的实例关系图,充分挖掘实例之间的细粒度关系.在多重实例关系图的基础上进行相似度推理,首先分别进行图像模态和文本模态关系图内部的推理,然后将模态内的关系映射到实例图中进行推理,最后执行实例图内部的推理.此外,为了适应图像和文本两种模态的特点,使用分步训练策略训练神经网络.在MIRFlickr和NUS-WIDE数据集上实验表明,提出的方法在mAP指标上具有很明显的优势,在Top-k-Precision曲线上也获得良好的效果.这也说明所提方法对实例关系进行深入挖掘,从而显著地提升检索性能. 展开更多
关键词 关系图推理 跨模态哈希检索 相似度矩阵 K近邻 分步训练策略
下载PDF
稠密向量实体检索模型的二值化提速压缩 被引量:1
7
作者 王苑铮 范意兴 +2 位作者 陈薇 张儒清 郭嘉丰 《模式识别与人工智能》 EI CSCD 北大核心 2023年第1期60-69,共10页
在实体检索任务中,为了从大规模实体库中高效筛选与查询相关的候选实体,可使用稠密向量检索模型.然而在现有的稠密向量检索模型中,由于实体向量维度较高,导致实时计算效率较低、存储空间较大.文中通过实验发现这些实体向量存在大量的冗... 在实体检索任务中,为了从大规模实体库中高效筛选与查询相关的候选实体,可使用稠密向量检索模型.然而在现有的稠密向量检索模型中,由于实体向量维度较高,导致实时计算效率较低、存储空间较大.文中通过实验发现这些实体向量存在大量的冗余信息:一方面,绝大多数实体向量分布在互不相同的象限里;另一方面,语义相近的实体所在的象限也更近.因此,文中提出二值化的实体检索方法,用于压缩实体向量,加速相似度计算.具体而言,方法利用符号函数(sign),二值化压缩高维稠密的浮点向量,并通过汉明距离加快检索.从理论上分析文中方法保证检索性能的原因.通过定性、定量的分析实验验证理论的正确性,并给出基于随机升维旋转的二值检索性能改善方法. 展开更多
关键词 实体检索 嵌入式表示 稠密向量检索 近似近邻检索 乘积量化
下载PDF
图索引结构词袋模型的无人机影像匹配对检索 被引量:2
8
作者 刘思康 郭丙轩 +1 位作者 姜三 鄢茂胜 《测绘通报》 CSCD 北大核心 2023年第4期93-98,共6页
无人机影像匹配对选择是提升影像匹配效率和三维重建稳健性的关键技术。针对经典树状索引结构词袋模型存在查找单词效率低、影像相似度计算精度低、时间复杂度高的问题,本文设计了导航小世界(NSW)图索引结构和TF-IDF-Match4算法,并提出... 无人机影像匹配对选择是提升影像匹配效率和三维重建稳健性的关键技术。针对经典树状索引结构词袋模型存在查找单词效率低、影像相似度计算精度低、时间复杂度高的问题,本文设计了导航小世界(NSW)图索引结构和TF-IDF-Match4算法,并提出了一种基于图索引结构词袋模型(GSBoW)的无人机影像匹配对检索方法。首先,利用SIFT GPU算法提取无人机影像特征,并通过分层K-means进行特征描述子集合聚类生成单词;然后,利用NSW索引结构进行单词组织,即从单词集合中随机挑选单词作为顶点插入图中,同时找到最邻近M个顶点建立顶点之间的边连接关系,直至所有单词插入结束;最后,在GPU端利用NSW索引结构进行最邻近单词检索,并使用TF-IDF-Match4算法计算查询影像与数据集影像的相似度,实现无人机影像的匹配对选择。本文利用3组大规模航空无人机影像进行试验,并与Colmap和DBoW的词袋模型算法进行对比。结果表明,与Colmap和DBoW词袋模型相比,本文的GSBoW检索算法效率分别提高了45和18倍,且显著提高了初始匹配精度。本文方法提供的影像匹配对能够保证三维重建获得更高的精度。 展开更多
关键词 影像检索 词汇树 导航小世界 TF-IDF-Match4加权 GPU 最邻近查找
下载PDF
骨架数据增强和双重最近邻检索自监督动作识别
9
作者 吴雨珊 徐增敏 +1 位作者 张雪莲 王涛 《计算机科学》 CSCD 北大核心 2023年第11期97-106,共10页
传统基于骨架数据的自监督方法常将某一样本的不同增强作为正例,将其余样本均视为负例,这使得正负样本的比例严重失衡,限制了相同语义信息的样本发挥作用。针对上述问题,提出了一种正样本不受数据增强限制的双重最近邻检索动作识别算法D... 传统基于骨架数据的自监督方法常将某一样本的不同增强作为正例,将其余样本均视为负例,这使得正负样本的比例严重失衡,限制了相同语义信息的样本发挥作用。针对上述问题,提出了一种正样本不受数据增强限制的双重最近邻检索动作识别算法DNNCLR。首先,基于人体关节的物理连接设计了一个新的关节级空间数据增强,即Bodypart增强,对输入的骨架序列用正态分布数组随机替换,以获得高级语义嵌入;其次,为避免正样本受数据增强的限制,提出了一种更合理的双重最近邻检索(DNN)正样本扩充策略,进一步提出了双重最近邻检索对比损失DNN Loss。具体为利用支撑集进行全局检索,将正样本集的寻找范围扩展到普通数据增强无法覆盖的新数据点;而负样本集中存在被误判的正样本,其是来自不同视频但语义信息相同的骨架样本。为此,再一次利用最近邻检索,从负样本集中寻找这种潜在的正例,二次扩展正样本集,并进一步提出双重最近邻检索对比损失,迫使模型学习更多的一般特征表示,使得模型优化更加合理。最后,将DNNCLR算法应用在AimCLR模型上,得到AimDNNCLR模型,并在NTU-RGB+D数据集上对该模型进行了线性评估,与前沿模型相比,所提方法在精度上平均提升了3.6%。 展开更多
关键词 对比学习 最近邻检索 数据增强 动作识别 人体骨架
下载PDF
量化误差的索引检索方法
10
作者 陈伟林 《福建电脑》 2023年第1期12-16,共5页
为了提高乘积量化的近邻检索方法的检索精度,本文提出了量化误差的索引检索方法。该方法以子空间量化误差为依据进行子空间码字的选择,以获取高质量的乘积量化候选码字,提高基于乘积量化的近邻检索方法的检索精度。最后,通过把索引检索... 为了提高乘积量化的近邻检索方法的检索精度,本文提出了量化误差的索引检索方法。该方法以子空间量化误差为依据进行子空间码字的选择,以获取高质量的乘积量化候选码字,提高基于乘积量化的近邻检索方法的检索精度。最后,通过把索引检索方法应用于5种基于乘积量化的索引结构上,在3个基准数据集上进行实验。实验结果表明,索引检索方法可以提高检索精度的有效性。 展开更多
关键词 近邻检索 乘积量化 量化误差 索引检索方法
下载PDF
一种有效的用于范例提取的改进聚类算法 被引量:7
11
作者 耿焕同 章曙光 +2 位作者 钱权 蔡庆生 王煦法 《小型微型计算机系统》 CSCD 北大核心 2004年第3期388-390,共3页
针对传统范例提取算法随范例数增加而效率下降快的缺点 ,结合基于选择的 CL ARA聚类方法和 NCL聚类算法的优点 ,给出了一种有效的无监督聚类学习算法 .通过实验表明 ,该算法能在无监督下对范例进行准确归类 ,将它用于 CBR的范例提取中 。
关键词 CBR 范例提取 相似度 最近邻检索 无监督聚类学习算法 CLARA聚类方法 NCL聚类算法 范例推理
下载PDF
利用改进NFL算法对镜头进行基于内容的检索 被引量:12
12
作者 赵黎 杨士强 +2 位作者 祁卫 李子青 张宏江 《软件学报》 EI CSCD 北大核心 2002年第4期586-590,共5页
基于镜头的分类和检索对于视频库的管理和查询非常重要.将“最近特征线”法(nearest feature line,简称NFL)用于镜头的分类和检索.将镜头中的代表帧看做是某个特征空间中的点,通过这些点间的连线表征该镜头的总体特征信息,然后计算查... 基于镜头的分类和检索对于视频库的管理和查询非常重要.将“最近特征线”法(nearest feature line,简称NFL)用于镜头的分类和检索.将镜头中的代表帧看做是某个特征空间中的点,通过这些点间的连线表征该镜头的总体特征信息,然后计算查询图像和特征线的距离,以决定镜头与查询图像的相似度.为了更适于视频数据,对原来的NFL方法进行了改进,基于镜头内部内容活动程度对特征线进行限制、实验结果表明,改进的NFL方法比传统的NFL方法以及常用的聚类万法,如最近邻法(nearest neighbor,简称NN)和最近中心法(nearest center,简称NC),在性能上有所提高. 展开更多
关键词 内容检索 最近特征线 视频检索 视频分类 视频镜头 NFL算法 视频数据库
下载PDF
基于工艺相似的冲压件实例检索方法 被引量:13
13
作者 朱文博 李爱平 刘雪梅 《计算机集成制造系统》 EI CSCD 北大核心 2007年第4期721-726,共6页
为充分应用冲压工艺的成功经验,提出了一种基于工艺相似的冲压件实例检索的方法。首先,从冲压件3维模型中提取特征与特征间约束,并根据冲压件材料信息表,获得材料的厚度、强度和硬度。然后,从工艺相似的角度,分两个阶段计算新旧冲压件... 为充分应用冲压工艺的成功经验,提出了一种基于工艺相似的冲压件实例检索的方法。首先,从冲压件3维模型中提取特征与特征间约束,并根据冲压件材料信息表,获得材料的厚度、强度和硬度。然后,从工艺相似的角度,分两个阶段计算新旧冲压件实例的相似度。第一阶段以平面为基准计算冲压件拓扑关系相似度,过滤掉一些完全不相似和不太相似的旧实例,得到一批较为相似的旧实例,缩小了后续阶段的检索空间;第二阶段通过比较新旧实例间特征、约束和材料的综合相似度,从第一阶段获得的一批旧实例中得到一个最相似的旧实例。最后,通过实例验证了该方法的有效性。 展开更多
关键词 冲压件 实例检索 工艺相似 相似度 最近邻法
下载PDF
保护位置隐私和查询内容隐私的路网K近邻查询方法 被引量:12
14
作者 周长利 陈永红 +1 位作者 田晖 蔡绍滨 《软件学报》 EI CSCD 北大核心 2020年第2期471-492,共22页
位置隐私和查询内容隐私是LBS兴趣点(point of interest,简称POI)查询服务中需要保护的两个重要内容,同时,在路网连续查询过程中,位置频繁变化会给LBS服务器带来巨大的查询处理负担,如何在保护用户隐私的同时,高效地获取精确查询结果,... 位置隐私和查询内容隐私是LBS兴趣点(point of interest,简称POI)查询服务中需要保护的两个重要内容,同时,在路网连续查询过程中,位置频繁变化会给LBS服务器带来巨大的查询处理负担,如何在保护用户隐私的同时,高效地获取精确查询结果,是目前研究的难题.以私有信息检索中除用户自身外其他实体均不可信的思想为基本假设,基于Paillier密码系统的同态特性,提出了无需用户提供真实位置及查询内容的K近邻兴趣点查询方法,实现了对用户位置、查询内容隐私的保护及兴趣点的精确检索;同时,以路网顶点为生成元组织兴趣点分布信息,进一步解决了高强度密码方案在路网连续查询中因用户位置变化频繁导致的实用效率低的问题,减少了用户的查询次数,并能确保查询结果的准确性.最后从准确性、安全性及查询效率方面对本方法进行了分析,并通过仿真实验验证了理论分析结果的正确性. 展开更多
关键词 基于位置的服务 隐私保护 连续K近邻查询 私有信息检索
下载PDF
基于事例推理系统中检索策略的分析与研究 被引量:9
15
作者 黄玉基 魏伟杰 曾文 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第1期33-36,共4页
讨论了基于事例推理(CBR)在人工智能系统中的作用,分析了常用的CBR检索算法,并着重研究了提高系统检索效率问题.针对CBR系统的关键性问题事例检索,提出了一种分级检索算法与最近相邻算法相结合的检索策略(L&NCBR),分析了在精确匹配... 讨论了基于事例推理(CBR)在人工智能系统中的作用,分析了常用的CBR检索算法,并着重研究了提高系统检索效率问题.针对CBR系统的关键性问题事例检索,提出了一种分级检索算法与最近相邻算法相结合的检索策略(L&NCBR),分析了在精确匹配与非精确匹配情况下该策略的效率,并给出了基于L&NCBR的智能推理系统运行情况分析.结果表明L&NCBR策略在提高系统检索的稳定性和效率方面是有效的. 展开更多
关键词 人工智能 CBR 分级检索算法 最近相邻算法
下载PDF
基于内容的图像检索的相似度测量方法 被引量:12
16
作者 王春静 许圣梅 《数据采集与处理》 CSCD 北大核心 2017年第1期104-110,共7页
图像特征匹配是基于内容的图像检索(Content-based image retrieval,CBIR)实现的一个关键环节,而图像特征的匹配主要依赖于图像特征之间的相似度测量。为了提高CBIR的检索性能,本文提出了一种有效的相似度测量方法——基于图像k近邻的... 图像特征匹配是基于内容的图像检索(Content-based image retrieval,CBIR)实现的一个关键环节,而图像特征的匹配主要依赖于图像特征之间的相似度测量。为了提高CBIR的检索性能,本文提出了一种有效的相似度测量方法——基于图像k近邻的相似度测量(Similarity measure based on k-nearest neighbors of images,SBkNN)方法。在该方法中,查询图像与被检索图像的相似度通过计算这两幅图像属于同一语义(无论是哪种语义)种类的联合概率来衡量,而此概率可分别通过分析这两幅图像与各自近邻图像的距离得到。最后利用Corel5k数据集对本文所提出的SBkNN方法和传统的相似度测量方法进行了对比。实验结果表明,在CBIR中使用本文提出的SBkNN方法,有效地提高了CBIR的检索性能。 展开更多
关键词 基于内容的图像检索 K近邻 相似度 召回率 查准率
下载PDF
开放环境多分布特性的局部敏感哈希检索方法 被引量:5
17
作者 张仕 赖会霞 +3 位作者 肖如良 潘淼鑫 张路路 陈伟林 《软件学报》 EI CSCD 北大核心 2022年第4期1200-1217,共18页
基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境... 基于局部敏感哈希的检索方法能够较好地解决高维大规模数据的近似近邻检索问题.但在开放环境下针对多种分布特性时,迄今尚未有令人满意的解决方案.利用Laplacian算子对数据分布剧烈变化敏感的特性,提出一种具有全局性、适用于开放环境下多种分布特性的基于Laplacian算子的局部敏感哈希搜索方法(LPLSH).该方法把Laplacian算子应用于数据投影的概率密度分布,找到数据投影分布的剧烈变化位置作为超平面的偏移量.从理论上证明了精简维度的哈希函数能够保持局部敏感性及低投影密度区间分割的有效性,分析了利用Laplacian算子计算的二阶导数对超平面偏移量设置的指导意义.与其他8种方法对比,LPLSH算法的F1值是其他方法最优值的0.8倍-5倍,耗费时间也大幅减少.通过对具有多种分布特性数据集上的实验验证,结果表明:LPLSH方法能够同时兼顾效率、精度和召回率,可满足开放环境下多分布特性的大规模高维检索的鲁棒性需求. 展开更多
关键词 开放环境 近似近邻检索 数据多分布特性 局部敏感哈希 数据检索
下载PDF
变权值下的最近相邻检索策略 被引量:5
18
作者 张光前 邓贵仕 王瑾 《计算机工程与应用》 CSCD 北大核心 2003年第11期40-41,60,共3页
最近相邻策略是基于事例推理(CBR)中常用的检索策略。针对该方法的缺点该文提出了变权值的最近相邻检索,并探讨了变权值带来的问题,在此基础上该文给出了两种解决方法,事例检索记忆表和采用神经网络与最近相邻策略相结合的方法来检索相... 最近相邻策略是基于事例推理(CBR)中常用的检索策略。针对该方法的缺点该文提出了变权值的最近相邻检索,并探讨了变权值带来的问题,在此基础上该文给出了两种解决方法,事例检索记忆表和采用神经网络与最近相邻策略相结合的方法来检索相似源事例,可在变权值的情况下快速地检索出相关的源事例。从而解决了事例库的设计者和使用者之间的由视角不同而产生的矛盾。 展开更多
关键词 基于事例推理(CBR) 最近相邻策略 事例检索记忆表 神经网络
下载PDF
一种基于k最近邻的快速文本分类方法 被引量:14
19
作者 张庆国 张宏伟 张君玉 《中国科学院研究生院学报》 CAS CSCD 2005年第5期554-559,共6页
k最近邻方法是一种简单而有效的文本分类方法,但是传统的k最近邻分类方法在训练集数据量很大情况下,全局的最优搜索几乎是不可能的.因此,加速k个最近邻的搜索是k最近邻方法实用的关键.提出了一种基于k最近邻的快速文本分类方法,它能够... k最近邻方法是一种简单而有效的文本分类方法,但是传统的k最近邻分类方法在训练集数据量很大情况下,全局的最优搜索几乎是不可能的.因此,加速k个最近邻的搜索是k最近邻方法实用的关键.提出了一种基于k最近邻的快速文本分类方法,它能够保证在海量数据集中进行快速有效的分类.实验结果表明,这一方法较传统方法性能有显著提升. 展开更多
关键词 文本分类 k最近邻 多维索引 相似检索
下载PDF
面向高维图像特征匹配的多次随机子向量量化哈希算法 被引量:9
20
作者 杨恒 王庆 何周灿 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第3期494-502,510,共10页
为了解决高维图像特征的高效匹配问题,提出一种新的基于多次随机子向量量化哈希(MRSVQH)的索引算法.该算法根据随机选择的若干子向量的L2范数对特征向量进行量化,并根据量化值对特征向量进行散列,构建出哈希索引结构;为了提高搜索精度,... 为了解决高维图像特征的高效匹配问题,提出一种新的基于多次随机子向量量化哈希(MRSVQH)的索引算法.该算法根据随机选择的若干子向量的L2范数对特征向量进行量化,并根据量化值对特征向量进行散列,构建出哈希索引结构;为了提高搜索精度,类似的哈希索引结构被多次构建.搜索时仅考察与查询向量有相同哈希值的特征向量集合,缩减了搜索范围.实验数据表明,与经典的BBF和LSH算法相比,MRSVQH算法在图像特征的最近邻搜索精度和搜索速度方面都有较大的性能提升,在图像匹配和图像检索的应用中具有优势. 展开更多
关键词 高维特征匹配 最近邻搜索 图像匹配 图像检索 多次随机子向量量化哈希
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部