期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
基于视觉词典的单目视觉闭环检测算法 被引量:17
1
作者 梁志伟 陈燕燕 +2 位作者 朱松豪 高翔 徐国政 《模式识别与人工智能》 EI CSCD 北大核心 2013年第6期561-570,共10页
针对移动机器人单目视觉同步定位与地图构建中的闭环检测问题,文中设计一种基于视觉词典的闭环检测算法.算法对采集的每帧图像通过SURF进行特征提取,应用模糊K均值算法对检测的视觉特征向量进行分类,在线构建表征图像的视觉词典.为精确... 针对移动机器人单目视觉同步定位与地图构建中的闭环检测问题,文中设计一种基于视觉词典的闭环检测算法.算法对采集的每帧图像通过SURF进行特征提取,应用模糊K均值算法对检测的视觉特征向量进行分类,在线构建表征图像的视觉词典.为精确表征局部视觉特征与视觉单词间的相似关联,利用混合高斯模型建立视觉词典中的每一视觉单词的概率模型,实现图像基于视觉词典的概率向量表示,通过向量的内积来计算图像间的相似度.为保证闭环检测的成功率,应用贝叶斯滤波融合历史闭环检测与相似度信息来计算闭环假设的后验概率分布.另外,引入浅层记忆与深度记忆两种内存管理机制来保证算法执行的快速性.实验结果证明该方法的有效性. 展开更多
关键词 单目视觉同步定位与地图构建 闭环检测 视觉词典 混合高斯模型
下载PDF
一种基于随机化视觉词典组和查询扩展的目标检索方法 被引量:9
2
作者 赵永威 李弼程 +1 位作者 彭天强 高毫林 《电子与信息学报》 EI CSCD 北大核心 2012年第5期1154-1161,共8页
在目标检索领域,当前主流的解决方案是视觉词典法(Bag of Visual Words,BoVW),然而,传统的BoVW方法具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题。针对以上问题,该文提出了一种基于随机化视觉词典组和查询扩展的目标检... 在目标检索领域,当前主流的解决方案是视觉词典法(Bag of Visual Words,BoVW),然而,传统的BoVW方法具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题。针对以上问题,该文提出了一种基于随机化视觉词典组和查询扩展的目标检索方法。首先,该方法采用精确欧氏位置敏感哈希(Exact Euclidean LocalitySensitive Hashing,E2LSH)对训练图像库的局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;然后,基于这组词典构建视觉词汇分布直方图和索引文件;最后,引入一种查询扩展策略完成目标检索。实验结果表明,与传统方法相比,该文方法有效地增强了目标对象的可区分性,能够较大地提高目标检索精度,同时,对大规模数据库有较好的适用性。 展开更多
关键词 目标检索 视觉词典 随机化视觉词典 精确欧氏位置敏感哈希 查询扩展
下载PDF
基于视觉词典法的母牛产前行为识别 被引量:16
3
作者 温长吉 王生生 +3 位作者 赵昕 王忞 马丽 刘依婷 《农业机械学报》 EI CAS CSCD 北大核心 2014年第1期266-274,共9页
母牛活动方式及规律的信息获取是特定阶段进行必要人工干预的重要判据之一,针对已有通过外置传感器获取信息手段的局限性,提出一种改进时空局部二值模式用于特征描述,构建视觉词典实现对视频中母牛基本行为的识别,并最终通过统计产前特... 母牛活动方式及规律的信息获取是特定阶段进行必要人工干预的重要判据之一,针对已有通过外置传感器获取信息手段的局限性,提出一种改进时空局部二值模式用于特征描述,构建视觉词典实现对视频中母牛基本行为的识别,并最终通过统计产前特定基本行为发生频次来揭示临产期规律。试验表明所提方法对90组规定视角下母牛产前行走、侧卧和回望等典型行为的平均正确识别率约为94.6%;对30组水平随机视角下拍摄的上述3种行为平均正确识别率约为88.3%。通过采集母牛临产期分娩前后约13 h的视频,提出的算法识别母牛平均执行回望和侧卧的频次依次为30次和21.2次,行为发生频次体现为前低后高,在分娩前回望频次达到峰值8.8次,侧卧频次明显减低为2.2次。试验结果证明,视觉词典法能实现对母牛产期行为的识别与规律的量化描述。 展开更多
关键词 母牛 产前行为 视觉词典 改进局部二值模式 时空兴趣点
下载PDF
一种基于多级空间视觉词典集体的图像分类方法 被引量:13
4
作者 罗会兰 郭敏杰 孔繁胜 《电子学报》 EI CAS CSCD 北大核心 2015年第4期684-693,共10页
针对单一特征时存在提取的信息量不足,对图像内容描述比较片面,提出将传统的SIFT特征与KDESG特征进行串行融合,生成一个联合向量作为新的特征向量.针对传统的视觉词典构造方法缺乏考虑视觉词汇在空间的分布特点,本文引入图像空间信息,... 针对单一特征时存在提取的信息量不足,对图像内容描述比较片面,提出将传统的SIFT特征与KDESG特征进行串行融合,生成一个联合向量作为新的特征向量.针对传统的视觉词典构造方法缺乏考虑视觉词汇在空间的分布特点,本文引入图像空间信息,提出了一种空间视觉词典的构造方法,先对图像进行空间金字塔划分,再把空间各子区域内的特征分别聚类,构建属于对应子空间区域的空间视觉词典.在图像表示阶段,图像各子区域内的特征基于其对应的空间视觉词典进行LLC稀疏编码,根据各子区域对图像贡献程度的不同,把编码后各子区域的特征向量赋予不同的权重加权处理,再连接形成最终的图像描述.最后,利用线性SVM进行图像分类,实验结果表明了本文方法的有效性和鲁棒性. 展开更多
关键词 图像分类 特征融合 空间视觉词典 LLC编码 加权处理
下载PDF
改进K-Means聚类算法及其在视觉词典构造中的应用 被引量:4
5
作者 王美华 曾燕妮 蔡瑞初 《计算机应用与软件》 CSCD 2015年第10期159-163,167,共6页
K-Means聚类是视觉词典构造的常用方法,其聚类结果直接影响后续的特征量化效果和检索精度,而现有的K-Means聚类算法难以获得高质量的视觉词典。针对这种情况,提出局部化K-Means聚类算法。算法首先根据启发式原则将特征集划分成若干个独... K-Means聚类是视觉词典构造的常用方法,其聚类结果直接影响后续的特征量化效果和检索精度,而现有的K-Means聚类算法难以获得高质量的视觉词典。针对这种情况,提出局部化K-Means聚类算法。算法首先根据启发式原则将特征集划分成若干个独立的子集,并对各子集进行传统K-Means聚类,然后以各子集的聚类中心为对象进行加权K-Means聚类。上述过程不断迭代直至形成特定规模的视觉词典。实验结果表明,与现有算法相比,该算法提高了聚类质量。在SIFT特征集和标准数据集上进行的多组对比实验证明了该算法的有效性。 展开更多
关键词 K-MEANS 聚类 视觉词典 启发式划分 加权
下载PDF
一种改进的k-means聚类视觉词典构造方法 被引量:8
6
作者 赵春晖 王莹 Masahide Kaneko 《仪器仪表学报》 EI CAS CSCD 北大核心 2012年第10期2380-2386,共7页
传统词袋(bag of words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高... 传统词袋(bag of words,BoW)模型在构造视觉词典时一般采用k-means聚类方法实现,但k-means聚类方法的性能在很大程度上依赖于初始点的选择,从而导致生成的视觉词典鲁棒性较差,此外,每次迭代都要计算数据点与中心点的距离,计算复杂度高。针对上述问题,提出了一种改进的k-means聚类视觉词典构造方法,该方法首先对初始值的选取进行了优化,克服了随机选取初始值对聚类性能的影响,其次基于三角形不等式对计算进行了简化,使生成的视觉词典更加稳定,计算复杂度更低,最后引入权值分布对图像进行基于视觉词典的表示,并将基于改进的视觉词典的词袋模型应用于图像分类,提高了分类性能。通过在Caltech 101和Caltech 256两个数据库进行实验,验证了本文方法的有效性,并分析了词典库大小对分类性能的影响。从实验结果可以看出,采用本文方法所得到的分类正确率提高了5%~8%。 展开更多
关键词 词袋模型 视觉词典构造 K-MEANS聚类 图像分类
下载PDF
基于随机化视觉词典组和上下文语义信息的目标检索方法 被引量:5
7
作者 赵永威 郭志刚 +2 位作者 李弼程 高毫林 陈刚 《电子学报》 EI CAS CSCD 北大核心 2012年第12期2472-2480,共9页
传统的视觉词典法(Bag ofVisual Words,BoVW)具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题,且当目标区域所包含的信息不能正确或不足以表达用户检索意图时就得不到理想的检索结果.针对这些问题,本文提出了基于随机化视... 传统的视觉词典法(Bag ofVisual Words,BoVW)具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题,且当目标区域所包含的信息不能正确或不足以表达用户检索意图时就得不到理想的检索结果.针对这些问题,本文提出了基于随机化视觉词典组和上下文语义信息的目标检索方法.首先,该方法采用精确欧氏位置敏感哈希(Exact Euclidean Locality Sensitive Hashing,E2LSH)对局部特征点进行聚类,生成一组支持动态扩充的随机化视觉词典组;然后,利用查询目标及其周围的视觉单元构造包含上下文语义信息的目标模型;最后,引入K-L散度(Kullback-Leibler divergence)进行相似性度量完成目标检索.实验结果表明,新方法较好地提高了目标对象的可区分性,有效地提高了检索性能. 展开更多
关键词 目标检索 上下文语义信息 精确欧氏位置敏感哈希 随机化视觉词典 K-L散度
下载PDF
基于融合SIFT特征和二次聚类视觉词典生成的场景分类方法 被引量:2
8
作者 郭乐新 金泰松 李玲玲 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期196-201,共6页
在传统SIFT(scale-invariant feature transform)特征检测算子基础上,增加部分伪极值点和非极值点作为特征点,提出融合SIFT特征检测算子.该算子能够提取图像中更多特征点,并使特征点在图像上分布均匀;然后在生成视觉词典前,对每幅图像... 在传统SIFT(scale-invariant feature transform)特征检测算子基础上,增加部分伪极值点和非极值点作为特征点,提出融合SIFT特征检测算子.该算子能够提取图像中更多特征点,并使特征点在图像上分布均匀;然后在生成视觉词典前,对每幅图像的特征单独进行聚类,使视觉单词包含更多的场景信息,并缩短视觉词典的生成时间;最后使用PLSA(probabilistic latent semantic analysis)主题生成模型实现场景分类.在标准图像集上进行的对比实验表明:该方法的分类性能有一定提高,并且对多个不同场景的表现较为均稳. 展开更多
关键词 场景分类 SIFT特征 视觉词典 二次聚类
下载PDF
基于优化视觉词典的震后高分遥感影像震害建筑物检测 被引量:3
9
作者 王超 申祎 +3 位作者 仇星 行鸿彦 张艳 卞长林 《电子测量与仪器学报》 CSCD 北大核心 2020年第10期40-50,共11页
在缺少震前参考信息前提下,提出了一种基于优化视觉词典的震后高分遥感影像震害建筑物检测方法。首先通过WJSEG(wavelet-JSEG)分割以及一组非建筑物筛选规则提取潜在建筑物集合;其次利用光谱、纹理及几何形态学特征构建了一种震害视觉... 在缺少震前参考信息前提下,提出了一种基于优化视觉词典的震后高分遥感影像震害建筑物检测方法。首先通过WJSEG(wavelet-JSEG)分割以及一组非建筑物筛选规则提取潜在建筑物集合;其次利用光谱、纹理及几何形态学特征构建了一种震害视觉词典模型,跨越了从像素到震害特征间的"语义鸿沟";在此基础上设计了一种基于类内和类间惩罚因子的视觉词典优化策略,减少了信息冗余及证据冲突;最后通过随机森林分类器将建筑物进一步划分为完好建筑物、部分震害建筑物及废墟。在两组实验中,该方法的总体精度均达到85%以上,从而可为震后应急响应救援及灾后重建提供关键的决策支持信息。 展开更多
关键词 震后 高分遥感影像 视觉词典 震害 建筑物检测
下载PDF
基于加权特征空间信息视觉词典的图像检索模型 被引量:10
10
作者 董健 《计算机应用》 CSCD 北大核心 2014年第4期1172-1176,1226,共6页
针对传统的视觉词袋模型中视觉词典对底层特征量化时容易引入量化误差,以及视觉单词的适用性不足等问题,提出了基于加权特征空间信息视觉词典的图像检索模型。从产生视觉词典的常用聚类算法入手,分析和探讨了聚类算法的特点,考虑聚类过... 针对传统的视觉词袋模型中视觉词典对底层特征量化时容易引入量化误差,以及视觉单词的适用性不足等问题,提出了基于加权特征空间信息视觉词典的图像检索模型。从产生视觉词典的常用聚类算法入手,分析和探讨了聚类算法的特点,考虑聚类过程中特征空间的特征分布统计信息,通过实验对不同的加权方式进行对比,得出效果较好的均值加权方案,据此对视觉单词的重要程度加权,提高视觉词典的描述能力。对比实验表明,在ImageNet图像数据集上,相对于同源视觉词典,非同源视觉词典对视觉空间的划分影响较小,且基于加权特征空间信息视觉词典在大数据集上更加有效。 展开更多
关键词 图像搜索 视觉词袋模型 加权特征空间信息 视觉词典 聚类算法
下载PDF
基于视觉词典的多目标截面投影图像特征分割 被引量:2
11
作者 陈卓然 丛飚 张会萍 《计算机仿真》 北大核心 2020年第6期347-351,共5页
由于传统截面投影图像特征分割方法存在噪声免疫力低、适用广泛性窄和分割表现力差等诸多问题,因此提出一种基于视觉词典的多目标截面投影图像特征分割。使用k-means法完成聚类并利用贪婪法融合结果形成视觉词典,通过构建三维直方图,将... 由于传统截面投影图像特征分割方法存在噪声免疫力低、适用广泛性窄和分割表现力差等诸多问题,因此提出一种基于视觉词典的多目标截面投影图像特征分割。使用k-means法完成聚类并利用贪婪法融合结果形成视觉词典,通过构建三维直方图,将像素点投影到主斜线上获得基本极大类间方差准则,实现像素与像素间的分类,同时为了增强噪声免疫力将阈值转化成可以变化的数值,通过峰值信噪比的最大比率对阈值合理取值,完成多目标截面投影图像特征分割。通过仿真可知,合理的阈值能够有效降低图像像素的错分,使图像特征分割更加精准,且不计附带的噪音种类,与其它方法对比发现,所提方法不仅噪声免疫力强且适用范围广,分割效果极佳。 展开更多
关键词 视觉词典 截面投影 图像特征分割 噪声免疫力
下载PDF
基于多视觉词典的显著性加权图像检索方法 被引量:1
12
作者 孔超 张化祥 生海迪 《数据采集与处理》 CSCD 北大核心 2017年第2期399-407,共9页
针对视觉词典在图像表示与检索方面的应用需求,本文提出了一种基于多视觉词典与显著性加权相结合的图像检索方法,实现了图像多特征的显著性稀疏表示。该方法首先划分图像为小块,提取图像块的多种底层特征,然后将其作为输入向量,通过非... 针对视觉词典在图像表示与检索方面的应用需求,本文提出了一种基于多视觉词典与显著性加权相结合的图像检索方法,实现了图像多特征的显著性稀疏表示。该方法首先划分图像为小块,提取图像块的多种底层特征,然后将其作为输入向量,通过非负稀疏编码分别学习图像块多种特征对应的视觉词典,将得到的图像块稀疏向量经过显著性汇总方法引入空间信息并作显著性加权处理,形成整幅图像的稀疏表示,最后采用提出的SDD距离计算方式进行图像检索。在Corel和Caltech通用图像集上进行仿真实验,与单一视觉词典的方法对比,结果表明本文方法能够有效提高图像检索的准确率。 展开更多
关键词 视觉词典 非负稀疏编码 显著性加权 相似性度量
下载PDF
基于K中心算法分层视觉词典树构造方法
13
作者 张星宇 许钢 +2 位作者 张阳 江娟娟 符茂胜 《四川理工学院学报(自然科学版)》 CAS 2017年第6期34-39,共6页
视觉词典树是通过视觉词袋(Bag of Visual Words,Bo VW)模型将一组图像形成单词表征场景。它主要通过聚类算法构造视觉词典树,为了改进K-Means在寻找聚类中心的过程中受到噪声异常维度的干扰,基于K中心算法提出了一种分层视觉词典树构... 视觉词典树是通过视觉词袋(Bag of Visual Words,Bo VW)模型将一组图像形成单词表征场景。它主要通过聚类算法构造视觉词典树,为了改进K-Means在寻找聚类中心的过程中受到噪声异常维度的干扰,基于K中心算法提出了一种分层视觉词典树构造方法。该方法提出了从每次迭代后的聚类特征点中随机地选取新的中心点,可避免因噪声异常维度使计算中心点位置时有较大误差,从而可提高聚类质量,使类簇更加紧凑。在图像的分类实验中,分别使用K-Means和K中心算法对构建的视觉词典树进行性能评价,实验结果证明通过K中心算法构造的分层视觉词典树可有效提高图像分类准确率。 展开更多
关键词 K-MEANS K中心算法 视觉词典 图像分类
下载PDF
基于聚类分析的无监督视觉词典构造方法研究
14
作者 徐望明 郑超兵 《微电子学与计算机》 CSCD 北大核心 2016年第3期152-156,共5页
视觉词典是运用视觉词袋模型有效表示图像的基础和关键.研究了基于聚类分析的无监督视觉词典构造方法,针对K-Means和层次K-Means(HKM)聚类算法在构造视觉词典时对初始值敏感和容易陷入局部最优的问题进行改进,提出了一种基于谱聚类的视... 视觉词典是运用视觉词袋模型有效表示图像的基础和关键.研究了基于聚类分析的无监督视觉词典构造方法,针对K-Means和层次K-Means(HKM)聚类算法在构造视觉词典时对初始值敏感和容易陷入局部最优的问题进行改进,提出了一种基于谱聚类的视觉词典构造方法,采用对观测数据的相似性矩阵进行特征值分解的方法来实现聚类,可在任意分布的特征空间收敛到全局最优.通过图像检索实验评估了随机采样、K-Means、HKM和改进的谱聚类视觉词典的性能,验证了聚类分析尤其是改进的谱聚类方法构造视觉词典的有效性. 展开更多
关键词 视觉词典 谱聚类 图像检索 视觉词袋
下载PDF
非负矩阵分解耦合视觉词典的图像检索算法
15
作者 李峰 应帅 卢文超 《包装工程》 CAS 北大核心 2018年第17期215-222,共8页
目的解决当前图像检索技术中,图像特征稀疏编码收敛速度慢,以及局部特征空间信息不足易导致检索误差较大等问题,提出一种基于l0稀疏约束非负矩阵分解耦合视觉词典优化的图像检索算法。方法首先,在非负矩阵分解(Non-negative Matrix Fact... 目的解决当前图像检索技术中,图像特征稀疏编码收敛速度慢,以及局部特征空间信息不足易导致检索误差较大等问题,提出一种基于l0稀疏约束非负矩阵分解耦合视觉词典优化的图像检索算法。方法首先,在非负矩阵分解(Non-negative Matrix Factorization,NMF)的基础上,对系数矩阵设置l0个约束来限制其稀疏性,从而定义一种l0稀疏约束的NMF方法。再通过一种自适应序列词典初始化方案,从训练样本获得词典的初始估计。然后,利用l0稀疏约束的NMF来增强视觉词典,对图像局部描述符进行稀疏编码,并利用最大池化操作来生成聚合特征向量,从而保留局部描述符的关键属性。最后根据得到的特征向量,引入Minkowski距离来衡量查询图像与数据库的相似性,输出检索图像。结果实验结果表明,与当前图像检索方案相比,所提算法具有更高的查准-查全率和收敛速度。结论所提算法返回的图像与查询图像相似度高,在包装商标检索等领域具有一定的参考价值。 展开更多
关键词 图像检索 非负矩阵分解 视觉词典 稀疏编码 最大池化 Minkowski距离
下载PDF
基于概念格层次分析的视觉词典生成方法 被引量:5
16
作者 钟利华 张素兰 +1 位作者 胡立华 张继福 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第1期136-141,共6页
视觉词典容量是影响图像场景分类精度的重要因素之一,大容量的视觉词典因计算量较大影响了分类的效率,而小容量的视觉词典由于多义词问题的严重致使场景分类精度降低.针对该问题,提出一种基于概念格层次分析的视觉词典生成方法.首先生... 视觉词典容量是影响图像场景分类精度的重要因素之一,大容量的视觉词典因计算量较大影响了分类的效率,而小容量的视觉词典由于多义词问题的严重致使场景分类精度降低.针对该问题,提出一种基于概念格层次分析的视觉词典生成方法.首先生成关于训练图像视觉词包模型的初始视觉词典;然后在构造的概念格上利用概念格的概念层次性,通过动态地调整外延数阈值,获取粒度大小不同容量的描述图像各场景语义的约简视觉词典;最后对各类约简视觉单词构成向量进行异或,删除多义词,进而生成有效描述图像场景语义的视觉词典.实验结果表明,文中方法是有效的. 展开更多
关键词 视觉词包 视觉词典 多义词 概念格 层次分析
下载PDF
一种结合ORB特征和视觉词典的RGB-D SLAM算法 被引量:16
17
作者 张震 郑宏 +1 位作者 周璇 张生群 《计算机工程与应用》 CSCD 北大核心 2018年第12期170-176,共7页
同时定位与建图(Simultaneous Localization and Mapping,SLAM)是机器人领域的研究热点,被认为是实现机器人自主运动的关键。传统的基于RGB-D摄像头的SLAM算法(RGB-D SLAM)采用SIFT(Scale-Invariant Feature Transform)特征描述符来计... 同时定位与建图(Simultaneous Localization and Mapping,SLAM)是机器人领域的研究热点,被认为是实现机器人自主运动的关键。传统的基于RGB-D摄像头的SLAM算法(RGB-D SLAM)采用SIFT(Scale-Invariant Feature Transform)特征描述符来计算相机位姿,采用GPU加速的siftGPU算法克服SITF特征提取慢的缺点,但多数嵌入式设备缺乏足够的GPU运算能力,使其应用性受到局限。此外,常规算法在闭环检测时效率较低,实时性不强。针对上述问题,提出了一种结合ORB(oriented FAST and rotated BRIEF)特征与视觉词典的SLAM算法。在算法前端,首先提取相邻图像的ORB特征,然后利用k近邻(k-Nearest Neighbor,kNN)匹配找到对应的最临近与次临近匹配,接着采用比值检测与交叉检测剔除误匹配点,最后采用改进的PROSAC-PnP(Progressive Sample Consensus based Perspective-N-Point)算法进行相机姿态计算,得到对相机位姿的高精度估计。在后端,提出了一种基于视觉词典的闭环检测算法来消除机器人运动中的累计误差。通过闭环检测增加帧间约束,利用通用图优化工具进行位姿图优化,得到全局一致的相机位姿与点云。通过对标准fr1数据集的测试和对比,表明了该算法具有较强的鲁棒性。 展开更多
关键词 RGB-D SLAM ORB特征 透视N点算法 视觉词典 姿态图优化
下载PDF
一种基于视觉词典优化和查询扩展的图像检索方法 被引量:4
18
作者 柯圣财 李弼程 +2 位作者 陈刚 赵永威 魏晗 《自动化学报》 EI CSCD 北大核心 2018年第1期99-105,共7页
视觉词典方法 (Bag of visual words,Bo VW)是当前图像检索领域的主流方法,然而,传统的视觉词典方法存在计算量大、词典区分性不强以及抗干扰能力差等问题,难以适应大数据环境.针对这些问题,本文提出了一种基于视觉词典优化和查询扩展... 视觉词典方法 (Bag of visual words,Bo VW)是当前图像检索领域的主流方法,然而,传统的视觉词典方法存在计算量大、词典区分性不强以及抗干扰能力差等问题,难以适应大数据环境.针对这些问题,本文提出了一种基于视觉词典优化和查询扩展的图像检索方法.首先,利用基于密度的聚类方法对SIFT特征进行聚类生成视觉词典,提高视觉词典的生成效率和质量;然后,通过卡方模型分析视觉单词与图像目标的相关性,去除不包含目标信息的视觉单词,增强视觉词典的分辨能力;最后,采用基于图结构的查询扩展方法对初始检索结果进行重排序.在Oxford5K和Paris6K图像集上的实验结果表明,新方法在一定程度上提高了视觉词典的质量和语义分辨能力,性能优于当前主流方法. 展开更多
关键词 视觉词典模型 密度聚类 卡方模型 查询扩展
下载PDF
基于视觉词典和位置敏感哈希的图像检索方法
19
作者 孙晓峰 彭天强 《河南工程学院学报(自然科学版)》 2016年第3期64-68,共5页
当前视觉词袋(Bag of Visual Word,Bo VW)模型中的视觉词典均由k-means及其改进算法在原始局部特征描述子上聚类生成,但随着图像数据的迅速增长,在原始局部特征空间中进行聚类存在着运行时间较长和占用内存较大的问题.针对着这些问题,... 当前视觉词袋(Bag of Visual Word,Bo VW)模型中的视觉词典均由k-means及其改进算法在原始局部特征描述子上聚类生成,但随着图像数据的迅速增长,在原始局部特征空间中进行聚类存在着运行时间较长和占用内存较大的问题.针对着这些问题,提出了一种基于视觉词典和位置敏感哈希的图像检索方法.首先,选择合适的生成二进制哈希码的哈希算法,将局部特征点保持相似性地映射为二进制哈希码.然后,在二进制哈希码上进行k-means,生成视觉词为二进制码的视觉词典.最后,用视觉单词的词频向量表示图像内容,根据词频向量对图像进行检索.在SIFT-1M和Caltech-256数据集上的实验结果表明,本方法可以缩短视觉词典生成的时间,占用更少的存储空间,与传统的基于k-means的视觉词典算法相比,图像检索性能基本不变. 展开更多
关键词 二进制哈希码 视觉词袋模型 局部特征 二进制视觉词典 图像检索
下载PDF
基于Kinect和视觉词典的三维SLAM 被引量:4
20
作者 龙超 韩波 张宇 《计算机应用》 CSCD 北大核心 2016年第3期774-778,788,共6页
针对传统滤波器方法解决机器人同时定位与地图创建(SLAM)时的误差积累问题,提出了一种基于视觉词典(BOW)的三维SLAM算法,以有效解决机器人长时间运动下误差积累的问题。相比图优化SLAM中常用的随机检测和Kd树(Kd-Tree)算法,采用基于树... 针对传统滤波器方法解决机器人同时定位与地图创建(SLAM)时的误差积累问题,提出了一种基于视觉词典(BOW)的三维SLAM算法,以有效解决机器人长时间运动下误差积累的问题。相比图优化SLAM中常用的随机检测和Kd树(Kd-Tree)算法,采用基于树结构的视觉词典闭环检测算法来提高相似场景的检索效率。首先采用基于GPU的特征提取算法提取图像特征,并利用交叉匹配和k最近邻(k NN)算法取得图像中鲁棒性较强的内点;然后通过基于随机抽样一致性奇异值分解(RANSAC SVD)算法计算出相邻帧的初始位姿变换,并利用通用迭代最近点(GICP)算法进行优化,得到高精度的位姿变换;最后利用增量平滑和建图(i SAM)图优化方法得出最终位姿,拼接出高精度的点云地图和运动轨迹。标准数据集的测试表明,所提算法在复杂情况下具有良好的鲁棒性和精度。 展开更多
关键词 三维SLAM 闭环检测 视觉词典 图形处理器 通用迭代最近点算法 增量平滑和建图
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部