期刊文献+
共找到532篇文章
< 1 2 27 >
每页显示 20 50 100
基于Local-Global-VIT细粒度分类算法的蝴蝶识别
1
作者 李建祥 李小林 +4 位作者 王荣 张元孜 陈淑武 张飞萍 黄世国 《昆虫学报》 CAS CSCD 北大核心 2024年第9期1251-1261,共11页
【目的】准确鉴别蝴蝶种类,动态观测蝴蝶群落多样性变化对生境质量评估、生态环境恢复等方面具有重要意义。针对现有蝴蝶识别方法仅依靠整体特征,忽略了局部特征导致识别生态图像能力不足的问题,本研究旨在开发一种Local-Global-VIT细... 【目的】准确鉴别蝴蝶种类,动态观测蝴蝶群落多样性变化对生境质量评估、生态环境恢复等方面具有重要意义。针对现有蝴蝶识别方法仅依靠整体特征,忽略了局部特征导致识别生态图像能力不足的问题,本研究旨在开发一种Local-Global-VIT细粒度分类算法的蝴蝶识别方法。【方法】本研究以5科200种共计25 279张蝴蝶图像为识别对象,采用多种数据增强方法扩充图像数据;通过视觉Transformer(vision transformer, VIT)层级结构及自注意力机制逐层选择局部令牌并保留至最后一层学习蝴蝶局部判别部位信息;聚合高层全局令牌消除复杂背景干扰;通过对比损失拉大类间距提高区分度。除此之外,使用合理的学习率调整策略和迁移学习方法,优化了模型收敛过程,在不增加参数量的情况下提高了性能。【结果】Local-Global-VIT算法在大规模细粒度公开数据集Butterfly-200上识别准确率达91.20%,较改进前提升了1.15%,比最优的一般害虫识别算法EfficientNet_b0和细粒度分类算法TransFG准确率分别高了1.83%和0.64%,F1分值分别提高了1.89%和0.88%。【结论】Local-Global-VIT算法以细粒度识别方式有效解决了蝴蝶类内差异大、类间差异小的分类难题,能准确地识别蝴蝶种类,有助于高效评估生境质量。 展开更多
关键词 蝴蝶 图像识别 细粒度分类 vision transformer 局部令牌选择 全局令牌聚合
下载PDF
基于改进Vision Transformer网络的农作物病害识别方法 被引量:1
2
作者 王杨 李迎春 +6 位作者 许佳炜 王傲 马唱 宋世佳 谢帆 赵传信 胡明 《小型微型计算机系统》 CSCD 北大核心 2024年第4期887-893,共7页
基于DCNN模型的农作物病害识别方法在实验室环境下识别准确率高,但面对噪声时缺少鲁棒性.为了兼顾农作物病害识别的精度和鲁棒性,本文在标准ViT模型基础上加入增强分块序列化和掩码多头注意力,解决标准ViT模型缺乏局部归纳偏置和视觉特... 基于DCNN模型的农作物病害识别方法在实验室环境下识别准确率高,但面对噪声时缺少鲁棒性.为了兼顾农作物病害识别的精度和鲁棒性,本文在标准ViT模型基础上加入增强分块序列化和掩码多头注意力,解决标准ViT模型缺乏局部归纳偏置和视觉特征序列的自注意力过于关注自身的问题.实验结果表明,本文的EPEMMSA-ViT模型对比标准ViT模型可以更高效的从零学习;当添加预训练权重训练网络时,EPEMMSA-ViT模型在数据增强的PlantVillage番茄子集上能够得到99.63%的分类准确率;在添加椒盐噪声的测试数据集上,对比ResNet50、DenseNet121、MobileNet和ConvNeXt的分类准确率分别提升了6.08%、9.78%、29.78%和12.41%;在添加均值模糊的测试数据集上,对比ResNet50、DenseNet121、MobileNet和ConvNeXt的分类准确率分别提升了18.92%、31.11%、20.37%和19.58%. 展开更多
关键词 农作物病害识别 深度卷积神经网络 视觉Transformer 自注意力 局部归纳偏置
下载PDF
A Novel Vision Localization Method of Automated Micro-Polishing Robot
3
作者 Zhao-jun Yang, Fei Chen, Ji Zhao, Xiao-jie WuCollege of Mechanical Science and Engineering, Jilin University, Changchun 130022, P. R. China 《Journal of Bionic Engineering》 SCIE EI CSCD 2009年第1期46-54,共9页
Based on photogrammetry technology,a novel localization method of micro-polishing robot,which is restricted within certain working space,is presented in this paper.On the basis of pinhole camera model,a new mathematic... Based on photogrammetry technology,a novel localization method of micro-polishing robot,which is restricted within certain working space,is presented in this paper.On the basis of pinhole camera model,a new mathematical model of vision localization of automated polishing robot is established.The vision localization is based on the distance-constraints of feature points.The method to solve the mathematical model is discussed.According to the characteristics of gray image,an adaptive method of automatic threshold selection based on connected components is presented.The center coordinate of the feature image point is resolved by bilinear interpolation gray square weighted algorithm.Finally,the mathematical model of testing system is verified by global localization test.The experimental results show that the vision localization system in working space has high precision. 展开更多
关键词 micro-polishing robot vision localization threshold segmentation distance constraint
下载PDF
A MAP Approach for Vision-based Self-localization of Mobile Robot 被引量:3
4
作者 WANG Ke WANG Wei ZHUANG Yan 《自动化学报》 EI CSCD 北大核心 2008年第2期159-166,共8页
一当场,自我本地化系统为在有深入的 3D 里程碑的 3D 环境起作用的活动机器人被开发。机器人通过合并从 odometry 和单向性的照相机收集的信息的一个地图评估者递归地估计它的姿势。我们为这二个传感器造非线性的模型并且坚持说机器人... 一当场,自我本地化系统为在有深入的 3D 里程碑的 3D 环境起作用的活动机器人被开发。机器人通过合并从 odometry 和单向性的照相机收集的信息的一个地图评估者递归地估计它的姿势。我们为这二个传感器造非线性的模型并且坚持说机器人运动和不精密的传感器大小的无常操作应该全部被嵌入并且追踪我们的系统。我们在一个概率的几何学观点和使用 unscented 变换描述无常框架宣传无常,它经历给定的非线性的功能。就我们的机器人的处理力量而言,图象特征在相应投射特征的附近被提取。另外,数据协会被统计距离评估。最后,一系列系统的实验被进行证明我们的系统的可靠、精确的性能。 展开更多
关键词 MAP估计 自动定位 视觉 移动式遥控装置 不确定传播 传感器
下载PDF
Vision Transformer的瞳孔定位方法
5
作者 王利 王长元 《西安工业大学学报》 CAS 2023年第6期561-567,共7页
为了解决现有瞳孔定位方法易受瞳孔图像质量的约束,采用CNN提取图像的局部特征,通过Transformer的编码器获得全局依赖关系,发掘出更为准确的瞳孔中心信息,在公开数据集上对比了主流的DeepEye和VCF瞳孔定位模型。结果表明:提出的基于混... 为了解决现有瞳孔定位方法易受瞳孔图像质量的约束,采用CNN提取图像的局部特征,通过Transformer的编码器获得全局依赖关系,发掘出更为准确的瞳孔中心信息,在公开数据集上对比了主流的DeepEye和VCF瞳孔定位模型。结果表明:提出的基于混合结构的Vision Transformer瞳孔定位方法在5像素误差内瞳孔中心的检测率比DeepEye提升了30%,比VCF提升了20%。 展开更多
关键词 深度学习 瞳孔定位 视觉转换器 分散注意力残差网络
下载PDF
Service Robot Localization Based on Global Vision and Stereo Vision
6
作者 于清晓 闫维新 +1 位作者 付庄 赵言正 《Journal of Donghua University(English Edition)》 EI CAS 2012年第3期197-202,共6页
To satisfy different positioning accuracy demand in the movement of the service robot, a hierarchical localization method based on vision was proposed considering the positioning cost and computational efficiency. The... To satisfy different positioning accuracy demand in the movement of the service robot, a hierarchical localization method based on vision was proposed considering the positioning cost and computational efficiency. The hierarchical positioning method could be divided into two parts: the localization method based on global vision and the localization method based on binocular vision. The global vision-based localization method was applied to calculate the initial coordinates of the robot and realize real-time rough positioning with the dead-reckoning method in the first stage. In the last stage, the binocular vision-based localization method was adopted to obtain higher positioning accuracy to make sure that the service robot can successfully grab the object. Experiments indicate that the proposed algorithm can accurately evaluate the positioning performance, obtain up to ±2 cm positioning accuracy, and absolutely meet the positioning requirements of the indoor service robot. 展开更多
关键词 service robot hierarchical positioning binocular vision localIZATION
下载PDF
Vision-based Localization from Three-Line Structures (TLS)
7
作者 Zhao-Zheng Hu Na Li 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2013年第3期48-55,共8页
This paper presents a novel vision based localization algorithm from three-line structure ( TLS) .Two types of TLS are investigated: 1) three parallel lines ( Structure I) ; 2) two parallel lines and one orthogonal li... This paper presents a novel vision based localization algorithm from three-line structure ( TLS) .Two types of TLS are investigated: 1) three parallel lines ( Structure I) ; 2) two parallel lines and one orthogonal line ( Structure II) .From single image of either structure,the camera pose can be uniquely computed for vision localization.Contributions of this paper are as follows: 1 ) both TLS structures can be used as simple and practical landmarks,which are widely available in daily life; 2) the proposed algorithm complements existing localization methods,which usually use complex landmarks,especially in the partial blockage conditions; 3) compared with the general Perspective-3-Lines ( P3L) problem,camera pose can be uniquely computed from either structure.The proposed algorithm has been tested with both simulation and real image data.For a typical simulated indoor condition ( 75 cm-size landmark,less than 7.0 m landmark-to-camera distance,and 0.5-pixel image noises) ,the means of localization errors from Structure I and Structure II are less than 3.0 cm.And the standard deviations are less than 3.0 cm and 1.5 cm,respectively.The algorithm is further validated with two actual image experiments.Within a 7.5 m × 7.5 m indoor situation,the overall relative localization errors from Structure I and Structure II are less than 2.2% and 2.3% ,respectively,with about 6.0 m distance.The results demonstrate that the algorithm works well for practical vision localization. 展开更多
关键词 vision-based localization three-line structure camera pose computer vision
下载PDF
Mobile Robot Hierarchical Simultaneous Localization and Mapping Using Monocular Vision 被引量:1
8
作者 厉茂海 洪炳熔 罗荣华 《Journal of Shanghai Jiaotong university(Science)》 EI 2007年第6期765-772,共8页
A hierarchical mobile robot simultaneous localization and mapping (SLAM) method that allows us to obtain accurate maps was presented. The local map level is composed of a set of local metric feature maps that are guar... A hierarchical mobile robot simultaneous localization and mapping (SLAM) method that allows us to obtain accurate maps was presented. The local map level is composed of a set of local metric feature maps that are guaranteed to be statistically independent. The global level is a topological graph whose arcs are labeled with the relative location between local maps. An estimation of these relative locations is maintained with local map alignment algorithm, and more accurate estimation is calculated through a global minimization procedure using the loop closure constraint. The local map is built with Rao-Blackwellised particle filter (RBPF), where the particle filter is used to extending the path posterior by sampling new poses. The landmark position estimation and update is implemented through extended Kalman filter (EKF). Monocular vision mounted on the robot tracks the 3D natural point landmarks, which are structured with matching scale invariant feature transform (SIFT) feature pairs. The matching for multi-dimension SIFT features is implemented with a KD-tree in the time cost of O(lbN). Experiment results on Pioneer mobile robot in a real indoor environment show the superior performance of our proposed method. 展开更多
关键词 mobile robot HIERARCHICAL simultaneous localization and mapping (SLAM) Rao-Blackwellised particle filter (RBPF) MONOCULAR vision scale INVARIANT feature TRANSFORM
下载PDF
面向强后处理场景的图像篡改定位模型
9
作者 谭舜泉 廖桂樱 +1 位作者 彭荣煊 黄继武 《通信学报》 EI CSCD 北大核心 2024年第4期146-159,共14页
针对微信、微博等社交平台对图像进行的压缩、尺度拉伸等有损操作带来的篡改痕迹模糊或被破坏的挑战,提出了一种对抗强后处理的图像篡改定位模型。该模型选用了基于Transformer的金字塔视觉转换器作为编码器,用于提取图像的篡改特征。同... 针对微信、微博等社交平台对图像进行的压缩、尺度拉伸等有损操作带来的篡改痕迹模糊或被破坏的挑战,提出了一种对抗强后处理的图像篡改定位模型。该模型选用了基于Transformer的金字塔视觉转换器作为编码器,用于提取图像的篡改特征。同时,设计了一个类UNet结构的端到端编码器-解码器架构。金字塔视觉转换器的金字塔结构和注意力机制可以灵活关注图像的各个区块,结合类UNet结构能够多尺度地提取图像上下文间的关联信息,对强后处理的图像有着较好的鲁棒性。实验结果表明,所提模型在对抗JPEG压缩、高斯模糊等常见的后处理操作以及在不同社交媒体传播场景的数据集上的定位性能上明显优于目前主流的篡改定位模型,展现出了优异的鲁棒性。 展开更多
关键词 强后处理场景 图像篡改定位 鲁棒性 金字塔视觉转换器
下载PDF
动态感受野的图像分割神经网络模型
10
作者 刘洋 舒利明 +3 位作者 孔雨秋 杨婉肖 李英平 孔程玉 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第9期1375-1383,共9页
针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征... 针对基于U-Net的分割方法在医学图像分割领域存在的下采样阶段信息丢失,以及因固定尺寸卷积核带来的局部多尺度语义信息提取不足的问题,提出一种动态感受野的神经网络模型.首先通过构建特征递进级联模块,获取编码器多尺度局部语义特征并将其赋值给解码器,提升模型解码阶段图像语义信息修复的效果;然后设计局部视野偏移模块,增强固定尺寸卷积核提取视野内上下文语义信息的能力.在ISIC2018和BUSI癌症图像分割数据集上的实验结果表明,所提模型的IoU指标达到83.92±0.26和70.45±1.70,Dice系数达到91.09±0.23和83.39±1.15,比现有的医学图像分割方法更优. 展开更多
关键词 医学图像分割 动态感受野 特征递进级联 局部视野偏移
下载PDF
工业机器人装配中基于相机位姿估计算法的单目视觉定位研究
11
作者 余娜 何国荣 +1 位作者 晁阳 李培东 《微型电脑应用》 2024年第4期85-88,共4页
为了提升工业机器人在装配作业中的效率和精准度,结合软指派算法进行研究,构建基于相机位姿估计算法的单目标视觉定位系统,并对其进行仿真验证。实验结果显示,在参数对成功率的影响实验中实验成功率最低为92.5%,在图像噪声对成功率的影... 为了提升工业机器人在装配作业中的效率和精准度,结合软指派算法进行研究,构建基于相机位姿估计算法的单目标视觉定位系统,并对其进行仿真验证。实验结果显示,在参数对成功率的影响实验中实验成功率最低为92.5%,在图像噪声对成功率的影响实验中成功率最高达到了97.5%,位置估计误差最大值不超过4 mm,旋转误差在伪特征点的数量为最大时得到了最大值7°。 展开更多
关键词 单目视觉 工业机器人 位姿估计 视觉定位 软指派算法
下载PDF
基于误匹配剔除和地面约束的视觉SLAM算法
12
作者 黄丹丹 郝文豪 杨阳 《中国惯性技术学报》 EI CSCD 北大核心 2024年第2期163-169,179,共8页
为了提高视觉同时定位与建图(SLAM)系统的鲁棒性和准确性,提出了一种基于误匹配剔除和地面约束的视觉SLAM算法。首先,在SLAM前端引入特征点对剔除机制,通过统计特征点对之间的距离以及分布特性对匹配质量进行分析,进而实现误匹配特征点... 为了提高视觉同时定位与建图(SLAM)系统的鲁棒性和准确性,提出了一种基于误匹配剔除和地面约束的视觉SLAM算法。首先,在SLAM前端引入特征点对剔除机制,通过统计特征点对之间的距离以及分布特性对匹配质量进行分析,进而实现误匹配特征点的剔除;其次,利用RGBD相机提取地面向量,并将地面向量约束引入SLAM后端优化过程中,能够有效防止z轴过度优化以及抑制z轴漂移,提高位姿优化的准确性;最后,在公开数据集上进行实验和分析。实验结果表明,与ORB-SLAM2算法相比,使用误匹配剔除算法的绝对轨迹误差平均减少了17.62%,使用地面约束算法的绝对轨迹误差平均减少了39.20%,验证了所提算法具有更好的准确性和鲁棒性。 展开更多
关键词 机器视觉 同时定位与建图 特征点剔除 后端优化 地面约束
下载PDF
基于特征提取和图像分类的螺旋网疵点自动检测
13
作者 王博润 张宁 卢雨正 《现代纺织技术》 北大核心 2024年第1期36-44,共9页
为了解决当前螺旋网人工疵点检测效率低、误检率高等问题,提出了一种基于分类思想的螺旋网疵点检测方法。对螺旋网图像提取多模式多尺度的LBP特征,充分表征螺旋网图像的信息,通过构建支持向量机(Support vector machine,SVM)分类器实现... 为了解决当前螺旋网人工疵点检测效率低、误检率高等问题,提出了一种基于分类思想的螺旋网疵点检测方法。对螺旋网图像提取多模式多尺度的LBP特征,充分表征螺旋网图像的信息,通过构建支持向量机(Support vector machine,SVM)分类器实现螺旋网疵点自动检测。结果表明:对于螺旋网疵点图像的局部二值模式(Local binary pattern,LBP)特征,采样半径为2,采样点个数为8时的均匀模式LBP的分类准确率优于其他模式和尺度的LBP,达到了100%,检测速度为0.48 s/张。通过对比不同的特征提取方法和分类器,验证了该文方法对于螺旋网疵点自动检测的适用性,可以实现纺织企业中螺旋网的自动化检测。 展开更多
关键词 高分子滤网 机器视觉 疵点检测 局部二值模式 支持向量机
下载PDF
面向载人探月的宽基线相机视觉定位方法研究与地面试验场验证
14
作者 许雄 岑文广 +5 位作者 曹子龙 肖长江 冯永玖 谢欢 王栋 童小华 《载人航天》 CSCD 北大核心 2024年第5期652-658,共7页
针对载人月球车速度较快,远距离测量精度要求更高的特点,研究利用宽基线双目相机提高其测量精度以支撑其自主导航定位能力。提出一种面向载人探月场景的宽基线双目相机视觉定位方法,基于宽基线成像特点优化特征点提取与匹配过程,通过特... 针对载人月球车速度较快,远距离测量精度要求更高的特点,研究利用宽基线双目相机提高其测量精度以支撑其自主导航定位能力。提出一种面向载人探月场景的宽基线双目相机视觉定位方法,基于宽基线成像特点优化特征点提取与匹配过程,通过特征点重投影误差与深度距离阈值设定保留更多远距离物方点参与位姿计算和优化,提升位姿估计的精度。基于所搭建的宽基线立体相机开展了不同基线条件下的视觉定位实验数据采集与实验。与经典的ORB⁃SLAM2算法进行比较,实验结果表明:所提出的算法针对于宽基线实验数据能够取得更优的定位结果,终点的相对位置偏差指标不超过3.1%。初步验证了宽基线导航相机架构在类地外天体场景下的可行性。 展开更多
关键词 载人探月 双目视觉 宽基线 视觉导航定位
下载PDF
宽卷积局部特征扩展的Transformer网络故障诊断模型
15
作者 张新良 李占 周益天 《国外电子测量技术》 2024年第2期139-149,共11页
视觉Transformer网络的高精度诊断性能依赖于充分的训练数据,利用卷积网络在提取局部特征上的优势,构造能同时描述故障局部和全局特征的提取层,提高诊断模型的抗噪声干扰能力。首先,引入卷积网络模块将原始振动信号转换为Transformer网... 视觉Transformer网络的高精度诊断性能依赖于充分的训练数据,利用卷积网络在提取局部特征上的优势,构造能同时描述故障局部和全局特征的提取层,提高诊断模型的抗噪声干扰能力。首先,引入卷积网络模块将原始振动信号转换为Transformer网络可以直接接收的特征向量,提取故障局部特征,并通过增加卷积网络的感受野。然后,结合Transformer网络多头自注意力机制生成的全局信息,构建能同时描述故障局部和全局特征的特征向量。最后,在Transformer网络的预测层,利用高效通道注意力机制对特征向量的贡献度进行自动筛选。在西储大学(CWRU)轴承数据集上的故障诊断结果表明,在信噪比-4 dB的噪声干扰下,改进后的Transformer网络轴承故障诊断模型的准确率达90.21%,与原始Transformer模型相比,准确率提高了13.2%,在噪声环境下表现出优异的诊断性能。 展开更多
关键词 轴承故障诊断 视觉Transformer 宽卷积核 自注意力机制 局部-全局特征 高效通道注意力
下载PDF
钢拱架铰接孔视觉定位方法研究
16
作者 黄海 朱国力 +1 位作者 陈向阳 彭丹丹 《机械设计与制造》 北大核心 2024年第2期276-279,共4页
针对钢拱架自动化拼接过程中需要对钢拱架铰接孔进行定位的实际问题,设计了一种基于双目视觉的钢拱架铰接孔定位方法。首先通过模板匹配对钢拱架铰接孔进行初定位,找到感兴趣区域;采用一种新的自适应阈值算法计算阈值,对感兴趣区域进行... 针对钢拱架自动化拼接过程中需要对钢拱架铰接孔进行定位的实际问题,设计了一种基于双目视觉的钢拱架铰接孔定位方法。首先通过模板匹配对钢拱架铰接孔进行初定位,找到感兴趣区域;采用一种新的自适应阈值算法计算阈值,对感兴趣区域进行二值化处理;利用边缘检测和最小二乘法提取得到铰接孔椭圆轮廓特征;然后找到椭圆轮廓上特殊的两条弦,根据空间几何关系,计算空间圆平面的法向量;利用消影线和椭圆参数矩阵,计算铰接孔圆心在图像上的实际投影点;最后基于双目视觉成像模型计算铰接孔圆心的精确空间坐标。实验证明,本方法可实现钢拱架铰接孔高精度定位,满足实际工业需求,为钢拱架自动化拼接提供技术支撑。 展开更多
关键词 铰接孔定位 双目视觉 模板匹配 二值化 椭圆检测 空间圆投影
下载PDF
基于持续学习的中医舌色苔色协同分类方法
17
作者 卓力 李艳萍 +5 位作者 孙亮亮 张辉 李晓光 张菁 杨洋 魏玮 《北京工业大学学报》 CAS CSCD 北大核心 2024年第9期1077-1088,共12页
中医(traditional Chinese medicine, TCM)舌诊客观化研究中需要分析的舌象特征很多,不同的舌象特征往往采用单独的方法进行分析,导致分析系统的整体实现复杂度大幅增加。为此,基于持续学习的思想,提出一种中医舌色苔色协同分类方法,该... 中医(traditional Chinese medicine, TCM)舌诊客观化研究中需要分析的舌象特征很多,不同的舌象特征往往采用单独的方法进行分析,导致分析系统的整体实现复杂度大幅增加。为此,基于持续学习的思想,提出一种中医舌色苔色协同分类方法,该方法将舌色分类作为旧任务,将苔色分类作为新任务,充分利用2个任务的相似性和相关性,仅通过一个网络结构就同时实现舌色和苔色的准确分类。首先,设计一种基于全局-局部混合注意力机制(global local hybrid attention, GLHA)的双分支网络结构,将网络高层语义特征与低层特征相融合,提升特征的表达能力;然后,提出基于正则化和回放相结合的持续学习策略,使得该网络在学习新任务知识的同时有效防止对旧任务知识的遗忘。在2个自建的中医舌象特征分析数据集上的实验结果表明,提出的协同分类方法可以获得与单个任务相当的分类性能,同时可以将2个分类任务的整体复杂度降低一半左右。其中,舌色分类准确率分别达到93.92%和92.97%,精确率分别达到93.69%和92.87%,召回率分别达到93.96%和93.16%;苔色分类准确率分别达到90.17%和90.26%,精确率分别达到90.05%和90.17%,召回率分别达到90.24%和90.29%。 展开更多
关键词 中医舌色苔色分类 协同分类 深度学习 持续学习 全局-局部混合注意力机制 机器视觉
下载PDF
基于视觉惯性SLAM的室内定位方法研究 被引量:1
18
作者 蒋欣 《测绘与空间地理信息》 2024年第4期221-224,共4页
针对纯视觉SLAM在光照变化明显、环境纹理较少及载体快速运动的室内场景中容易出现特征跟踪失败、定位精度下降等问题,本文提出了一种基于滑动窗口进行后端优化的视觉惯导紧耦合方法,融合了IMU信息以提高跟踪精度与系统的鲁棒性。该方... 针对纯视觉SLAM在光照变化明显、环境纹理较少及载体快速运动的室内场景中容易出现特征跟踪失败、定位精度下降等问题,本文提出了一种基于滑动窗口进行后端优化的视觉惯导紧耦合方法,融合了IMU信息以提高跟踪精度与系统的鲁棒性。该方法利用IMU预积分误差与单目视觉SLAM的重投影误差构建新的损失函数来进行状态估计,采用基于滑动窗口的非线性优化方法进行运动估计,实时恢复组合系统位姿。在实测数据集上的实验结果表明,本文方法在x轴方向上的均方根误差为0.124 m,y轴方向上的均方根误差为0.113 m,实现了厘米级精度的定位。 展开更多
关键词 视觉/惯性 同时定位与建图 滑动窗口 紧耦合
下载PDF
基于视觉的行人定位方法研究——北京故宫游客头戴相机视频记录的时空轨迹重建
19
作者 黄子愚 刘茹枫 +1 位作者 黄蔚欣 徐卫国 《建筑技艺(中英文)》 2024年第4期65-69,共5页
基于视觉的行人轨迹定位方法,不依赖于信号接收设施,具有在建筑环境行为学研究中普及的潜力。研究针对城市公共空间,应用街景地图数据库,探索了地理坐标系中用视觉匹配法从行人头戴相机视频中恢复轨迹的技术管线。
关键词 环境行为学 图像处理 基于视觉的定位 街景
下载PDF
弱纹理环境下融合点线特征的双目视觉同步定位与建图
20
作者 龚坤 徐鑫 +2 位作者 陈小庆 许悦雷 张兆祥 《光学精密工程》 EI CAS CSCD 北大核心 2024年第5期752-763,共12页
针对室内弱纹理环境下基于点特征的视觉同步定位与建图(Simultaneous Localization and Mapping,SLAM)存在的轨迹漂移等问题,提出了一种融合点线特征的双目视觉SLAM系统,并对线特征的提取与匹配问题展开研究。为了提高线特征的质量,通... 针对室内弱纹理环境下基于点特征的视觉同步定位与建图(Simultaneous Localization and Mapping,SLAM)存在的轨迹漂移等问题,提出了一种融合点线特征的双目视觉SLAM系统,并对线特征的提取与匹配问题展开研究。为了提高线特征的质量,通过长度与梯度抑制、短线合并等方法,进一步改进LSD(Line Segment Detector)线特征提取方法。同时,通过将匹配问题转换为优化问题,并利用几何约束构建代价函数,提出了一种基于几何约束的快速线段三角化方法。实验结果表明,本文所提方法在多个数据集上的表现都优于基于描述子的传统方法,尤其在室内弱纹理场景下,其平均匹配精度达到91.67%,平均匹配时间仅需7.4 ms。基于此方法,双目视觉SLAM系统在弱纹理数据集上与已有算法ORBSLAM2,PL-SLAM的定位误差分别为1.24,7.49,3.67 m,定位精度优于现有算法。 展开更多
关键词 双目视觉 线特征提取 视觉同步定位与建图 特征匹配
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部