基于视觉传感器与惯性器件的SLAM技术研究文献综述

 2022-09-24 11:56:48

文献综述(或调研报告):

视觉SLAM是仅以视觉摄像头作为传感器的SLAM系统,因为成本低、功耗小、体积小而成为SLAM研究热点之一。根据使用的视觉传感器不同,可以将视觉传感器分为三大类:使用一个相机作为外部传感器的称为单目视觉SLAM;使用多个相机的称为立体视觉SLAM,其中双目视觉SLAM应用最为广泛;还有使用RGB-D深度相机的称为RGB-D SLAM。视觉相机根据前端使用相机信息的方式不同分为两大类:基于特征点法的视觉SLAM和基于直接法的视觉SLAM。

ORB-SLAM[1]是基于特征点法的视觉SLAM系统中的里程碑式的成果,它继承于PTAM(Paralla Tracking and Mapping),仅支持单目模式,整个系统围绕ORB特征进行计算。ORB-SLAM创新地使用了三个线程完成SLAM:实时跟踪特征点的Tracking线程,使用局部Local Bundle Adjustment(Local BA,局部光束法平差)进行优化的Local Mapping线程和进行回环检测与回环调整的Loop Closing线程。ORB-SLAM2[2]在ORB-SLAM的基础上添加了双目模式和RGB-D模式。

纯视觉相机能够捕捉场景下丰富的信息,而Interational Managers Union(IMU,惯性测量单元)能够高频地在短时间内获得精准的估计,弥补动态运动下相机的不足。同时,相机数据也可以有效修正IMU在读数中的漂移。因此将视觉传感器与惯性传感器结合可以有效地实现互补,得到更好的效果。

视觉和惯性融合的方法可以根据耦合程度分为松耦合(loosely coupled)和紧耦合(tightly coupled)。松耦合指的是IMU和相机分别进行自身的运动估计,然后对其位姿估计的结果进行融合;紧耦合值指的是把IMU的数据和相机的数据合并在一起,共同构建运动方程和观测方程,然后进行状态估计。目前的研究主要集中于紧耦合。另外还可以根据数据估计算法的不同将视觉与惯性融合方法分为基于滤波(filter-based)和基于优化(optimization-based)两大类。

视觉传感器和惯性传感器融合在视觉惯性里程计(VIO)中得到了广泛应用,出现了很多标志性成果。基于紧耦合和滤波法的VIO算法有Mourikis提出的基于双目滤波的MSCKF(multi-state constraint Kalman filter)[3]和苏黎世大学(ETH Zurich)Ethz ASL实验室提出的单目基于滤波的ROVIO(robust visual inertial odometry)[4]。基于优化方法中,目前最先进的VIO是Ethz-ASL推出的基于紧耦合和非线性优化的OKVIS(Open Keyframe-based Visual SLAM)[5],。不同于纯视觉里程计,基于优化的视觉惯性历程计构建了包含重投影误差和IMU误差项的统一损失函数,将视觉与IMU的状态量放在一起进行优化。其中,IMU误差项和相应的雅克比矩阵的推导来源于由Foster推广至SO(3)上的预积分理论[6]。但是,视觉里程计相比于完整的SLAM系统缺少了后端优化和回环检测的环节,使得误差在运行过程中不断累计。

ORB-SLAM2的作者Raacute;ul Mur-Artal在2017年提出了具有地图重用功能的单目视觉惯性SLAM系统[7],此系统是首个单目基于紧耦合和非线性优化的视觉惯性SLAM系统,以ORB-SLAM系统[1]为基本框架,参考预积分理论[6]求取IMU误差项并参考[5]将IMU误差项加入重投影误差中进行联合优化。IMU初始化是系统工作中非常关键的部分,是全局优化收敛的关键。此系统的初始化初始化方法分解为几个步骤进行简化。相比于无法进行回环检测和地图复用的VIO,此系统能够在重复访问某一地点的情况下获得更高的精度。

香港科技大学沈邵劼课题组2018年提出的Vins-Mono[8]是目前最新的单目视觉惯性SLAM系统,它基于紧耦合和非线性优化,它的开创性在于进行了鲁棒性的初始化、能够进行重定位和位姿图的保存和重复使用。此系统在无人机中得到了很好的应用。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版