基于逆深度滤波的双目折反射全景相机动态SLAM系统
在同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)理论不断突破与发展的基础上,移动机器人等技术的研究水平显著提高。视觉传感器的引入拓宽了SLAM的应用。视觉SLAM通过图像序列来估计相机运动,根据图像特征的提取方法主要分为基于特征点的视觉SLAM方法和直接SLAM法两种[
全景相机具有大视场的特性,即使面对快速运动的情况,依然可以获得帧之间的对应关系[
针对动态环境,Li等[
上述工作都只能利用相邻两帧之间的信息来判断场景中对象是动态还是静态的。为了利用更多图像帧的信息,更加准确地判断场景中对象的运动状态,本文提出基于逆深度滤波的双目折反射全景相机动态SLAM系统,以去除动态点为目标,利用静态点对相机进行位姿估计。使用双目全景相机通过立体视觉计算的距离信息对视觉里程计进行补偿推断,采用一种基于贝叶斯滤波的逆深度滤波器,对动态地图点进行剔除,在动态环境下得到更加精确的相机位姿估计结果。此方法可以解决传统SLAM系统面对动态环境时计算轨迹出现漂移的现象,并且计算的位姿结果也更加精确。
2 双目折反射全景相机系统
2.1 折反射全景相机投影模型
折反射全景相机通过顶端反射镜扩大相机的视场,由反射镜和成像模组两部分组成。其结构如
图1 折反射全景相机
Fig.1 Catadioptric panoramic camera
为了表示世界坐标系下点到像素坐标系下的投影过程,应用球面投影模型对折反射全景相机的投影模型进行分析[
图2 折反射全景相机投影过程
Fig.2 Catadioptric panoramic camera projection process
首先,将世界坐标系下的空间点以球心为投影中心投影到单位球上于点,坐标为:
(1) |
折反射全景相机反射镜的镜面参数由来表示。将投影中心由球心移动到,以为投影中心将单位球上的三维点投影到与Cp距离为1的二维平面上对应点,对应关系如下:
(2) |
最后,经过广义投影矩阵K,完成图像坐标系到像素坐标系之间的变换,关系如下:
(3) |
上述推导公式表示世界坐标系下的点在全景相机下的成像过程,很容易得到像素点到空间点的反投影过程。
2.2 双目全景相机三角测量
双目折反射全景相机系统可以利用双目图像计算特征点的深度信息。将深度信息输入逆深度滤波器,对动态地图点进行剔除。这里通过三角化来计算特征点深度,针对折反射全景相机的投影模型,将特征点反投影到球面,在球面上分析三角化过程。
如
(4) |
图3 双目折反射全景相机三角化
Fig. 3 Triangulation of binocular catadioptric panoramic camera
(5) |
通过方程可以求得。于是本文计算了特征点的深度信息,可以确定其在空间中的坐标。将深度信息输入到逆深度滤波器模块可以区分出地图点的类别。
3 逆深度滤波关键算法
深度滤波器采用概率的方式对空间点进行深度估计,随着新的图像帧的进入,对深度的后验概率分布进行更新。Forster等[
虽然文献[
(6) |
针对双目折反射全景相机的动态SLAM系统,本文对
如
图4 双目折反射全景相机动态SLAM算法框图
Fig. 4 Block diagram of dynamic SLAM algorithm for binocular panoramic camera
现假设有一组通过双目折反射全景相机测量得到的含有噪声的地图点的逆深度值,它们之间是相互独立的,现在要估计真实的逆深度值和概率,可以通过求最大后验概率得到。根据贝叶斯公式,其后验具有以下形式:
(7) |
(8) |
真实后验概率可以用贝塔-高斯分布来近似[
(9) |
其中和是Beta分布的参数。为了减少计算量,继续推导公式的迭代形式是必要的。通过推导可以得到迭代形式:
(10) |
通过匹配和的第一阶和第二阶矩,用BetaGaussian分布近似
(11) |
(12) |
因此,每当有新的一帧图片传入系统,本文使用
图5 逆深度滤波算法示意图
Fig.5 Schematic diagram of inverse depth filtering algorithm
4 实验与分析
为了验证基于逆深度滤波的双目折反射全景相机动态SLAM系统的性能,在公开数据集[
在数据集中选取多段包含动态对象的图像序列,并分为低动态序列和高动态序列。选取了一段低动态和两段高动态的图像序列进行实验,对本文提出的SLAM算法进行验证,对SLAM系统分别评估了绝对轨迹误差(Absolute trajectory Error, ATE)和相对轨迹误差(Relative Pose Error, RPE)两个指标。ATE是估计轨迹与ground truth之间的误差,它可以直接反映出位姿估计算法的精度和全局一致性,通常用于评估整个SLAM系统的性能。RPE是评价系统漂移的指标,它是固定时间段内两个位姿变化量的差。考虑ATE和RPE在平移上的误差,其均方根误差(Root Mean Square Error,RMSE)的计算如下:
(13) |
(14) |
其中:表示轨迹中包含的位姿个数,;和分别表示真实轨迹和SLAM系统估计出的轨迹;trans是取括号内变量的平移部分。
本文使用RMSE、平均误差、中值误差和标准差(Standard Deviation, SD)评价ATE指标。将使用本文方法计算出的轨迹分别与单目全景视觉里程计方法及真值进行对比。其中,单目全视觉里程计(Visual Odometry, VO)是基于ORB-SLAM2改进的适合折反射全景相机的算法,把计算出的RMSE、平均误差、中值误差和SD进行统计,结果如
Sequence | Catadioptric Pano VO | Ours | ||||||
---|---|---|---|---|---|---|---|---|
RMSE | Median | Mean | Std | RMSE | Median | Mean | Std | |
Low dynamic sequence(a) | 0.35 | 0.33 | 0.31 | 0.12 | 0.29 | 0.28 | 0.25 | 0.09 |
High dynamic sequence(b) | 12.63 | 9.69 | 10.67 | 4.11 | 0.52 | 0.51 | 0.47 | 0.16 |
High dynamic sequence(c) | 15.35 | 12.14 | 12.13 | 5.29 | 0.56 | 0.52 | 0.53 | 0.19 |
图6 不同序列位姿估计结果与真值间的RPE
Fig.6 RPE between pose estimation results and ground truth for different sequences
图7 不同方法得到的轨迹与真值的对比结果
Fig.7 Comparison of trajectories calculated by different methods with ground truth
分析
5 结 论
为了在复杂的动态环境下能够准确地估计折反射全景相机的位姿,本文提出了基于逆深度滤波的双目折反射全景相机动态SLAM系统,基于ORB-SLAM2的框架设计了双目折反射全景相机的SLAM系统,并在跟踪模块和局部建图模块中间添加了基于贝叶斯滤波的逆深度滤波器模块,对折反射全景相机求出的地图点进行状态估计,剔除动态地图点,只使用收敛的静态地图点对折反射全景相机进行位姿估计,在动态环境下得到了更加精确的相机位姿估计结果。该系统在3个序列中的绝对轨迹误差 的RMSE,比折反射全景VO分别提高了17.14%,95.88%和96.35%。在面对动态环境时,当传统的SLAM系统计算的轨迹出现漂移,基于逆深度滤波的双目折反射全景相机动态SLAM系统始终运行稳定,具有更强的鲁棒性。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了