IMU Preintegration 개념 리뷰 (On-Manifold Preintegration 논문 리뷰)

VINS-mono와 IMU preintegration을 다룬 [SLAM] VINS-mono 논문 리뷰 (+ IMU preintegration) 포스팅도 같이 참조하면 좋다.

본 포스팅은 "On-Manifold Preintegration for Real-Time Visual-Inertial Odometry" 논문을 주로 참고하여 작성하였다.

Introduction

Preliminaries

본 논문에서는 VIO 관련 수식을 최적화하기 위해 MAP 추정을 사용한다. IMU 상태 변수에는 회전, 포즈과 같은 비선형(smooth manifold like SO(3), SE(3)) 항들이 존재하기 때문에 MAP 추정 방법은 결국 비선형 최소제곱법(non-linear least squares like GN, LM)을 수행하여 풀게 된다. 본격적으로 설명하기에 앞서 자주 사용하는 기하학 지식들을 먼저 설명한다.

Notions of Riemannian geometry

Special orthogonal group SO(3)

SO(3)군은 3차원 회전 행렬들의 제약조건을 담고 있는 군을 말한다(자세한 내용은 링크 참조).
\begin{equation}
\begin{aligned}
SO(3) \doteq \{ \mathbf{R} \in \mathbb{R}^{3\times 3} : \mathbf{R}^{\intercal}\mathbf{R}=\mathbf{I}, \ \text{det}(\mathbf{R}) = 1 \}
\end{aligned}
\end{equation}

SO(3)군 사이의 연산은 행렬 곱으로 수행하며 역(inverse)는 행렬을 전치(tranpose)함으로써 구할 수 있다. SO(3)는 smooth manifold 상에 존재하며 접평면(tangent space at identity) 상의 원소는 lie algebra so(3)라고 부른다. lie algebra so(3)는 3x3 크기의 반대칭 행렬로 구성되어 있다.
\begin{equation}
\begin{aligned}
\boldsymbol{\omega}^{\wedge} = \begin{bmatrix}
\omega_1 \\ \omega_2 \\ \omega_3
\end{bmatrix}^{\wedge} = \begin{bmatrix}
0 & -\omega_3 & \omega_2 \\ \omega_3 & 0 & -\omega_1 \\ -\omega_2 & \omega_1 & 0
\end{bmatrix} \in so(3)
\end{aligned}
\end{equation}
- $(\cdot)^{\wedge}$ : 3차원 벡터 $\boldsymbol{\omega}$를 3x3 반대칭 행렬 so(3)로 만드는 연산
- $(\cdot)^{\vee}$ : 3x3 반대칭 행렬 so(3)를 3차원 벡터 $\boldsymbol{\omega}$로 만드는 연산

반대칭 행렬의 유용한 성질은 다음과 같다
\begin{equation}
\begin{aligned}
\mathbf{a}^{\wedge}\mathbf{b} = -\mathbf{b}^{\wedge}\mathbf{a}, \quad \forall \mathbf{a},\mathbf{b} \in \mathbb{R}^3
\end{aligned}
\end{equation}

지수 매핑(exponential mapping at identity) $\exp : so(3) \mapsto SO(3)$는 lie algebra so(3)를 lie group SO(3)로 변환해주는 연산이며 둘 사이의 관계를 표현한 Rodrigues' formula가 유명하다
\begin{equation}
\begin{aligned}
\exp(\boldsymbol{\phi}^{\wedge}) = \mathbf{I} + \frac{\sin(\|\boldsymbol{\phi}\|)}{\| \boldsymbol{\phi} \|}\boldsymbol{\phi}^{\wedge} + \frac{1-\cos(\|\boldsymbol{\phi}\|)}{\|\boldsymbol{\phi}\|^2} (\boldsymbol{\phi}^{\wedge})^2
\end{aligned}
\end{equation}

지수 매핑의 1차 근사는 작은 회전량을 근사할 때 유용하게 사용된다.
\begin{equation} \label{eq:pre9}
\begin{aligned}
\exp(\boldsymbol{\phi}^{\wedge}) \approx \mathbf{I} + \boldsymbol{\phi}^{\wedge}
\end{aligned}
\end{equation}

로그 매핑(logarithm mapping at identity)은 $\mathbf{R} \neq \mathbf{I}$인 SO(3)를 lie albegra so(3)로 변환해주는 매핑이다
\begin{equation}
\begin{aligned}
\log(\mathbf{R}) = \frac{\varphi \cdot (\mathbf{R} - \mathbf{R}^{\intercal})}{2\sin(\varphi)} \quad \text{with } \varphi = \cos^{-1} \bigg( \frac{\text{tr}(\mathbf{R}-1)}{2} \bigg)
\end{aligned}
\end{equation}
- $\log(\mathbf{R})^{\vee} = \mathbf{a}\varphi$ : $\mathbf{a}$는 회전축 벡터, $\varphi$는 회전 각도
- $\mathbf{R} = \mathbf{I}$이면 $\varphi = 0$이 되어 $\mathbf{a}$의 해가 무수히 많아진다

만약 지수 매핑의 정의역을 $\|\boldsymbol{\phi}\| < \pi$로 제한한다면 지수 매핑은 일대일 대응(bijective) 함수가 되며 그 역함수는 로그 매핑이 된다. 하지만 정의역을 제한하지 않으면 지수 매핑은 전사(surjective) 함수가 된다. 왜냐하면 임의의 회전 행렬 $ \mathbf{R} $에 대한 angle-axis 표현을 $(\mathbf{a},\theta)$라고 할 때, $\boldsymbol{\phi} = (\theta + 2k\pi)\mathbf{a},\, k \in \mathbb{Z}$가 $2\pi$마다 같은 각도를 의미하기 때문이다.

표기의 편의를 위해 일반적으로 $\exp(), \log()$ 대신 벡터화된 지수 매핑과 로그 매핑 $\text{Exp}(), \text{Log}()$을 자주 사용한다
\begin{equation} \label{eq:pre1}
\begin{aligned}
\text{Exp}: & \quad \mathbb{R}^3 \rightarrow SO(3) & ; \quad & \boldsymbol{\phi} \mapsto \exp(\boldsymbol{\phi}^{\wedge}) \\
\text{Log}: & \quad SO(3) \rightarrow \mathbb{R}^3 & ; \quad & \mathbf{R} \mapsto \log(\mathbf{R})^{\vee} \\
\end{aligned}
\end{equation}

수식을 유도하다 보면 다음과 같은 지수 매핑의 1차 근사를 사용할 것이다.
\begin{equation} \label{eq:pre8}
\begin{aligned}
\text{Exp}(\boldsymbol{\phi} + \delta \boldsymbol{\phi}) \approx \text{Exp}(\boldsymbol{\phi}) \text{Exp}(\mathbf{J}_r (\boldsymbol{\phi}) \delta \boldsymbol{\phi})
\end{aligned}
\end{equation}
- $\mathbf{J}_r$ : SO(3)군의 오른쪽 자코비안(right jacobian). 기존 SO(3)군의 오른쪽에 섭동량(increments)를 곱할 때 유도되는 자코비안 행렬

\begin{equation} \label{eq:pre3}
\begin{aligned}
\mathbf{J}_{r}(\boldsymbol{\phi}) = \mathbf{I} - \left( \frac{1 - \cos(\|\boldsymbol{\phi}\|)}{\|\boldsymbol{\phi}\|^2} \right) \boldsymbol{\phi}^\wedge + \left( \frac{\|\boldsymbol{\phi}\| - \sin(\|\boldsymbol{\phi}\|)}{\|\boldsymbol{\phi}\|^3} \right) (\boldsymbol{\phi}^\wedge)^2
\end{aligned}
\end{equation}

로그 매핑에도 유사한 1차 근사가 존재한다
\begin{equation}
\begin{aligned}
\text{Log}(\text{Exp}(\boldsymbol{\phi}) \text{Exp}(\delta \boldsymbol{\phi})) \approx \boldsymbol{\phi} + \mathbf{J}_r^{-1} (\boldsymbol{\phi})\delta \boldsymbol{\phi}
\end{aligned}
\end{equation}

오른쪽 자코비안의 역행렬은 다음과 같다
\begin{equation}
\begin{aligned}
\mathbf{J}^{-1}_{r}(\boldsymbol{\phi}) = \mathbf{I} + \frac{1}{2}\boldsymbol{\phi}^\wedge + \Big( \frac{1}{\left\| \boldsymbol{\phi} \right\|^2} - \frac{1 + \cos(\left\| \boldsymbol{\phi} \right\|)}{2\left\| \boldsymbol{\phi} \right\|\sin(\left\| \boldsymbol{\phi} \right\|)} \Big) (\boldsymbol{\phi}^\wedge)^2
\end{aligned}
\end{equation}

오른쪽 자코비안과 그 역행렬 $\mathbf{J}_r, \mathbf{J}^{-1}_r$은 $\|\boldsymbol{\phi}\| = 0$일 때 항등 행렬 $\mathbf{I}$가 된다.

지수 매핑의 또다른 유용한 성질은 다음과 같다
\begin{equation} \label{eq:pre10}
\begin{aligned}
& \mathbf{R}\text{Exp}(\boldsymbol{\phi})\mathbf{R}^{\intercal} = \exp(\mathbf{R}\boldsymbol{\phi}^{\wedge}\mathbf{R}^{\intercal}) = \text{Exp}(\mathbf{R}\boldsymbol{\phi}) \\
& \Leftrightarrow \text{Exp}(\boldsymbol{\phi})\mathbf{R} = \mathbf{R}\text{Exp}(\mathbf{R}^{\intercal}\boldsymbol{\phi})
\end{aligned}
\end{equation}

Special euclidean group SE(3)

SE(3)군은 3차원 강체(rigid body)의 변환 행렬과 관련된 제약조건을 담고 있는 군을 말한다. (자세한 내용은 링크 참조).
\begin{equation}
\begin{aligned}
SE(3) \doteq \{ (\mathbf{R}, \mathbf{p}) : \mathbf{R} \in SO(3), \mathbf{p} \in \mathbb{R}^3 \}
\end{aligned}
\end{equation}

두 개의 SE(3)군에 속한 변환 행렬 $\mathbf{T}_1, \mathbf{T}_2$가 주어졌을 때, 군의 연산은 행렬곱으로 표현되며 $\mathbf{T_1 T_2} = (\mathbf{R}_1 \mathbf{R}_2, \mathbf{p}_1 + \mathbf{R}_1\mathbf{p}_2)$와 같다. 그리고 역(inverse)는 변환 행렬의 역행렬 $\mathbf{T}^{-1}_1 = (\mathbf{R}_1^{\intercal}, -\mathbf{R}^{\intercal}_1 \mathbf{p}_1)$으로 표현된다. SE(3)군 역시 지수 매핑과 로그 매핑이 존재하지만 이는 본 논문에서 사용되지 않으므로 자세한 설명은 생략한다.

Uncertainty description in SO(3)

SO(3)에서 불확실성을 정의하는 자연스러운 방법은 먼저 접평면(tangent space)에서 분포를 정한 뒤 이를 (\ref{eq:pre1})의 지수 매핑을 통해 SO(3) 군으로 보내는 것이다.
\begin{equation} \label{eq:pre2}
\begin{aligned}
\tilde{\mathbf{R}} = \mathbf{R} \text{Exp}(\epsilon), \qquad \epsilon \sim \mathcal(0, \Sigma)
\end{aligned}
\end{equation}
- $\mathbf{R}$: 노이즈가 없는 회전 ($\rightarrow$ 평균)
- $\epsilon$: 평균이 0, 분산이 $\Sigma$인 정규분포를 따르는 확률 변수

$\tilde{\mathbf{R}}$의 분포를 명시적으로 얻기 위해 $\mathbb{R}^3$의 적분에서 시작해보자.
\begin{equation}
\begin{aligned}
\int_{\mathbb{R}^3} p(\epsilon) d \epsilon = \int_{\mathbb{R}^3} \alpha e^{-\frac{1}{2}\|\epsilon\|^2_{\Sigma}} d \epsilon = 1
\end{aligned}
\end{equation}
- $\alpha = 1/\sqrt{(2\pi)^3 \text{det}(\Sigma)}$
- $\|\epsilon\|^2_{\Sigma} \doteq \epsilon^{\intercal} \Sigma^{-1} \epsilon$ : 마할라노비스 거리의 제곱

위 식에 $\epsilon = \text{Log}(\mathbf{R}^{-1}\mathbf{R})$을 대입해보자. 이는 $\|\epsilon\| < \pi$일 때 (\ref{eq:pre2})의 역연산이다.
\begin{equation} \label{eq:pre4}
\begin{aligned}
\int_{SO(3)} \beta(\tilde{\mathbf{R}}) e^{-\frac{1}{2} \|\text{Log}(\mathbf{R}^{-1}\tilde{\mathbf{R}}) \|^2_{\Sigma}} d \tilde{\mathbf{R}} = 1
\end{aligned}
\end{equation}
- $\beta(\tilde{\mathbf{R}})$ : 정규화 인자(normalization factor). 함수의 적분 면적을 1로 만들어주는 계수

정규화 인자를 자세히 보면 $\beta(\tilde{\mathbf{R}}) = \alpha / | \text{det}(\mathcal{J}(\tilde{\mathbf{R}})) |$과 같다. 이 때, $\mathcal{J}(\tilde{\mathbf{R}}) \doteq \mathbf{J}_r (\text{Log}(\mathbf{R}^{-1}\tilde{\mathbf{R}}))$이다. $\mathbf{J}_r(\cdot)$은 앞서  (\ref{eq:pre3})에서 설명한 SO(3)군의 오른쪽 자코비안이다.

(\ref{eq:pre4})의 형태에서 바로 SO(3)의 가우시안 분포를 얻을 수 있다.
\begin{equation} \label{eq:pre5}
\begin{aligned}
p(\tilde{\mathbf{R}}) = \beta(\tilde{\mathbf{R}})  e^{-\frac{1}{2} \|\text{Log}(\mathbf{R}^{-1}\tilde{\mathbf{R}}) \|^2_{\Sigma}}
\end{aligned}
\end{equation}

공분산이 작을 때는 $\tilde{\mathbf{R}} \approx \mathbf{R}$이므로 $\mathbf{J}_r(\text{Log}(\mathbf{R}^{-1}\tilde{\mathbf{R}})) \approx \mathbf{I}$이고 $\beta(\tilde{\mathbf{R}}) \approx \alpha$로 근사할 수 있다. (\ref{eq:pre4})는 이미 $\| \epsilon \| < \pi$와 같이 범위가 정해져 있기 때문에 평균에서 멀리 있는($\pi$를 넘어가는) 각도는 고려하지 않으므로 작은 공분산이라는 가정이 더욱 타당해진다.

만약 $\beta$를 상수로 가정하면, $\tilde{\mathbf{R}}$이 (\ref{eq:pre5})처럼 분포할 때 회전 $\mathbf{R}$의 negative log-likelihood는 다음과 같다
\begin{equation}
\begin{aligned}
\mathcal{L}(\mathbf{R}) = \frac{1}{2} \| \text{Log}(\mathbf{R}^{-1}\tilde{\mathbf{R}}) \|^2_{\Sigma} + \text{const} =  \frac{1}{2} \| \text{Log}(\tilde{\mathbf{R}}^{-1}\mathbf{R}) \|^2_{\Sigma} + \text{const}
\end{aligned}
\end{equation}

이는 기하학적으로 봤을 때 $\tilde{\mathbf{R}}$과 $\mathbf{R}$ 사이의 회전각(SO(3) geodesic 거리)을 의미한다. 그리고 거기에 $\Sigma^{-1}$ 가중치를 곱한 후 제곱한 거리로 해석할 수 있다.

Gauss-Newton method on manifold

유클리드 공간에서 일반적인 Gauss-Newton(GN) 방법은 (일반적으로 non-convex)인 목적 함수를 2차 근사(quadratic approximation)로 반복적으로 최적화한다. 2차 근사는 선형 방정식(정규 방정식)을 푸는 문제로 귀결되고 그 해로 현재 추정값을 갱신한다. 이번 섹션에서는 이러한 GN을 변수들이 특정 manifold $\mathcal{M}$ 위에 사는 (제약 없는)최적화 문제로 확장하는 법에 대해 설명한다.

다음 문제를 생각해보자
\begin{equation}
\begin{aligned}
\min_{x \in \mathcal{M}} f(x)
\end{aligned}
\end{equation}
- $x$는 manifold $\mathcal{M}$ 위에 존재하는 변수
- 편의 상 위 식은 단일 변수로 나타내었지만 다변수로 쉽게 일반화할 수 있다.

유클리드 경우와 달리 위 식은 $x$에 대해 바로 2차 근사를 만들 수 없다. 주된 이유는 두 가지이다.

첫째로 $x$ 자체로 최적화를 수행하는 경우 over-parameterized 문제가 발생할 수 있다. 예를 들어 회전 행렬은 3자유도이지만 9개의 파라미터를 갖고 있다. 이 때문에 정규 방정식이 under-determined되어 무수한 해를 가질 수 있다.
둘째는 그렇게 얻은 근사 해가 일반적으로 $\mathcal{M}$ 위에 있지 않다.

manifold 최적화의 일반적인 접근 방법은 리트랙션(retraction) $\mathcal{R}_x$를 도입하는 것이다. $\mathcal{R}_x$는 점 $x$의 접평면 공간의 원소 $\delta x$와 $x$ 주변의 $\mathcal{M}$ 상의 한 이웃 사이를 연결하는 일대일 대응 매핑 연산자를 의미한다. 리트랙션을 사용하면 문제를 아래와 같이 변경할 수 있다.
\begin{equation} \label{eq:pre6}
\begin{aligned}
\min_{x \in \mathcal{M}} f(x) \qquad \Rightarrow \qquad \min_{\delta x \in \mathbb{R}^n} f(\mathcal{R}_x(\delta x))
\end{aligned}
\end{equation}

위 식과 같이 기존 파라미터를 변경(re-parameterized)하는 것을 흔히 리프팅(lifting)이라고 부른다. 간단히 말하면 현재 상태에서 정의되는 접평면(여기는 국소적으로 유클리드 공간처럼 작동)에서 작업을 수행하기 위해 파라미터를 바꾸는 것이다(SO(3)인 경우 $\delta x \in \mathbb{R}^3$).

리프팅이 되었으면 (\ref{eq:pre6}) 문제에 일반적인 최적화 기법을 적용한다. GN 프레임워크에서는 현재 상태 주변에서 비용 함수를 제곱한 다음 2차 근사 방법을 통해 접평면 공간에서 $\delta x^{*}$를 구한다. 최종적으로 현재 상태를 다음과 같이 갱신한다.
\begin{equation}
\begin{aligned}
\hat{x} \leftarrow \mathcal{R}_x(\delta x^{*})
\end{aligned}
\end{equation}

위와 같은 방법론을 흔히 "lift-solve-retraction"이라고 부르며 어떤 trust-region 방법에도 사용할 수 있다. 또한 이 방법은 항공 역학 필터링 문헌의 에러 상태 모델(error-state model)을 단일 이론으로 묶어주며 로보틱스 최적화에도 널리 쓰인다.

마지막으로 $\mathcal{R}_x$의 구체적인 방법에 대해 얘기해보자. 지수 매핑(exponential mapping)은 사용 가능한 리트랙션 방법 중 하나이다. 본 논문에서는 다음과 같은 리트랙션을 사용한다.
\begin{equation}
\begin{aligned}
\mathcal{R}_{\mathbf{R}}(\boldsymbol{\phi}) = \mathbf{R}\text{Exp}(\delta \boldsymbol{\phi}), \qquad \delta \boldsymbol{\phi} \in \mathbb{R}^3
\end{aligned}
\end{equation}

SE(3)군의 경우 $\mathbf{T} \doteq (\mathbf{R}, \mathbf{p})$라고 하면 다음과 같이 리트랙션을 정의한다.
\begin{equation}
\begin{aligned}
\mathcal{R}_{\mathbf{T}}(\delta \boldsymbol{\phi}, \delta \mathbf{p}) = (\mathbf{R}\text{Exp}(\delta \boldsymbol{\phi}), \ \mathbf{p} + \mathbf{R}\delta \mathbf{p}), \qquad [\delta \boldsymbol{\phi}, \delta \mathbf{p}] \in \mathbb{R}^6
\end{aligned}
\end{equation}

Maximum a posteriori visual-inertial state estimation

본 논문에서는 IMU와 단안 카메라가 달린 시스템(모바일 로봇, 드론, 핸드헬드 장치 등)의 상태를 추정하는 VIO 문제를 다룬다. IMU 좌표계 $B$가 우리가 추적하는 본체의 좌표계와 일치한다고 가정하고 카메라-IMU 변환은 미리 캘리브레이션하여 고정되어 있다고 본다. Front-end에서는 3D 랜드마크에 대한 이미지 측정 값을 제공하며 여러 영상 중 일부를 키프레임으로 고정한다. 우리는 이 키프레임들의 포즈를 추정한다.

The state

시간 $i$에서 시스템의 상태는 IMU 기준의 방향, 위치, 속도, bias로 표현된다.
\begin{equation}
\begin{aligned}
\mathbf{x}_i \doteq [\mathbf{R}_i, \mathbf{p}_i, \mathbf{v}_i, \mathbf{b}_i]
\end{aligned}
\end{equation}
- $(\mathbf{R}_i, \mathbf{p}_i)$ : SE(3)군에 속하는 포즈
- $\mathbf{v}_i \in \mathbb{R}^3$ : 속도
- $\mathbf{b}_i = [\mathbf{b}^g_i, \mathbf{b}^a_i] \in \mathbb{R}^6$ : IMU bias

시간 $k$까지의 모든 키프레임들의 집합을 $\mathcal{K}_k$라고 할 때 우리가 추정하는 상태들의 집합 $\mathcal{X}_k$는 다음과 같이 표기할 수 있다.
\begin{equation}
\begin{aligned}
\mathcal{X}_k \doteq \{ \mathbf{x}_i \}_{i \in \mathcal{K}_k}
\end{aligned}
\end{equation}

본 논문의 실제 구현에서는 structureless 기법을 사용하기 때문에 3D 랜드마크는 상태 변수에 포함하지 않는다. 필요하다면 위 방법을 랜드마크 및 카메라 내,외부 파라미터 추정으로도 쉽게 일반화 할 수 있다.

The measurements

입력 측정값은 IMU와 카메라 센서로부터 들어온다. 키프레임 $i$의 이미지 집합을 $\mathcal{C}_i$로 표기한다. 시간 $i$에 카메라는 여러 랜드마크 $l$을 볼 수 있으므로 $\mathcal{C}_i$에는 여러 측정값 $\mathbf{z}_{il}$이 포함된다. 편의 상 $l \in \mathcal{C}_i$라고 표기하면 $i$에서 $l$을 관측했다는 뜻으로 해석한다.

연속 키프레임 $i$와 $j$ 사이에서 수집된 IMU 측정값들의 집합은 $\mathcal{I}_{ij}$로 쓴다. IMU 업데이트 속도와 키프레임 빈도에 따라 $\mathcal{I}_{ij}$의 수는 수 개에서 수 백개의 측정값이 들어갈 수 있다. 시간 $k$까지 모인 전체 IMU+이미지 관측값들의 집합 $\mathcal{Z}_{k}$는 다음과 같다.
\begin{equation}
\begin{aligned}
\mathcal{Z}_k \doteq \{ \mathcal{C}_i, \mathcal{I}_{ij} \}_{(i,j) \in \mathcal{K}_k}
\end{aligned}
\end{equation}

Factor graphs and MAP estimation

관측값 $\mathcal{Z}_k$와 상태에 대한 사전 정보 $p(\mathcal{X}_0)$가 주어졌을 때 상태 변수 $\mathcal{X}_k$의 사후 분포(posteriori)는 다음과 같다
\begin{equation} \label{eq:pre7}
\begin{aligned}
p(\mathcal{X}_k | \mathcal{Z}_k) & \propto p(\mathcal{X}_0)p(\mathcal{Z}_k | \mathcal{X}_k) =^{(a)} p(\mathcal{X}_0) \prod_{(i,j)\in\mathcal{K}_k} p(\mathcal{C}_i,\mathcal{I}_{ij} | \mathcal{X}_k) \\
& =^{(b)} p(\mathcal{X}_0) \prod_{(i,j)\in\mathcal{K}_k} p(\mathcal{I}_{ij} | \mathbf{x}_j, \mathbf{x}_i) \prod_{i \in \mathcal{K}_k} \prod_{l \in \mathcal{C}_i} p(\mathbf{z}_{il} | \mathbf{x}_i)
\end{aligned}
\end{equation}
- (a) : 관측값들 간의 독립이라고 가정했을 때 분해
- (b) : 마르코프 성질을 사용한 분해

$\mathcal{Z}_k$는 이미 관측된 값이므로 더 이상 우리가 추정할 변수가 아니다. 따라서 사후분포는 상태 변수 $\mathcal{X}_k$들만을 인수(factor) 로 갖는 likelihood들의 곱으로 정리된다. 이 곱 구조를 그대로 그림으로 나타낸 것이 factor graph이다. 그래프에는 상태(미지수)들을 담는 변수 노드와, 해당 상태들에 의존하는 likelihood(또는 제약)를 나타내는 factor 노드가 있고, 각 factor 노드는 자신이 참조하는 변수 노드들과 연결된다.

MAP 추정으로 구하고자 하는 상태 $\mathcal{X}^{*}$는 (\ref{eq:pre7})를 최대로 하는 값, 즉 negative log-posterior의 최소값이다. 노이즈가 평균이 0인 가우시안 분포라고 가정하면 이는 residual 제곱들의 합으로 표현할 수 있다.
\begin{equation} \label{eq:pre11}
\begin{aligned}
\mathcal{X}^*_k & \doteq \arg\min_{\mathcal{X}_k} \ -\log_e p(\mathcal{X}_k | \mathcal{Z}_k) \\
& = \arg\min_{\mathcal{X}_k} \|\mathbf{r}_{0}\|^2_{\boldsymbol{\Sigma}_0^2} + \sum_{(i,j)\in\mathcal{K}_k} \| \mathbf{r}_{\mathcal{I}_{ij}}\|^2_{\boldsymbol{\Sigma}_{ij}^2} + \sum_{i\in\mathcal{K}_k} \sum_{l \in \mathcal{C}_i} \| \mathbf{r}_{\mathcal{C}_{il}} \|^2_{\boldsymbol{\Sigma}_C}
\end{aligned}
\end{equation}
- $\mathbf{r}_0$ : 사전 항의 residual
- $\mathbf{r}_{\mathcal{I}_{ij}}$ : preintegrated IMU의 residual
- $\mathbf{r}_{\mathcal{C}_{il}}$ : 랜드마크의 reprojection residual
- $\boldsymbol{\Sigma}_0, \boldsymbol{\Sigma}_{ij}, \boldsymbol{\Sigma}_{c}$ : 각 residual들의 공분산

간단하게 말해서 residual은 측정값과 예측값의 차이를 수치화한 함수이고 우리는 그 제곱합(+공분산으로 가중된)을 최소화해 상태 $\mathcal{X}_k$를 추정한다.

IMU model and motion integration

일반적으로 IMU 센서로부터 얻을 수 있는 정보에는 3축의 가속도와 3축의 각속도 정보가 포함된다. 가속도와 각속도의 측정값(measurement)에는 bias와 노이즈 성분이 포함되어 있기 때문에 다음과 같이 나타낼 수 있다.
\begin{equation} \label{eq:imu0}
\begin{aligned}
& _{{\sm{B}}}\tilde{\boldsymbol{\omega}}_{{\sm{WB}}}(t) = \ _{{\sm{B}}}\boldsymbol{\omega}_{{\sm{WB}}}(t) + \mathbf{b}^g(t) + \boldsymbol{\eta}^{g}(t) \\
& _{{\sm{B}}}\tilde{\mathbf{a}}(t) = \mathbf{R}_{{\sm{WB}}}^{\intercal}(t)(_{{\sm{W}}}\mathbf{a}(t) - \ _{{\sm{W}}}\mathbf{g}) + \mathbf{b}^{a}(t) + \boldsymbol{\eta}^{a}(t)
\end{aligned}
\end{equation}
- $_{{\sm{B}}}\tilde{\boldsymbol{\omega}}_{{\sm{WB}}}(t)$: 관측된(measured) 각속도
- $_{{\sm{B}}}\tilde{\mathbf{a}}(t)$: 관측된(measured)  가속도
- $_{{\sm{B}}}\boldsymbol{\omega}_{{\sm{WB}}}(t)$: 실제(true) 각속도
- $_{{\sm{W}}}\mathbf{a}(t)$: 실제(true) 가속도
- $\mathbf{b}^g(t), \mathbf{b}^a(t)$: 각속도와 가속도의 bias 값
- $\boldsymbol{\eta}^{g}(t), \boldsymbol{\eta}^{a}(t)$: 각속도와 가속도의 노이즈 값

기호 앞에 위치하는 B는 "B(=IMU) 좌표계에서 바라본" 것을 의미한다. IMU의 포즈는 $\{\mathbf{R}_{{\sm{WB}}}, \ _{\sm{W}}\mathbf{p}\}$에 의해 B에서 W로 변환되어 월드 좌표계 기준으로 표현된다. $_{{\sm{B}}}\boldsymbol{\omega}_{{\sm{WB}}} \in \mathbb{R}^3$는 B 좌표계에서 표현된 "W에서 본 B의" 순간적인 각속도(instantaneous angular velocity)를 의미한다. $_{{\sm{W}}}\mathbf{a} \in \mathbb{R}^3$는 월드 좌표계에서 본 센서의 가속도를 의미하며 $_{{\sm{W}}}\mathbf{g}$는 월드 좌표계에서 본 중력 벡터를 의미한다.

IMU 측정값으로 부터 아래와 같은 IMU Kinematic Model을 사용하면 IMU의 모션을 추정할 수 있다.
\begin{equation} \label{eq:imu1}
\begin{aligned}
& \dot{\mathbf{R}}_{\sm{WB}} = \mathbf{R}_{\sm{WB}} \ _{\sm{B}}\boldsymbol{\omega}_{\sm{WB}}^{\wedge} \\
& _{\sm{W}}\dot{\mathbf{v}} = \ _{\sm{W}}\mathbf{a} \\
& _{\sm{W}}\dot{\mathbf{p}} = \ _{\sm{W}}\mathbf{v}
\end{aligned}
\end{equation}

위 모델을 사용하면 시간에 따른 IMU의 포즈와 속도의 변화를 수식으로 나타낼 수 있다. $t+\Delta t$ 시간에 IMU 포즈와 속도는 다음과 같이 (\ref{eq:imu1})를 적분하여 나타낼 수 있다.
\begin{equation}
\begin{aligned}
& \mathbf{R}_{{\sm{WB}}}(t+\Delta t) = \mathbf{R}_{{\sm{WB}}}(t) \cdot \text{Exp}\bigg( {\color{Mahogany} \int^{t+\Delta t}_{t} \ _{\sm{B}}\boldsymbol{\omega}_{{\sm{WB}}}(\tau) d\tau } \bigg) \\
& _{\sm{W}}\mathbf{v}(t+\Delta t) = \ _{\sm{W}}\mathbf{v}(t) + {\color{Mahogany} \int^{t+\Delta t}_{t} \ _{\sm{W}}\mathbf{a}(\tau) d\tau } \\
& _{\sm{W}}\mathbf{p}(t+\Delta t) = \ _{\sm{W}}\mathbf{p}(t) + \int^{t+\Delta t}_{t} \ _{\sm{W}}\mathbf{v}(\tau) d\tau + {\color{Mahogany} \int\int^{t+\Delta t}_{t} \ _{\sm{W}}\mathbf{a}(\tau) d\tau^2 }\\
\end{aligned}
\end{equation}

만약 가속도 $_{\sm{W}}\mathbf{a}$와 각속도 $_{\sm{B}}\boldsymbol{\omega}_{{\sm{WB}}}$가 시간 $[t, t+\Delta t]$ 동안 일정(constant)하다고 가정하면 위 식은 다음과 같이 조금 더 간결하게 쓸 수 있다.
\begin{equation}
\begin{aligned}
& \mathbf{R}_{{\sm{WB}}}(t+\Delta t) = \mathbf{R}_{{\sm{WB}}}(t) \cdot \text{Exp}(  {\color{Mahogany} _{\sm{B}}\boldsymbol{\omega}_{{\sm{WB}}} } \Delta t ) \\
& _{\sm{W}}\mathbf{v}(t+\Delta t) = \ _{\sm{W}}\mathbf{v}(t) + \ {\color{Mahogany} _{\sm{W}}\mathbf{a} } \Delta t \\
& _{\sm{W}}\mathbf{p}(t+\Delta t) = \ _{\sm{W}}\mathbf{p}(t) + \ _{\sm{W}}\mathbf{v}\Delta t + \ {\color{Mahogany} _{\sm{W}}\mathbf{a} }\Delta t^2\\
\end{aligned}
\end{equation}

(\ref{eq:imu0})에서 보다시피 실제 IMU 가속도와 각속도 $_{\sm{W}}\mathbf{a}, \ _{\sm{B}}\boldsymbol{\omega}_{{\sm{WB}}}$는 IMU 측정값 $_{\sm{W}}\tilde{\mathbf{a}},\ _{\sm{B}}\tilde{\boldsymbol{\omega}}_{{\sm{WB}}}$에 대한 함수이므로 위 식을 다시 고쳐쓰면 다음과 같다.
\begin{equation}
\begin{aligned}
& \mathbf{R}_{{\sm{WB}}}(t+\Delta t) = \mathbf{R}_{{\sm{WB}}}(t) \cdot \text{Exp}(  ( {\color{Mahogany} _{{\sm{B}}}\tilde{\boldsymbol{\omega}}_{{\sm{WB}}}(t) - \ _{{\sm{B}}} \mathbf{b}^g(t) - \ _{{\sm{B}}}\boldsymbol{\eta}^{{\smm{gd}}}(t) } ) \Delta t ) \\
& _{\sm{W}}\mathbf{v}(t+\Delta t) = \ _{\sm{W}}\mathbf{v}(t) + {\color{Mahogany} \ _{\sm{w}}\mathbf{g} } \Delta t +  {\color{Mahogany} \mathbf{R}_{{\sm{WB}}}(t) ( _{\sm{W}}\tilde{\mathbf{a}}(t) - \ _{{\sm{B}}}\mathbf{b}^a(t) - \ _{{\sm{B}}} \boldsymbol{\eta}^{{\smm{ad}}}(t)) } \Delta t \\
& _{\sm{W}}\mathbf{p}(t+\Delta t) = \ _{\sm{W}}\mathbf{p}(t) + \ _{\sm{W}}\mathbf{v}(t)\Delta t + {\color{Mahogany} \frac{1}{2} \ _{\sm{w}}\mathbf{g} } \Delta t^2 + {\color{Mahogany} \frac{1}{2}\mathbf{R}_{{\sm{WB}}}(t)(_{\sm{W}}\tilde{\mathbf{a}}(t) - \ _{{\sm{B}}} \mathbf{b}^{a}(t) - \ _{{\sm{B}}} \boldsymbol{\eta}^{{\smm{ad}}}(t) ) } \Delta t^2\\
\end{aligned}
\end{equation}

아래 첨자로 붙은 좌표계는 자명하기 때문에 가독성을 위하여 이를 생략하여 나타낸다.
\begin{equation} \label{eq:imu2} \boxed{
\begin{aligned}
& \mathbf{R}(t+\Delta t) = \mathbf{R}(t) \cdot \text{Exp}(  ( {\color{Mahogany} \tilde{\boldsymbol{\omega}}(t) - \mathbf{b}^g(t) - \boldsymbol{\eta}^{{\smm{gd}}}(t) } ) \Delta t ) \\
& \mathbf{v}(t+\Delta t) = \mathbf{v}(t) + {\color{Mahogany} \mathbf{g} } \Delta t +  {\color{Mahogany} \mathbf{R}(t) (\tilde{\mathbf{a}}(t) - \mathbf{b}^a(t) - \boldsymbol{\eta}^{{\smm{ad}}}(t)) } \Delta t \\
& \mathbf{p}(t+\Delta t) = \mathbf{p}(t) + \mathbf{v}(t)\Delta t + {\color{Mahogany} \frac{1}{2}\mathbf{g} } \Delta t^2 + {\color{Mahogany} \frac{1}{2}\mathbf{R}(t)(\tilde{\mathbf{a}}(t) - \mathbf{b}^{a}(t) - \boldsymbol{\eta}^{{\smm{ad}}}(t) ) } \Delta t^2\\
\end{aligned} }
\end{equation}
- $\boldsymbol{\eta}^{\smm{gd}}, \boldsymbol{\eta}^{\smm{ad}}$: 이산화 시간(discrete-time) 버전 각속도, 가속도 노이즈

이산화 시간(discrete-time) 버전  노이즈 $\boldsymbol{\eta}^{\smm{gd}}, \boldsymbol{\eta}^{\smm{ad}}$의 공분산은 연속 시간 노이즈 $\boldsymbol{\eta}^g, \boldsymbol{\eta}^a$와 샘플링 주기 $\Delta t$와 관련있기 때문에 이에 대한 함수로 나타낼 수 있다.
\begin{equation}
\begin{aligned}
& \text{Cov}(\boldsymbol{\eta}^{\smm{gd}}(t)) = \frac{1}{\Delta t} \text{Cov}(\boldsymbol{\eta}^g (t)) \\
& \text{Cov}(\boldsymbol{\eta}^{\smm{ad}}(t)) = \frac{1}{\Delta t} \text{Cov}(\boldsymbol{\eta}^a (t)) \\
\end{aligned}
\end{equation}

IMU preintegration on manifold

(\ref{eq:imu2})을 자세히 보면 $t$ 시간과 $t+\Delta t$ 시간의 사이의 상태 변수에 대한 관계식인 것을 알 수 있다. 따라서 (\ref{eq:imu2})를 사용하면 매 IMU 측정값(measurement)가 들어올 때마다  다음 스텝의 상태 변수를 추정(estimation)할 수 있다.

두 키프레임 $i, j$가 주어졌을 때 두 키프레임 사이에 존재하는 모든 IMU 측정값들을 누적하면 하나의 측정값으로 합칠 수 있으며 이를 preintegrated IMU 측정값(measurement)이라고 정의한다. IMU는 카메라와 시간적으로 동기화되어 있다고 가정하고 임의의 이산 시간 $k$에 대한 측정값을 매 순간 얻는다고 할 때 (\ref{eq:imu2})을 $k=i$부터 $k=j$까지 누적한 preintegration IMU 측정값은 다음과 같다.
\begin{equation} \label{eq:imu3}
\begin{aligned}
& \mathbf{R}_j = \mathbf{R}_i \prod_{k=i}^{j-1} \text{Exp} \bigg(\bigg(  \tilde{\boldsymbol{\omega}}_k - \mathbf{b}_k^g - \boldsymbol{\eta}^{{\smm{gd}}}_k \bigg)\Delta t \bigg) \\
& \mathbf{v}_j = \mathbf{v}_i + \mathbf{g}{\color{Mahogany} \Delta t_{ij} } + \sum_{k=i}^{j-1} \mathbf{R}_k \bigg( \tilde{\mathbf{a}}_k  - \mathbf{b}^{a}_k - \boldsymbol{\eta}^{{\smm{ad}}}_k \bigg)\Delta t \\
& \mathbf{p}_j = \mathbf{p}_i + \sum_{k=i}^{j-1} \bigg[ \mathbf{v}_k\Delta t + \frac{1}{2}\mathbf{g}\Delta t^2 + \frac{1}{2}\mathbf{R}_k \bigg( \tilde{\mathbf{a}}_k  - \mathbf{b}^{a}_k - \boldsymbol{\eta}^{{\smm{ad}}}_k \bigg) \Delta t^2 \bigg]
\end{aligned}
\end{equation}
- $\Delta t_{ij} \doteq \sum_{k=i}^{j-1}\Delta t$: 키프레임 $i$ 부터 $j-1$까지 모든 $\Delta t$를 더한 값
- 가독성을 위해 $(\cdot)(t_i)$를 $(\cdot)_i$로 표기하였다

(\ref{eq:imu3})를 사용하면 두 키프레임 $i$와 $j$ 사이의 IMU 측정값들을 누적하여 둘 사이의 상대적인 모션을 추정할 수 있다. 하지만 최적화 과정에서 비선형 상태 변수 $\mathbf{R}_i$가 업데이트 될 때마다 $[i, j)$ 구간의 모든 비선형 상태 변수를 선형화(linearization)하는 과정에서 반복적인 연산을 수행해야 한다. 예를 들어 $\mathbf{R}_i$가 변하면 이에 따른 $\mathbf{R}_k, k=i,\cdots,j-1$ 또한 모두 다시 계산해야 한다.

이러한 비효율적인 계산을 피하기 위해 (\ref{eq:imu3})을 바로 사용하는 것이 아닌 아래와 같은 두 키프레임 $i$와 $j$의 상대적인 모션 증가량(relative motion increments)를 정의하여 $t_i$ 시간의 포즈와 속도에 대해 독립적이 되도록 만든다.
\begin{equation} \label{eq:imu4} \boxed{
\begin{aligned}
& \Delta \mathbf{R}_{ij} \doteq \mathbf{R}_i^{\intercal}\mathbf{R}_j && =  \prod_{k=i}^{j-1} \text{Exp} \bigg(\bigg(  \tilde{\boldsymbol{\omega}}_k - \mathbf{b}_k^g - \boldsymbol{\eta}^{{\smm{gd}}}_k \bigg)\Delta t \bigg) \\
& \Delta \mathbf{v}_{ij} \doteq \mathbf{R}_i^{\intercal}(\mathbf{v}_j - \mathbf{v}_i - \mathbf{g} \Delta t_{ij}) && = \sum_{k=i}^{j-1} \Delta \mathbf{R}_{ik} \bigg( \tilde{\mathbf{a}}_k  - \mathbf{b}^{a}_k - \boldsymbol{\eta}^{{\smm{ad}}}_k \bigg)\Delta t \\
& \Delta \mathbf{p}_{ij} \doteq \mathbf{R}_i^{\intercal}(\mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_k\Delta t_{ij} -  \frac{1}{2}\sum_{k=i}^{j-1} \mathbf{g}\Delta t^2)  && = \sum_{k=i}^{j-1} \bigg[ \Delta \mathbf{v}_{ik}\Delta t +  \frac{1}{2}\Delta \mathbf{R}_{ik} \bigg( \tilde{\mathbf{a}}_k  - \mathbf{b}^{a}_k - \boldsymbol{\eta}^{{\smm{ad}}}_k \bigg) \Delta t^2 \bigg]
\end{aligned} }
\end{equation}

위 식에서 주목해야할 부분은 $\Delta \mathbf{v}_{ij}$와 $\Delta \mathbf{p}_{ij}$는 실제 속도와 실제 위치의 물리적 변화를 의미하지 않는다는 사실이다. 두 물리량은 (\ref{eq:imu4}) 식의 맨 오른쪽 부분을 $t_i$ 시간의 상태 변수로부터 독립으로 만들기 위해 임의로 정의한 값이다. 식을 자세히 보면 맨 오른쪽 식은 중력 효과 또한 없는 것을 알 수 있다. (\ref{eq:imu4})을 사용하면 $t_i$에 상관없이 IMU의 측정값으로부터 바로 두 키프레임 사이의 preintegration IMU 측정값을 구할 수 있다.

엄밀하게 말하면 (\ref{eq:imu4}) 에서 IMU의 bias 값은 매 순간마다 변화해야 하지만 계산의 편의를 위해 두 키프레임 $i, j$ 사이의 시간은 충분히 짧은 시간이기 때문에 bias 값을 상수로 가정한다.
\begin{equation}
\begin{aligned}
& \mathbf{b}_i^g = \mathbf{b}^g_{i+1} = \cdots = \mathbf{b}^g_{j-1} \\
& \mathbf{b}_i^a = \mathbf{b}^a_{i+1} = \cdots = \mathbf{b}^a_{j-1} \\
\end{aligned}
\end{equation}

Preintegrated IMU measurements

(\ref{eq:imu4})은 키프레임 $i$, $j$의 상태 변수를 나타낸 좌측 항과 이들의 측정값을 나타낸 우측 항으로 이루어져 있기 때문에 이미 하나의 측정 모델(measurement model)이라고 볼 수 있다. 하지만 (\ref{eq:imu4})는 수식 안에 측정 노이즈($\boldsymbol{\eta}$)들이 복잡하게 섞여 있기 때문에 하나의 깔끔한 MAP 추정 문제로 수식화하기 어려운 단점이 있다. MAP 추정을 하려면 각 상태변수들을 깔끔한 negative log-likelihood 형태로 변환할 수 있어야 하기 때문에 노이즈항들을 분리할 필요가 있다. 따라서 노이즈항을 분리하기 위한 여러 수학적 테크닉들을 사용할 것이다. 그리고 $t_i$ 시간에서 bias 값은 이미 알고 있다고 가정하고 수식을 유도한다.

우선 $\Delta \mathbf{R}_{ij}$부터 노이즈항을 분리해보자. Preliminaries 섹션에서 설명한 (\ref{eq:pre8})을 사용하여 노이즈항을 맨 뒤로 옮길 수 있다.
\begin{equation} \label{eq:imu5}
\begin{aligned}
\Delta \mathbf{R}_{ij} & = \prod_{k=i}^{j-1} \bigg[ \text{Exp}((\tilde{\boldsymbol{\omega}}_{k} - \mathbf{b}_{i}^{g})\Delta t) \cdot {\color{Mahogany} \text{Exp}\Big( -\mathbf{J}^{k}_r \boldsymbol{\eta}^{{\smm{gd}}}_k \Delta t \Big) } \bigg] \\
& = \Delta \tilde{\mathbf{R}}_{ij} \cdot  {\color{Mahogany} \prod_{k=i}^{j-1}  \text{Exp}\bigg( -\Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{{\smm{gd}}}_k \Delta t \bigg) } \\
& \doteq \Delta \tilde{\mathbf{R}}_{ij} \cdot  {\color{Mahogany} \text{Exp}(-\delta \boldsymbol{\phi}_{ij}) }
\end{aligned}
\end{equation}
- $\mathbf{J}^k_r \doteq \mathbf{J}^k_r ((\tilde{\boldsymbol{\omega}}_k - \mathbf{b}^g_i)\Delta t)$를 단순화하여 표기
- $\Delta \tilde{\mathbf{R}}_{ij} \doteq \prod_{k=i}^{j-1} \text{Exp}((\tilde{\boldsymbol{\omega}}_{k} - \mathbf{b}_{i}^{g})\Delta t)$ : preintegrated된 상대 회전량
- $\delta \boldsymbol{\phi}_{ij}$ : preintegrated된 상대 회전량의 노이즈

다음으로 (\ref{eq:imu5})를 (\ref{eq:imu4})의 $\Delta \mathbf{v}_{ij}$에 대입한 후 작은 회전량에 대해 $\text{Exp}(\delta \boldsymbol{\phi}_{ij}) \approx \mathbf{I} + \delta \boldsymbol{\phi}_{ij}^{\wedge}$ 근사를 적용하면 아래 식과 같다.
\begin{equation} \label{eq:imu6}
\begin{aligned}
\Delta \mathbf{v}_{ij} & = \sum_{k=i}^{j-1} \Delta \tilde{\mathbf{R}}_{ik}(\mathbf{I} - {\color{Mahogany} \delta \boldsymbol{\phi}_{ij} } )(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i) \Delta t -  {\color{Mahogany} \Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_{k}\Delta t } \\
& = \Delta \tilde{\mathbf{v}}_{ij} +{\color{Mahogany}  \sum_{k=i}^{j-1} \Big[ \Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ij}\Delta t  - \Delta \tilde{\mathbf{R}}_{ik}\boldsymbol{\eta}^{\smm{ad}}_{k} \Delta t \Big] } \\
& \doteq \Delta \tilde{\mathbf{v}}_{ij} - {\color{Mahogany} \delta \mathbf{v}_{ij} }
\end{aligned}
\end{equation}
- $\delta \tilde{\mathbf{v}}_{ij} \doteq \Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)\Delta t$ : preintegrated된 상대 속도
- $\delta \mathbf{v}_{ij}$ : preintegrated된 상대 속도의 노이즈

유사하게 (\ref{eq:imu5})와 (\ref{eq:imu6})을 (\ref{eq:imu4})의 $\Delta \mathbf{p}_{ij}$에 대입한 후 작은 회전량의 근사식을 적용하면 다음과 같다.
\begin{equation} \label{eq:imu7}
\begin{aligned}
\Delta \mathbf{p}_{ij} & = \sum_{k=i}^{j-1} \Big[ (\Delta \tilde{\mathbf{v}}_{ik} - {\color{Mahogany} \delta \mathbf{v}_{ik} } )\Delta t + \frac{1}{2} \Delta \tilde{\mathbf{R}}_{ik}(\mathbf{I} - {\color{Mahogany} \delta \boldsymbol{\phi}_{ik}^{\wedge} } )(\tilde{\mathbf{a}}_{k} -  \mathbf{b}^a_i)\Delta t^2 - {\color{Mahogany} \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t^2 } \Big] \\
& = \Delta \tilde{\mathbf{p}}_{ij} + {\color{Mahogany} \sum_{k=i}^{j-1} \Big[ -\delta \mathbf{v}_{ik}\Delta t+ \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)\Delta t^2  - \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t^2  \Big] }\\
& \doteq \Delta \tilde{\mathbf{p}}_{ij} - {\color{Mahogany} \delta \mathbf{p}_{ij} }
\end{aligned}
\end{equation}
- $\delta \tilde{\mathbf{p}}_{ij}$ : preintegrated된 상대 위치
- $\delta \mathbf{p}_{ij}$ : preintegrated된 상대 위치의 노이즈

지금까지 유도한 (\ref{eq:imu5}), (\ref{eq:imu6}), (\ref{eq:imu7})을 원래 식 (\ref{eq:imu4})에 대입하면 다음과 같은 preintegrated 측정 모델이 나온다.
\begin{equation} \label{eq:imu8} \boxed{
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij} & = \mathbf{R}^{\intercal}_{i} \mathbf{R}_{j} \text{Exp}( {\color{Mahogany} \delta \boldsymbol{\phi}_{ij} } ) \\
\Delta \tilde{\mathbf{v}}_{ij} & = \mathbf{R}^{\intercal}_i (\mathbf{v}_j - \mathbf{v}_i - \mathbf{g}\Delta t_{ij} ) + {\color{Mahogany} \delta \mathbf{v}_{ij} } \\
\Delta \tilde{\mathbf{p}}_{ij} & = \mathbf{R}^{\intercal}_i \Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) + {\color{Mahogany} \delta \mathbf{p}_{ij} }\\
\end{aligned} }
\end{equation}
- $\text{Exp}(-\delta \boldsymbol{\phi}_{ij})^{\intercal} = \text{Exp}(\delta \boldsymbol{\phi}_{ij})$가 적용되었다
- $[\delta \boldsymbol{\phi}_{ij}^{\intercal}, \delta \mathbf{v}_{ij}^{\intercal}, \delta \mathbf{p}_{ij}^{\intercal}]^{\intercal}$ : 랜덤 노이즈 벡터

이전 식 (\ref{eq:imu4})은 상태와 노이즈항이 복잡하게 섞여 있었던 반면에 (\ref{eq:imu8})은 상태와 랜덤 노이즈항이 서로 깔끔하게 분리된 것을 볼 수 있다.

랜덤 노이즈가 평균이 0인 가우시안 분포를 따른다고 가정하면 (측정=상태+가우시안 노이즈) 형태로 분리된 꼴이므로 MAP 추정에서 결론적으로 풀고자하는 negative log-likelihood의 수식이 2차식 $\mathbf{r}^{\intercal}\boldsymbol{\Sigma}^{-1}\mathbf{r}$ 형태로 깔끔하게 계산되기 때문에 이를 활용한 최적화 구현이 비교적 단순해진다. 그리고 회전, 속도, 위치에 대한 노이즈를 하나의 9차원 벡터와 공분산으로 다룰 수 있어 코드, 이론, 디버깅 또한 매우 통일성 있게 정돈된다.

Noise propagation

이번 섹션에서는 앞서 구한 랜덤 노이즈 벡터 $[\delta \boldsymbol{\phi}_{ij}^{\intercal}, \delta \mathbf{v}_{ij}^{\intercal}, \delta \mathbf{p}_{ij}^{\intercal}]^{\intercal}$의 특성에 대해 살펴본다. 앞서 이 노이즈 벡터를 평균이 0인 가우시안 노이즈로 가정하면 다루기 편리하다고 하였지만 공분산을 정확히 모델링하는 것은 매우 중요하다. 공분산의 역행렬은 MAP 최적화에서 각 항의 가중치로 직접 들어가기 때문이다. 그래서 해당 섹션에서는 preintegrated된 측정값의 공분산 $\boldsymbol{\Sigma}_{ij}$을 유도하는 과정에 대해 자세히 설명한다.
\begin{equation}
\begin{aligned}
\boldsymbol{\eta}^{\Delta}_{ij} \doteq [\delta \boldsymbol{\phi}_{ij}^{\intercal}, \delta \mathbf{v}_{ij}^{\intercal}, \delta \mathbf{p}_{ij}^{\intercal}]^{\intercal} \sim \mathcal{N}(\mathbf{0}_{9\times 1}, \boldsymbol{\Sigma}_{ij})
\end{aligned}
\end{equation}

먼저 $\delta \boldsymbol{\phi}_{ij}$를 고려해보자. (\ref{eq:imu5})를 보면 다음과 같이 정의되어 있다.
\begin{equation}
\begin{aligned}
\text{Exp}(- \delta \boldsymbol{\phi}_{ij}) \doteq \prod_{k=i}^{j-1} \text{Exp}\Big( -\Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k \Delta t \Big)
\end{aligned}
\end{equation}

양변에 logarithm mapping $\text{Log}(\cdot)$을 취하면 다음과 같다.
\begin{equation}
\begin{aligned}
\delta \boldsymbol{\phi}_{ij} = -\text{Log}\Big( \prod_{k=i}^{j-1} \text{Exp}\Big( -\Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k \Delta t \Big)  \Big)
\end{aligned}
\end{equation}

우측항에 logarithm mapping의 1차 근사를 적용하면 다음과 같다. 이 때, $\boldsymbol{\eta}^{\smm{gd}}_k$와 $\delta \boldsymbol{\phi}_{ij}$는 충분히 작은 값이기 때문에 오른쪽 자코비안(right jacobian) $\mathbf{J}_r$은 $\mathbf{I}$에 수렴한다.
\begin{equation} \label{eq:imu9}
\begin{aligned}
\delta \boldsymbol{\phi}_{ij} \simeq \sum_{k=i}^{j-1} \Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k \Delta t
\end{aligned}
\end{equation}
- $\text{Log}\Big( \text{Exp}(\boldsymbol{\phi}) \text{Exp}(\delta \boldsymbol{\phi}) \Big) \approx \boldsymbol{\phi} + \mathbf{J}_{r}^{-1}(\boldsymbol{\phi})\delta \boldsymbol{\phi}$ 근사를 적용하였다

1차 근사항까지만 고려하면 상대 회전량에 대한 노이즈 $\delta \boldsymbol{\phi}_{ij}$는 평균이 0인 가우시안 노이즈 $\boldsymbol{\eta}^{\smm{gd}}_{k}$의 선형 결합(linear combination)이므로 역시 평균이 0인 가우시안 분포를 지닌다. 이러한 성질이 좋은 이유는 회전에 대한 측정값 (\ref{eq:imu8})이 정확히 (상태+노이즈) 꼴이 되기 때문이다. ($\tilde{\mathbf{R}} = \mathbf{R}\text{Exp}(\epsilon)$)

상대 회전량에 대한 노이즈를 위와 같이 정리하면 속도, 위치에 대한 노이즈 $\delta \mathbf{v}_{ij}, \delta \mathbf{p}_{ij}$는 이해하기 수월해진다. $\delta \mathbf{v}_{ij}, \delta \mathbf{p}_{ij}$ 식을 보면 $\boldsymbol{\eta}^{\smm{ad}}_{k}$와 $\delta \boldsymbol{\phi}_{ij}$의 선형 결합으로 구성되어 있기 때문에 역시 평균이 0인 가우시안 분포가 된다.
\begin{equation} \label{eq:imu10}
\begin{aligned}
\delta \mathbf{v}_{ij} & \simeq \sum_{k=i}^{j-1} \Big[ -\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ik} \Delta t + \Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t  \Big] \\
\delta \mathbf{p}_{ij} & \simeq \sum_{k=i}^{j-1} \Big[ \delta \mathbf{v}_{ik}\Delta t - \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik} (\tilde{\mathbf{a}}_{k} - \mathbf{b}^a_i)^{\wedge}\delta \boldsymbol{\phi}_{ik} \Delta t^2 + \frac{1}{2} \Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t^2 \Big]
\end{aligned}
\end{equation}
- 이러한 근사는 고차항을 제외한 1차 근사까지만 유효하다

(\ref{eq:imu9}), (\ref{eq:imu10}) 식을 보면 preintegration 노이즈 $\boldsymbol{\eta}^{\Delta}_{ij}$는 IMU 측정 노이즈 $\boldsymbol{\eta}^{\smm{d}}_{k} \doteq  [\boldsymbol{\eta}^{\smm{ad}}_k, \boldsymbol{\eta}^{\smm{gd}}_k], \  k = 1, \cdots, j-1$의 선형 함수(linear function)으로 이루어져 있다고 볼 수 있다. 이는 IMU 데이터시트로부터 얻은 $\boldsymbol{\eta}^{\smm{d}}_k$의 공분산 값을 사용하여 선형 전파(linear propagation)을 통해 $\boldsymbol{\eta}^{\Delta}_{ij}$를 구할 수 있다는 것을 의미한다. 이러한 preintegrated 공분산을 $\boldsymbol{\Sigma}_{ij}$라고 부른다. Appendix IX-A를 보면 $\boldsymbol{\Sigma}_{ij}$를 계산하는 방법에 대해 자세히 설명한다. 이런 방법을 통해 새로운 IMU 측정값이 들어올 때마다 $\boldsymbol{\Sigma}_{ij}$를 매 번 새로 계산할 필요없이 이전 상태로부터 반복적(iterative)으로 상태를 업데이트할 수 있다.

Incorporating bias updates

이전 섹션에서 preintegrationd을 수행하는 동안의 bias $\{ \bar{\mathbf{b}}^a_i, \bar{\mathbf{b}}^g_i \}$는 값을 이미 알고 있으며 변하지 않는다고 설명하였다. 하지만 대부분의 경우 최적화를 하는 동안 bias 추정값은 작게 나마 $\delta \mathbf{b}$만큼 변한다. 한가지 방법은 bias가 바뀔 때마다 preintegration 결과를 처음부터 다시 적분하는 것이다. 그러나 이는 계산 비용이 크므로 비효율적이다. 대신, bias를 $\mathbf{b} \leftarrow \bar{\mathbf{b}} + \delta \mathbf{b}$로 업데이트한다고 하면 다음과 같이 1차 선형 전개로 preintegration 측정값을 빠르게 갱신할 수 있다.
\begin{equation} \label{eq:imu11}
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij}(\mathbf{b}^g_i) & \simeq \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}^g_i) {\color{Mahogany} \text{Exp} \Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g \Big) } \\
\Delta \tilde{\mathbf{v}}_{ij}(\mathbf{b}^g_i, \mathbf{b}^a_i) & \simeq \Delta \tilde{\mathbf{v}}_{ij}(\bar{\mathbf{b}}^g_i, \bar{\mathbf{b}}^a_i) + {\color{Mahogany} \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a_i } \\
\Delta \tilde{\mathbf{p}}_{ij}(\mathbf{b}^g_i, \mathbf{b}^a_i) & \simeq \Delta \tilde{\mathbf{p}}_{ij}(\bar{\mathbf{b}}^g_i, \bar{\mathbf{b}}^a_i) + {\color{Mahogany} \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a_i } \\
\end{aligned}
\end{equation}

위 갱신 과정은 SO(3)에서 바로 동작한다(회전식에 $\text{Exp}(\cdot)$가 있는 이유). 자코비안 행렬 $\{ \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}, \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g}, \cdots \}$은 preintegration 시점의 bias $\bar{\mathbf{b}}$에서 계산한 값이며 bias 값이 변함에 따라 측정값이 얼마나 변하는지를 설명한다. 이 자코비안 행렬들은 상수로 간주되며 preintegration 중 미리 계산해둘 수 있다.이 자코비안들의 유도는 [해당] 섹션의 (큰 값+작은 섭동) 전개와 거의 동일하며 Appendix IX-B에 자세히 설명되어 있다.

Preintegrated IMU factors

(\ref{eq:imu8})의 preintegration 측정 모델과 1차 근사에서 측정 노이즈가 평균이 0이고 공분산이 $\boldsymbol{\Sigma}_{ij}$인 가우시안 분포를 따른다는 점을 사용하면 residual $\mathbf{r}_{\mathcal{I}_{ij}} \doteq  [\mathbf{r}^{\intercal}_{\Delta \mathbf{R}_{ij}}, \mathbf{r}^{\intercal}_{\Delta \mathbf{v}_{ij}}, \mathbf{r}^{\intercal}_{\Delta \mathbf{p}_{ij}}]^{\intercal} \in \mathbb{R}^{9}$를 다음과 같이 쉽게 나타낼 수 있다.
\begin{equation} \label{eq:imu12}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{R}_{ij}} & \doteq \text{Log}\bigg( \Big( \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}^g_i) \text{Exp}\Big(\frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g \Big) \Big)^{\intercal} \mathbf{R}^{\intercal}_i \mathbf{R}_{j} \bigg) \\
\mathbf{r}_{\Delta \mathbf{v}_{ij}} & \doteq \mathbf{R}^{\intercal}_i (\mathbf{v}_j - \mathbf{v}_i - \mathbf{g}\Delta t_{ij}) - \Big[ \Delta \tilde{\mathbf{v}}_{ij}(\bar{\mathbf{b}}^g_i, \bar{\mathbf{b}}^a_i) + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a \Big]  \\
\mathbf{r}_{\Delta \mathbf{p}_{ij}} & \doteq \mathbf{R}^{\intercal}_i (\mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij}) - \Big[ \Delta \tilde{\mathbf{p}}_{ij}(\bar{\mathbf{b}}^g_i, \bar{\mathbf{b}}^a_i) + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a \Big]
\end{aligned}
\end{equation}
- 위 식에는 (\ref{eq:imu11})에서 설명한 bias 갱신도 포함되어 있다

[해당] 섹션에서 설명한 "lift-solve-retract" 방법론에 따르면 매 가우스-뉴턴 반복마다 (\ref{eq:imu12})의 파라미터를 변경(re-parameterized)해야 한다. 여기서 re-parameterization이란 기존의 비선형 절대 변수 대신 선형의 국소 증분량으로 문제를 다시 쓰는 것을 말한다. 예를 들어, 회전 $\mathbf{R} \in SO(3)$은 비선형 공간에 존재하므로 $\mathbf{R} \rightarrow \boldsymbol{\theta}$와 같이 선형 공간의 변수로 바꾸는 작업을 말한다 ($\mathbf{R} \approx \mathbf{R}_k \text{Exp}(\delta \boldsymbol{\theta})$). 나머지 변수도 마찬가지로 국소 증분량으로 변경한다 ($\mathbf{v} \approx \mathbf{v}_k + \delta \mathbf{v}, \ \mathbf{p} \approx \mathbf{p}_k + \delta \mathbf{p}, \  \mathbf{b} \approx \mathbf{b}_k + \delta \mathbf{b}$).

그 다음 "solve" 단계에서는 현재 추정값 주변에서 이 비용 함수를 선형화(linearize)해야 한다. 선형화를 수월하게 하려면 위 residual들에 대한 자코비안의 해석적 표현을 미리 구해두는 것이 편리하며, 이는 Appendix IX-C에서 유도하였다.

Bias model

IMU 모델 식 (\ref{eq:imu0})를 소개할 때 bias는 시간에 따라 천천히 변하는 값이라고 설명하였다. 따라서 우리는 bias를 브라운 운동(brownian motion)으로 모델링할 수 있다.
\begin{equation} \label{eq:imu13}
\begin{aligned}
\dot{\mathbf{b}}^g(t) & = \boldsymbol{\eta}^{\smm{bg}}, \\
\dot{\mathbf{b}}^a(t) & = \boldsymbol{\eta}^{\smm{ba}}
\end{aligned}
\end{equation}

연속된 두 키프레임 $i$와 $j$ 사이의 구간 $[t_i, t_j]$에서 (\ref{eq:imu13})을 적분하면 다음과 같다.
\begin{equation} \label{eq:imu14}
\begin{aligned}
\mathbf{b}^g_j & = \mathbf{b}^g_i + \boldsymbol{\eta}^{\smm{bgd}} \\
\mathbf{b}^a_j & = \mathbf{b}^a_i + \boldsymbol{\eta}^{\smm{bad}} \\
\end{aligned}
\end{equation}
- $\mathbf{b}^g_i \doteq \mathbf{b}^g(t_i), \ \mathbf{b}^a_i \doteq \mathbf{b}^a(t_i)$로 단순화

$\boldsymbol{\eta}^{\smm{bgd}}, \boldsymbol{\eta}^{\smm{bad}}$는 bias 노이즈의 이산화(discrete) 버전으로써 평균이 0이고 공분산이 각각 $\boldsymbol{\Sigma}^{\smm{bgd}} \doteq \Delta t_{ij} \text{Cov}(\boldsymbol{\eta}^{\smm{bg}}), \ \boldsymbol{\Sigma}^{\smm{bad}} \doteq \Delta t_{ij} \text{Cov}(\boldsymbol{\eta}^{\smm{ba}})$이다.
\begin{equation}
\begin{aligned}
\boldsymbol{\eta}^{\smm{bgd}}& \sim \mathcal{N}(0, \boldsymbol{\Sigma}^{\smm{bgd}}) \\
\boldsymbol{\eta}^{\smm{bad}} &\sim \mathcal{N}(0, \boldsymbol{\Sigma}^{\smm{bad}}) \\
\end{aligned}
\end{equation}

모델 (\ref{eq:imu14})은 팩터 그래프(factor graph)에 쉽게 포함될 수 있다. 모든 연속 키프레임 쌍에 대해 논문 식(26)에 추가되는 가산항으로 넣으면 된다.
\begin{equation}
\begin{aligned}
\| \mathbf{r}_{\mathbf{b}_{ij}} \|^2 \doteq \| \mathbf{b}^g_j - \mathbf{b}^g_i \|^2_{\boldsymbol{\Sigma}^{\smm{bgd}}} + \|\mathbf{b}^a_j - \mathbf{b}^a_i \|^2_{\boldsymbol{\Sigma}^{\smm{bad}}}
\end{aligned}
\end{equation}

Structureless vision factor

Appendix

Iterative noise propagation

이번 섹션에서는 앞서 [해당] 섹션에서 논의되었던 preintegrated 노이즈의 공분산을 계산하는 과정에 대해 설명한다. 식을 유도해보면 결국 노이즈의 공분산은 반복식 형태(iterative form)로 구할 수 있고 식 자체가 직관적이고 간결하므로 수식 해석이 용이하며 실시간 구현에 훨씬 유리하다.

상대 회전량에 대한 노이즈 (\ref{eq:imu9})부터 살펴보자. $\delta \boldsymbol{\phi}_{ij}$를 반복식 형태로 만들기 위해 마지막 샘플 $k=j-1$ 항을 떼어내보자.
\begin{equation}
\begin{aligned}
\delta \boldsymbol{\phi}_{ij} & \simeq \sum_{k=i}^{j-1} \Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k\Delta t \\
& = \sum_{k=i}^{j-2} \Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k\Delta t  + \overbrace{\Delta \tilde{\mathbf{R}}^{\intercal}_{jj}}^{\mathbf{I}_{3\times3}} \mathbf{J}^{j-1}_r \boldsymbol{\eta}^{\smm{gd}}_{j-1}\Delta t \\
& = \sum_{k=i}^{j-2} \overbrace{(\Delta \tilde{\mathbf{R}}_{k+1j-1} \Delta \tilde{\mathbf{R}}_{j-1j})^{\intercal}}^{=\Delta \tilde{\mathbf{R}}_{k+1j}} \mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k \Delta t + \mathbf{J}^{j-1}_r \boldsymbol{\eta}^{\smm{gd}}_{j-1} \Delta t \\
& = \Delta \tilde{\mathbf{R}}^{\intercal}_{j-1j} {\color{Mahogany} \sum_{k=i}^{j-2} \Delta \tilde{\mathbf{R}}^{\intercal}_{k+1j-1}\mathbf{J}^k_r \boldsymbol{\eta}^{\smm{gd}}_k\Delta t  }+ \mathbf{J}^{j-1}_r \boldsymbol{\eta}^{\smm{gd}}_{j-1}\Delta t \\
& = \Delta \tilde{\mathbf{R}}^{\intercal}_{j-1j} {\color{Mahogany}  \delta \boldsymbol{\phi}_{ij-1} } + \mathbf{J}^{j-1}_r\boldsymbol{\eta}^{\smm{gd}}_{j-1} \Delta t
\end{aligned}
\end{equation}

동일한 과정을 (\ref{eq:imu10})에 대해서도 수행해보자
\begin{equation}
\begin{aligned}
\delta \mathbf{v}_{ij} & = \sum_{k=i}^{j-1} \Big[ -\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ik} \Delta t + \Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t \Big] \\
& = {\color{Mahogany} \sum_{k=i}^{j-2} \Big[ -\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ik} \Delta t + \Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t \Big] }  \\
& \qquad \qquad - \Delta \tilde{\mathbf{R}}_{ij-1}(\tilde{\mathbf{a}}_{j-1}-\mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ij-1}\Delta t + \Delta \tilde{\mathbf{R}}_{ij-1}\boldsymbol{\eta}^{\smm{ad}}_{j-1}\Delta t \\
& = {\color{Mahogany} \delta \mathbf{v}_{ij-1} } - \Delta \tilde{\mathbf{R}}_{ij-1}(\tilde{\mathbf{a}}_{j-1}-\mathbf{b}^a_i)^{\wedge} \delta \boldsymbol{\phi}_{ij-1}\Delta t + \Delta \tilde{\mathbf{R}}_{ij-1}\boldsymbol{\eta}^{\smm{ad}}_{j-1}\Delta t
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\delta \mathbf{p}_{ij} & = \sum_{k=i}^{j-1} \Big[ \delta \mathbf{v}_{ik}\Delta t - \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge}\boldsymbol{\phi}_{ik}\Delta t^2 + \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t^2 \Big] \\
& = {\color{Mahogany} \sum_{k=i}^{j-2} \Big[ \delta \mathbf{v}_{ik}\Delta t - \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \mathbf{b}^a_i)^{\wedge}\boldsymbol{\phi}_{ik}\Delta t^2 + \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ik} \boldsymbol{\eta}^{\smm{ad}}_k \Delta t^2 \Big] } \\
& \qquad + \delta \mathbf{v}_{ij-1}\Delta t -\frac{1}{2}\Delta \tilde{\mathbf{R}}_{ij-1}(\tilde{\mathbf{a}}_{j-1}-\mathbf{b}^a_i)^{\wedge} \boldsymbol{\phi}_{ij-1}\Delta t^2 + \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ij-1} \boldsymbol{\eta}^{\smm{ad}}_{j-1} \Delta t^2 \\
& = {\color{Mahogany} \delta \mathbf{p}_{ij-1} } + \delta \mathbf{v}_{ij-1}\Delta t -\frac{1}{2}\Delta \tilde{\mathbf{R}}_{ij-1}(\tilde{\mathbf{a}}_{j-1}-\mathbf{b}^a_i)^{\wedge} \boldsymbol{\phi}_{ij-1}\Delta t^2 + \frac{1}{2}\Delta \tilde{\mathbf{R}}_{ij-1} \boldsymbol{\eta}^{\smm{ad}}_{j-1} \Delta t^2
\end{aligned}
\end{equation}

Preintegrated 노이즈와 IMU 측정 노이즈는 각각 $\boldsymbol{\eta}^{\Delta}_{ik} \doteq [\delta \boldsymbol{\phi}_{ik}, \delta \mathbf{v}_{ik}, \delta \mathbf{p}_{ik}]$, 그리고 $\boldsymbol{\eta}^{\smm d}_{k} \doteq  [\boldsymbol{\eta}^{\smm{ad}}_k, \boldsymbol{\eta}^{\smm{gd}}_k]$이다. 표기의 편의를 위해 transpose를 생략하였으나 모두 열벡터이다. 이를 사용하여 위 식을 다시 작성하면 다음과 같은 컴팩트한 형태가 된다
\begin{equation} \label{eq:app1}
\begin{aligned}
\boldsymbol{\eta}^{\Delta}_{ij} = \mathbf{A}_{j-1}\boldsymbol{\eta}^{\Delta}_{ij-1} + \mathbf{B}_{j-1}\boldsymbol{\eta}^{\smm{d}}_{j-1}
\end{aligned}
\end{equation}

선형 모델 (\ref{eq:app1})과 IMU 측정 노이즈 $\boldsymbol{\eta}^{\smm{d}}_k$의 공분산 $\boldsymbol{\Sigma}_{\boldsymbol{\eta}} \in \mathbb{R}^{6\times 6}$를 사용하여 preintegrated 측정값의 공분산을 반복적(iterative)으로 쓸 수 있다.
\begin{equation}
\begin{aligned}
\boldsymbol{\Sigma}_{ij} = \mathbf{A}_{j-1}\boldsymbol{\Sigma}_{ij-1}\mathbf{A}^{\intercal}_{j-1} + \mathbf{B}_{j-1}\boldsymbol{\Sigma}_{\boldsymbol{\eta}}\mathbf{B}^{\intercal}_{j-1}
\end{aligned}
\end{equation}
- 초기값: $\boldsymbol{\Sigma}_{ij} = \mathbf{0}_{9\times 9}$

Bias correction via first-order updates

이번 섹션에서는 [해당] 섹션에서 설명한 1차 근사 bias 보정식의 유도 과정에 대해 설명한다. 우선, 시간 $i$에서 bias 추정값 $\bar{\mathbf{b}}_i \doteq [\bar{\mathbf{b}}^g_i, \bar{\mathbf{b}}^a_i]$가 주어졌다고 하자. 이 때 계산해둔 preintegration 값들은 다음과 같이 나타낸다.
\begin{equation}
\begin{aligned}
& \Delta \bar{\mathbf{R}}_{ij} \doteq \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}_i) \\
& \Delta \bar{\mathbf{v}}_{ij} \doteq \Delta \tilde{\mathbf{v}}_{ij}(\bar{\mathbf{b}}_i) \\
& \Delta \bar{\mathbf{p}}_{ij} \doteq \Delta \tilde{\mathbf{p}}_{ij}(\bar{\mathbf{b}}_i) \\
\end{aligned}
\end{equation}

이번 섹션의 목표는 bias 추정값이 바뀌었을 때 이 세 값을 다시 적분하지 않고 업데이트하는 공식을 만드는 것이다. 새 bias 값이 $\hat{\mathbf{b}}_i \leftarrow \bar{\mathbf{b}}_i + \delta \mathbf{b}_i$와 같이 주어졌다고 하자. 여기서 $\delta \mathbf{b}_i$는 이전 값 $\bar{\mathbf{b}}_i$에 비해 작은 업데이트 값이다.

회전에 대해 bias 보정을 먼저 진행해보자. 핵심 아이디어는 $\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i)$를 "이전 bias에서 preintegration 결과 $\Delta \bar{\mathbf{R}}_{ij}$ + 1차 보정" 꼴로 쓰는 것이다. (\ref{eq:imu5}) 식을 활용해 $\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i)$를 전개하면 다음과 같다
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i) = \prod_{k=i}^{j-1} \text{Exp}\Big( \Big( \tilde{\boldsymbol{\omega}}_k - \hat{\mathbf{b}}^g_i\Big) \Delta t \Big)
\end{aligned}
\end{equation}

여기에 $\hat{\mathbf{b}}_i = \bar{\mathbf{b}}_i + \delta \mathbf{b}_i$를 넣고 각 항에 1차 근사 (\ref{eq:pre9})를 적용하면 아래와 같은 식이 나온다
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i) & = \prod_{k=i}^{j-1} \text{Exp}((\tilde{\boldsymbol{\omega}}_k - (\bar{\mathbf{b}}^g_i + \delta \mathbf{b}^g_i))\Delta t ) \\
& \simeq \prod_{k=i}^{j-1} \text{Exp}((\tilde{\boldsymbol{\omega}}_k - \bar{\mathbf{b}}^g_i)\Delta t) \text{Exp}\Big( -\mathbf{J}^k_r \delta \mathbf{b}^g_i \Delta t \Big)
\end{aligned}
\end{equation}

그 다음으로 관계식 (\ref{eq:pre10})을 사용하여 $\delta \mathbf{b}^{\smm{g}}_i$가 들어간 항들을 끝으로 이동시키면 다음과 같다
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i) & = \Delta \bar{\mathbf{R}}_{ij} \prod_{k=i}^{j-1} \text{Exp}\Big( -\Delta\tilde{\mathbf{R}}_{k+1j}(\bar{\mathbf{b}}_i)^{\intercal} \mathbf{J}^k_r \delta \mathbf{b}^g_i \Delta t \Big)
\end{aligned}
\end{equation}
- $\Delta \bar{\mathbf{R}}_{ij} = \prod_{k=i}^{j-1}\text{Exp}((\tilde{\boldsymbol{\omega}}_k - \bar{\mathbf{b}}^g_i)\Delta t)$

위 식에 1차 근사식 (\ref{eq:pre8})을 반복적으로 적용하면 다음과 같은 결과를 얻는다
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i) & \simeq \Delta \bar{\mathbf{R}}_{ij} {\color{Mahogany} \text{Exp}\bigg( \sum_{k=i}^{j-1} - \Delta \tilde{\mathbf{R}}_{k+1j}(\bar{\mathbf{b}}_i)^{\intercal}\mathbf{J}^k_r \delta \mathbf{b}^g_i \Delta t \bigg) } \\
& = \Delta \bar{\mathbf{R}}_{ij} {\color{Mahogany} \text{Exp}\Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i \Big) }
\end{aligned}
\end{equation}

위 식을 보면 회전 preintegration $\Delta \tilde{\mathbf{R}}_{ij}(\hat{\mathbf{b}}_i)$은 "이전 값 $\Delta \tilde{\mathbf{R}}_{ij}$ x 작은 회전 보정" 형태로 갱신할 수 있으며 다시 적분할 필요가 없다는 것을 알 수 있다.

이제 속도항에 대해 같은 작업을 해보자.
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{v}}(\hat{\mathbf{b}}_i) & = \sum_{k=i}^{j-1} \Delta \tilde{\mathbf{R}}_{ik}(\hat{\mathbf{b}}_i)(\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i - \delta \mathbf{b}^a_i)\Delta t \\
& = \sum_{k=i}^{j-1}\Delta \bar{\mathbf{R}}_{ik} \text{Exp}\Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ik}}{\partial \mathbf{b}^g}\delta \mathbf{b}^g_i \Big)(\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i - \delta \mathbf{b}^a_i)\Delta t \\
& = \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}} \bigg( \mathbf{I} + \Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ik}}{\partial \mathbf{b}^g}\delta \mathbf{b}^g_i  \Big)^{\wedge} \bigg) (\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i - \delta \mathbf{b}^a_i)\Delta t \\
& = \Delta \bar{\mathbf{v}}_{ij} {\color{Mahogany} - \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik}\Delta t \delta \mathbf{b}^a_i + \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik} \Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ik}}{\partial \mathbf{b}^g}\delta \mathbf{b}^g_i \Big)^{\wedge}(\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i)\Delta t } \\
& = \Delta \bar{\mathbf{v}}_{ij} {\color{Mahogany} - \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik}\Delta t \delta \mathbf{b}^a_i - \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik} (\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i)^{\wedge}  \frac{\partial \Delta \bar{\mathbf{R}}_{ik}}{\partial \mathbf{b}^g} \Delta t \delta \mathbf{b}^g_i }  \\
& = \Delta \bar{\mathbf{v}}_{ij} {\color{Mahogany} + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a_i + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i }
\end{aligned}
\end{equation}
- $\Delta \bar{\mathbf{v}}_{ij} = \sum_{k=i}^{j-1}\Delta \bar{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i)\Delta t$

결과를 보면 속도에 대한 선형 보정식으로 정리된다. 위치항에 대해서도 동일한 방식으로 유도하면 다음과 같다.
\begin{equation}
\begin{aligned}
\Delta \tilde{\mathbf{p}}(\hat{\mathbf{b}}_i) & = \Delta \bar{\mathbf{p}}_{ij}  {\color{Mahogany} + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a} \delta \mathbf{b}^a_i + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i }
\end{aligned}
\end{equation}

정리하자면 (\ref{eq:imu11})에 쓰이는 자코비안들은 다음과 같다
\begin{equation} \boxed{
\begin{aligned}
\frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \quad & = \quad - \sum_{k=i}^{j-1} [ \Delta \tilde{\mathbf{R}}_{k+1j}(\bar{\mathbf{b}}_i)^{\intercal}\mathbf{J}^k_r\Delta t] \\
\frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a} \quad & = \quad - \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik}\Delta t \\
\frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g} \quad & = \quad - \sum_{k=i}^{j-1} \Delta \bar{\mathbf{R}}_{ik} (\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i)^{\wedge} \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \Delta t  \\
\frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a} \quad & = \quad \sum_{k=i}^{j-1} \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a} \Delta t - \frac{1}{2} \Delta \bar{\mathbf{R}}_{ik}\Delta t^2 \\
\frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g} \quad & = \quad \sum_{k=i}^{j-1} \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g}\Delta t -\frac{1}{2}\Delta \bar{\mathbf{R}}_{ik}(\tilde{\mathbf{a}}_k - \bar{\mathbf{b}}^a_i)^{\wedge} \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \Delta t^2 \\
\end{aligned} }
\end{equation}

이 자코비안들은 새 IMU 측정값이 들어올 때마다 누적으로 계산해둘 수 있어서 최적화 중 bias가 바뀌면 1차 보정만으로도 빠르게 $\Delta \tilde{\mathbf{R}}_{ij}, \Delta \tilde{\mathbf{v}}_{ij}, \Delta \tilde{\mathbf{p}}_{ij}$를 업데이트할 수 있다. 단 bias 가 너무 크면 1차 근사 정확도가 떨어질 수 있으므로 해당 구간을 다시 적분하는 것이 안전하다.

Jacobians of residual errors

이번 섹션에서는 (\ref{eq:imu12}) 식에 나오는 residual들의 자코비안 행렬들을 해석적으로 유도한다. 이 자코비안들은 GN 같은 반복 최적화를 할 때 필수적으로 사용된다(비용 함수 (\ref{eq:pre11})을 최적화할 때 사용함).

최적화는 [해당] 섹션에서 설명한 리프팅(lifting)을 써서 residual을 증분 함수로 만든 뒤 미분한다. 즉, 다음과 같이 리트랙션을 대입한다.
\begin{equation} \boxed{
\begin{aligned}
&\mathbf{R}_i \quad \leftarrow \quad \mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i), \qquad && \qquad \mathbf{R}_j \quad \leftarrow \quad \mathbf{R}_j\text{Exp}(\delta \boldsymbol{\phi}_j) \\
&\mathbf{p}_i \quad \leftarrow \quad \mathbf{p}_i + \mathbf{R}_i\delta \mathbf{p}_i, \qquad && \qquad \mathbf{p}_j \quad \leftarrow \quad \mathbf{p}_j + \mathbf{R}_j\delta \mathbf{p}_j \\
&\mathbf{v}_i \quad \leftarrow \quad \mathbf{v}_i + \delta \mathbf{v}_i, \qquad && \qquad \mathbf{v}_j \quad \leftarrow \quad \mathbf{v}_j + \delta \mathbf{v}_j \\
& \delta \mathbf{b}^g_i \quad \leftarrow \quad \delta \mathbf{b}^g_i + \delta \tilde{\mathbf{b}}^g_i, \qquad && \qquad \delta \mathbf{b}^a_i \quad \leftarrow \quad \delta \mathbf{b}^a_i + \delta \tilde{\mathbf{b}}^a_i \\
\end{aligned} }
\end{equation}

이렇게 하면 residual이 벡터 공간의 함수가 되므로 자코비안을 쉽게 계산할 수 있다. 이제부터는 residual을 $[ \delta \boldsymbol{\phi}_i, \delta \mathbf{p}_i, \delta \mathbf{v}_i, \delta \boldsymbol{\phi}_j, \delta \mathbf{p}_j, \delta \mathbf{v}_j, \delta \tilde{\mathbf{b}}^g_i, \delta \tilde{\mathbf{b}}^a_i ]$에 대해 미분한다.

Jacobians of $\mathbf{r}_{\Delta \mathbf{p}_{ij}}$

$\mathbf{r}_{\Delta \mathbf{p}_{ij}}$은 $\delta \tilde{\mathbf{b}}^g_i$와  $\delta \tilde{\mathbf{b}}^a_i$에 선형이므로 이들에 대한 자코비안은 (\ref{eq:imu11})에서 쓴 bias 보정항이 그대로 된다. $\delta \boldsymbol{\phi}_j, \mathbf{v}_j$는 residual에 등장하지 않으므로 모두 0이다. 다른 자코비안들에 대해 살펴보자
\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{p}_{ij}} (\mathbf{p}_i + \mathbf{R}_i\delta \mathbf{p}_i) & = \mathbf{R}^{\intercal}_i \Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{R}_i\delta \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) - C \\
& = \mathbf{r}_{\Delta \mathbf{p}_{ij}}(\mathbf{p}_i) + {\color{Mahogany} (-\mathbf{I}_{3\times 1})\delta \mathbf{p}_i }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{p}_{ij}} (\mathbf{p}_j + \mathbf{R}_j\delta \mathbf{p}_j) & = \mathbf{R}^{\intercal}_i \Big( \mathbf{p}_j + \mathbf{R}_j\delta \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) - C \\
& = \mathbf{r}_{\Delta \mathbf{p}_{ij}}(\mathbf{p}_j) + {\color{Mahogany} (\mathbf{R}_i^{\intercal}\mathbf{R}_j)\delta \mathbf{p}_j }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{p}_{ij}} (\mathbf{v}_i + \delta \mathbf{v}_i) & = \mathbf{R}^{\intercal}_i \Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \delta \mathbf{v}_i\Delta t_{ij} -\frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) - C \\
& = \mathbf{r}_{\Delta \mathbf{p}_{ij}}(\mathbf{v}_i) + {\color{Mahogany} (-\mathbf{R}^{\intercal}_i\Delta t_{ij})\delta \mathbf{v}_i }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{p}_{ij}} (\mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i)) & = (\mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i))^{\intercal}\Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) -C \\
& = (\mathbf{I} - \delta \boldsymbol{\phi}^{\wedge}_i)\mathbf{R}_i^{\intercal} \Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) -C \\
& = \mathbf{r}_{\Delta \mathbf{p}_{ij}}(\mathbf{R}_i) + {\color{Mahogany} \Big( \mathbf{R}^{\intercal}_i \Big( \mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij} \Big) \Big)^{\wedge} \delta \boldsymbol{\phi}_i }
\end{aligned}
\end{equation}
- $C \doteq \Delta \tilde{\mathbf{p}}_{ij} + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g_i}\delta \mathbf{b}^g_i + \frac{\partial \Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a_i}\delta \mathbf{b}^a_i$ \\

지금까지 구한 자코비안들을 한 번에 정리하면 다음과 같다.
\begin{equation}  \boxed{
\begin{aligned}
& \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \boldsymbol{\phi}_i} = (\mathbf{R}_i^{\intercal}(\mathbf{p}_j - \mathbf{p}_i - \mathbf{v}_i\Delta t_{ij} - \frac{1}{2}\mathbf{g}\Delta t^2_{ij}))^{\wedge}  \qquad && \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \boldsymbol{\phi}_j} = 0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \mathbf{p}_i} = -\mathbf{I}_{3\times 1}  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \mathbf{p}_j} = \mathbf{R}^{\intercal}_i \mathbf{R}_j \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \mathbf{v}_i} = -\mathbf{R}^{\intercal}_i\Delta t_{ij}  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \mathbf{v}_j} = 0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^a_i} = -\frac{\partial\Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^a_i}  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{p}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^g_i} = -\frac{\partial\Delta \bar{\mathbf{p}}_{ij}}{\partial \mathbf{b}^g_i}  \\
\end{aligned}  }
\end{equation}

Jacobians of $\mathbf{r}_{\Delta \mathbf{v}_{ij}}$

$\mathbf{r}_{\Delta \mathbf{v}_{ij}}$도 $\delta \tilde{\mathbf{b}}^g_i$와  $\delta \tilde{\mathbf{b}}^a_i$에 선형이므로 이들에 대한 자코비안은 (\ref{eq:imu11})에서 쓴 bias 보정항이 그대로 된다. $\delta \boldsymbol{\phi}_j, \mathbf{p}_i, \mathbf{p}_j$는 residual에 등장하지 않으므로 모두 0이다. 다른 자코비안들에 대해 살펴보자
\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{v}_{ij}}(\mathbf{v}_i + \delta \mathbf{v}_i) & = \mathbf{R}^{\intercal}_i(\mathbf{v}_j - \mathbf{v}_i - \delta \mathbf{v}_i - \mathbf{g}\Delta t_{ij}) - D \\
& = \mathbf{r}_{\Delta \mathbf{v}}(\mathbf{v}_j)  {\color{Mahogany} - \mathbf{R}^{\intercal}_i\delta \mathbf{v}_i  }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{v}_{ij}}(\mathbf{v}_j + \delta \mathbf{v}_j) & = \mathbf{R}^{\intercal}_i(\mathbf{v}_j + \delta \mathbf{v}_j - \mathbf{v}_i - \mathbf{g}\Delta t_{ij}) - D \\
& = \mathbf{r}_{\Delta \mathbf{v}}(\mathbf{v}_j) +{\color{Mahogany}  \mathbf{R}^{\intercal}_i\delta \mathbf{v}_j  }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{v}_{ij}}(\mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i)) & = (\mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i))^{\intercal}(\mathbf{v}_j - \mathbf{v}_i -\mathbf{g}\Delta t_{ij}) - D  \\
& = (\mathbf{I} - \delta \boldsymbol{\phi}^{\wedge}_i)\mathbf{R}^{\intercal}_i(\mathbf{v}_j - \mathbf{v}_i - \mathbf{g}\Delta t_{ij}) - D \\
& = \mathbf{r}_{\Delta \mathbf{v}}(\mathbf{R}_i) + {\color{Mahogany} \Big( \mathbf{R}^{\intercal}_i(\mathbf{v}_j - \mathbf{v}_i -\mathbf{g}\Delta t_{ij}) \Big)^{\wedge} \delta \boldsymbol{\phi}_i }
\end{aligned}
\end{equation}
- $D \doteq  \Big[ \Delta \tilde{\mathbf{v}}_{ij} + \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g_i}\delta \mathbf{b}^g_i +  \frac{\partial \Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a_i}\delta \mathbf{b}^a_i \Big]$

지금까지 구한 자코비안들을 한 번에 정리하면 다음과 같다.
\begin{equation}  \boxed{
\begin{aligned}
& \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \boldsymbol{\phi}_i} = (\mathbf{R}^{\intercal}_i(\mathbf{v}_j - \mathbf{v}_i -\mathbf{g}\Delta t_{ij}))^{\wedge} \qquad && \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \boldsymbol{\phi}_j} = 0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \mathbf{p}_i} =  0 \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \mathbf{p}_j} = 0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \mathbf{v}_i} = -\mathbf{R}^{\intercal}_i  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \mathbf{v}_j} = \mathbf{R}^{\intercal}_i \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^a_i} =  -\frac{\partial\Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^a_i} \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{v}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^g_i} = -\frac{\partial\Delta \bar{\mathbf{v}}_{ij}}{\partial \mathbf{b}^g_i}  \\
\end{aligned} }
\end{equation}

Jacobians of $\mathbf{r}_{\Delta \mathbf{R}_{ij}}$

$\mathbf{p}_i, \mathbf{p}_j, \mathbf{v}_i, \mathbf{v}_j, \delta \mathbf{b}^a_i$는 residual에 등장하지 않으므로 모두 0이다. 나머지에 대한 편미분을 전개하면 다음과 같다
\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\mathbf{R}_i\text{Exp}(\delta \boldsymbol{\phi}_i)) & = \text{Log}\bigg(\Big( \Delta \tilde{\mathbf{R}}_{ij} (\bar{\mathbf{b}}^g_i)E  \Big)^{\intercal} (\mathbf{R}_i \text{Exp}(\delta \boldsymbol{\phi}_i))^{\intercal} \mathbf{R}_j \bigg) \\
& =  \text{Log}\bigg(\Big( \Delta \tilde{\mathbf{R}}_{ij} (\bar{\mathbf{b}}^g_i)E  \Big)^{\intercal}  \text{Exp}(-\delta \boldsymbol{\phi}_i)\mathbf{R}^{\intercal}_i\mathbf{R}_j \bigg) \\
& = \text{Log}\bigg(\Big( \Delta \tilde{\mathbf{R}}_{ij} (\bar{\mathbf{b}}^g_i)E  \Big)^{\intercal}  \mathbf{R}^{\intercal}_i\mathbf{R}_j \text{Exp}(-\mathbf{R}^{\intercal}_j\mathbf{R}_i\delta \boldsymbol{\phi}_i) \bigg) \\
& = \mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_i) {\color{Mahogany} - \mathbf{J}_r^{-1}(\mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_i)) \mathbf{R}^{\intercal}_j\mathbf{R}_i\delta \boldsymbol{\phi}_i  }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\mathbf{R}_j\text{Exp}(\delta \boldsymbol{\phi}_j)) & = \text{Log}\bigg( \Big( \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}^g_i)E \Big)^{\intercal} \mathbf{R}_i^{\intercal} (\mathbf{R}_j\text{Exp}(\delta \boldsymbol{\phi}_j)) \bigg) \\
& = \mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_j) {\color{Mahogany} + \mathbf{J}_r^{-1}(\mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_j))\delta \boldsymbol{\phi}_j }
\end{aligned}
\end{equation}

\begin{equation}
\begin{aligned}
\mathbf{r}_{\Delta \mathbf{R}_{ij}} (\delta \mathbf{b}^g_i + \delta \tilde{\mathbf{b}}^g_i) & = \text{Log}\bigg( \bigg(  \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}^g_i)\text{Exp}\Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}(\delta \mathbf{b}^g_i + \delta \tilde{\mathbf{b}}^g_i) \Big) \bigg)^{\intercal} \mathbf{R}_i^{\intercal} \mathbf{R}_j \bigg) \\
& =  \text{Log}\bigg( \bigg(  \Delta \tilde{\mathbf{R}}_{ij}(\bar{\mathbf{b}}^g_i) \ E \ \text{Exp}\Big( \mathbf{J}^b_r \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}\delta \tilde{\mathbf{b}}^g_i \Big) \bigg)^{\intercal} \mathbf{R}_i^{\intercal} \mathbf{R}_j \\
& = \text{Log} \bigg( \text{Exp}\Big( -\mathbf{J}^b_r \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}\delta \tilde{\mathbf{b}}^g_i \Big) (\Delta \tilde{\mathbf{R}}(\bar{\mathbf{b}}^g_i)E)^{\intercal} \mathbf{R}_i^{\intercal}\mathbf{R}_j \bigg) \\
& = \text{Log} \bigg( \text{Exp}\Big( -\mathbf{J}^b_r \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}\delta \tilde{\mathbf{b}}^g_i \Big) \text{Exp}\Big( \mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i) \Big) \bigg)\\
& = \text{Log}\bigg(\text{Exp}(\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i)) \cdot \text{Exp} \Big( -\text{Exp}(\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i))^{\intercal} \mathbf{J}^b_r \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}\delta \tilde{\mathbf{b}}^g_i  \Big)  \bigg) \\
& = \mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i) {\color{Mahogany} - \mathbf{J}^{-1}_r(\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i))\text{Exp}(\mathbf{r}_{\Delta \mathbf{R}_{ij}}(\delta \mathbf{b}^g_i))^{\intercal} \mathbf{J}^b_r \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}\delta \tilde{\mathbf{b}}^g_i }
\end{aligned}
\end{equation}
- $E \doteq \text{Exp}\Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g \Big)$
- $\mathbf{J}^b_r = \mathbf{J}_r\Big( \frac{\partial \Delta \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g} \delta \mathbf{b}^g_i \Big)$

지금까지 구한 자코비안들을 한 번에 정리하면 다음과 같다.
\begin{equation}  \boxed{
\begin{aligned}
& \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \boldsymbol{\phi}_i} = -\mathbf{J}^{-1}_r(\mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_i))\mathbf{R}^{\intercal}_j\mathbf{R}_i \qquad && \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \boldsymbol{\phi}_j} = 0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \mathbf{p}_i} =  0 \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \mathbf{p}_j} = \mathbf{J}^{-1}_r(\mathbf{r}_{\Delta \mathbf{R}}(\mathbf{R}_j)) \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \mathbf{v}_i} = 0  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \mathbf{v}_j} =  0 \\
& \frac{\partial \mathbf{r}_{\Delta \mathbf{Rv}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^a_i} = 0  \qquad &&   \frac{\partial \mathbf{r}_{\Delta \mathbf{R}_{ij}}}{\partial \delta \tilde{\mathbf{b}}^g_i} = -\mathbf{J}^{-1}_r \Big(\mathbf{r}_{\Delta \mathbf{R}}(\delta \mathbf{b}^g_i) \Big) \text{Exp}\Big( \mathbf{r}_{\Delta \mathbf{R}}(\delta \mathbf{b}^g_i) \Big)^{\intercal} \mathbf{J}^b_r \frac{\partial \bar{\mathbf{R}}_{ij}}{\partial \mathbf{b}^g}  \\
\end{aligned} }
\end{equation}

Structureless vision factors: null space projection

Rotation rate integration using euler angles

이번 섹션에서는 오일러 각 파라미터화로 인해 IMU 각속도 측정값을 적분하는 방법에 대해 설명한다. 시간 $k$의 각속도 측정값을 $\tilde{\boldsymbol{\omega}}_k$, 그에 대응하는 노이즈를 $\boldsymbol{\eta}^g_k$라고 하자. 또한 시간 $k$의 오일러 각 벡터를 $\boldsymbol{\theta}_k \in \mathbb{R}^3$라고 하면 $\tilde{\boldsymbol{\omega}}_k$를 적분하여 다음 스텝의 오일러 각 $\boldsymbol{\theta}_{k+1}$을 다음과 같이 얻을 수 있다.
\begin{equation}
\begin{aligned}
\boldsymbol{\theta}_{k+1} = \boldsymbol{\theta}_k + [E'(\boldsymbol{\theta}_k)]^{-1}(\tilde{\boldsymbol{\omega}}_k - \boldsymbol{\eta}^g_k)\Delta t
\end{aligned}
\end{equation}
- $E'(\boldsymbol{\theta}_k)$ : "conjugate 오일러 각속도 행렬"이라고 부르며 오일러 각속도와 몸체(body)의 각속도를 연결하는 행렬이다

$E'(\boldsymbol{\theta}_k)$는 몸체 각속도 $\rightarrow$ 오일러 각속도로 변환하는 행렬이므로 그 역행렬로 각속도를 적분하여 오일러 각을 업데이트한다. $\boldsymbol{\theta}_{k+1}$의 공분산은 1차 선형화로 다음과 같이 계산할 수 있다.

\begin{equation}
\begin{aligned}
\boldsymbol{\Sigma}^{\text{Euler}}_{k+1} = \mathbf{A}_k\boldsymbol{\Sigma}^{\text{Euler}}_{k}\mathbf{A}_k^{\intercal} + \mathbf{B}_k \boldsymbol{\Sigma}_{\boldsymbol{\eta}}\mathbf{B}_k^{\intercal}
\end{aligned}
\end{equation}
- $\mathbf{A}_k \doteq \mathbf{I}_{3\times 3} + \frac{\partial [E'(\boldsymbol{\theta}_k)]^{-1}}{\partial \boldsymbol{\theta}_k}\Delta t$
- $\mathbf{B}_k \doteq -[E'(\boldsymbol{\theta}_k)]^{-1}\Delta t$
- $\boldsymbol{\Sigma}_{\boldsymbol{\eta}}$ : 관측 노이즈 $\boldsymbol{\eta}^{\smm{gd}}_k$의 공분산

일반적인 공분산의 전파 공식을 사용하면 위와 같은 식이 나온다. 단, 오일러 각은 짐벌락이 있을 수 있으니 큰 회전에는 SO(3) 기반 적분을 쓰는 것이 보통 더 안정적이다

References

[1] (Paper) Forster, Christian, et al. "On-manifold preintegration for real-time visual-inertial odometry." IEEE Transactions on Robotics 33.1 (2016): 1-21.

저작자표시 (새창열림)

'Fundamental' 카테고리의 다른 글

[SLAM] Iterative Closest Point(ICP) 개념 정리 (+ point-to-plane, GICP) (0)	2024.06.29
칼만 필터(Kalman Filter) 개념 정리 (+ KF, EKF, ESKF, IEKF, IESKF) Part 2 (25)	2024.06.20
확률 이론(Probability Theory) 개념 정리 Part 2 - Random Process, Gaussian Process, Gaussian Process Regression (0)	2024.02.27
추정 이론(Estimation Theory) 개념 정리 Part 3 - Bayesian Philosophy (15)	2024.02.17
추정 이론(Estimation Theory) 개념 정리 Part 2 - RBLS, BLUE, MLE, LSE, Exponential Familiy (1)	2024.02.12

A L I D A

IMU Preintegration 개념 리뷰 (On-Manifold Preintegration 논문 리뷰)

Introduction

Preliminaries

Notions of Riemannian geometry

Special orthogonal group SO(3)

Special euclidean group SE(3)

Uncertainty description in SO(3)

Gauss-Newton method on manifold

Maximum a posteriori visual-inertial state estimation

The state

The measurements

Factor graphs and MAP estimation

IMU model and motion integration

IMU preintegration on manifold

Preintegrated IMU measurements

Noise propagation

Incorporating bias updates

Preintegrated IMU factors

Bias model

Structureless vision factor

Appendix

Iterative noise propagation

Bias correction via first-order updates

Jacobians of residual errors

Jacobians of $\mathbf{r}_{\Delta \mathbf{p}_{ij}}$

Jacobians of $\mathbf{r}_{\Delta \mathbf{v}_{ij}}$

Jacobians of $\mathbf{r}_{\Delta \mathbf{R}_{ij}}$

Structureless vision factors: null space projection

Rotation rate integration using euler angles

References

'Fundamental' 카테고리의 다른 글

티스토리툴바

IMU Preintegration 개념 리뷰 (On-Manifold Preintegration 논문 리뷰)

Introduction

Preliminaries

Notions of Riemannian geometry

Special orthogonal group SO(3)

Special euclidean group SE(3)

Uncertainty description in SO(3)

Gauss-Newton method on manifold

Maximum a posteriori visual-inertial state estimation

The state

The measurements

Factor graphs and MAP estimation

IMU model and motion integration

IMU preintegration on manifold

Preintegrated IMU measurements

Noise propagation

Incorporating bias updates

Preintegrated IMU factors

Bias model

Structureless vision factor

Appendix

Iterative noise propagation

Bias correction via first-order updates

Jacobians of residual errors

Jacobians of $\mathbf{r}_{\Delta \mathbf{p}_{ij}}$

Jacobians of $\mathbf{r}_{\Delta \mathbf{v}_{ij}}$

Jacobians of $\mathbf{r}_{\Delta \mathbf{R}_{ij}}$

Structureless vision factors: null space projection

Rotation rate integration using euler angles

References

'Fundamental' 카테고리의 다른 글

'Fundamental' Related Articles

티스토리툴바