Skip to content

A Continuous-time Representation for VINS

S. Lovegrove, A. Patron-Perez, and G. Sibley, “Spline Fusion: A continuous-time representation for visual-inertial fusion with application to rolling shutter cameras,” in Procedings of the British Machine Vision Conference 2013, Bristol: British Machine Vision Association, 2013, p. 93.1-93.11. doi: 10.5244/C.27.93.

这篇论文主要工作是建立了卷帘相机的连续时域下的数学模型,初始化方法是利用 IMU 主动对齐视觉。


相比离散时域,在连续时域上表示有助于融合高帧率的传感器和异步时间戳的设备。对卷帘相机的研究尚未成熟,现有的工作主要集中在如何消除卷帘相机的畸变,而后复用标准全局快门相机的 SLAM 模型,这种解耦合的处理方式增加了无法修正的偏差。

单目视觉系统存在 7 自由度不可观:6 自由度姿态+尺度,一种方法通过回环检测和序列图松弛对尺度显式参数化,另一种方法是加入可以测量绝对尺度的设备。在本文中作者使用了惯性单元。相比过往建立在欧拉角上的数学表示,作者引入李群和李代数上的旋转表示避免了奇异点,同时能够更好地近似最小扭矩的轨迹。

Tb,a=[Rb,aab0T1], Tb,aSE3, Rb,aSO3

作者希望轨迹的参数化方程是局部可控,二阶导连续,能近似最小力矩轨迹的。三次 B 样条曲线可以很好表示 R3 上的轨迹,但在三维旋转上表现一般。因此作者选用了李代数上的累计基函数,这种函数最早被应用在计算机动画中的四元数插值中。

自由度为 k1 的 B 样条曲线的标准基函数表示为

p(t)=i=0npiBi,k(t)=p0B0,k(t)+p1B1,k(t)++pnBn,k(t)=p0B0,k(t)+i=1n1piBi,k(t)+pnBn,k(t)=p0B~0,k(t)+i=1npij=inBj,k(t)i=0n1pij=i+1nBj,k(t)=p0B~0,k(t)+i=1n(pipi1)B~i,k(t)

其中 piRN 是在 ti,i[0,,n] 时刻的控制点,Bi,k(t) 是由德伯尔-考克斯递归公式 De Boor - Cox recursive formula 计算得到的基函数。进一步利用李群的指数映射和对数映射,将公式重写在李群域上

Tw,s(t)=exp(B~0,klog(Tw,0))i=1exp(B~i,k(t)log(Tw,i11Tw,i))

作者进一步在假设控制点时间间隔不变的情况下(大多数单目系统应该都能满足),对时间做了归一化处理

u(t)=tt0Δtsi

并在参数 k=4 下转化为矩阵表达

B~(u)=C[1uu2u3],B~˙(u)=C[012u3u2],B~¨(u)=C[0026u],C=16[6000533113320001]Tw,s(u)=Tw,i1j=13exp(B~(u)jlog(Tw,i+j11Tw,i+j))

T˙w,s,T¨w,s 则由链式法则和指数映射的一阶近似得到

给定第一次观测的逆深度 RhoR+, 对应点在两帧的坐标分别为 pa,pbR2, 其中 π(P)=1P2[P0,P1]T

pb=W(pa;Tb,a,Rho)=π([Kb0]Tb,a[Ka1[pa1]Rho])

对于一般的视觉惯性系统给出损失函数

E(θ)=p^m[p^mW(pr;Tc,sTw,s(um)1Tw,s(ur)Ts,c,ρ)]Σp2+ω^m[ω^mGyro(um)]Σω2+a^m[a^mAccel(um)]Σa2

而对卷帘相机则将 pbpb(t) 替代重新建模

pb(t)=[xb(t)yb(t)]=W(pa;Tb,a(t),ρ)pb(t+Δt)=W(pa;Tb,a(t),ρ)+ΔttW(pa;Tb,a(t),ρ)yb(t+Δt)=h(t+Δts)es,Δt=ht0+s(yb(t)h)eyb(t)(se)tWy(pa;Tb,a(t),ρ)+h

这一系统表现出了良好的自校准的能力