700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 三维重建学习(3):张正友相机标定推导

三维重建学习(3):张正友相机标定推导

时间:2020-07-18 15:35:47

相关推荐

三维重建学习(3):张正友相机标定推导

前言

前面的几篇博客中介绍了有关相机标定的基础知识(三维重建学习(1):基础知识:旋转矩阵与旋转向量、三维重建学习(2):相机标定基础)。这次介绍一个十分经典的单目相机标定方法——张正友标定,并给出数学理论推导。

基本方程

模型

我们首先约定如下表示:

二维点坐标:m=[uv],三维点坐标:M=⎡⎣⎢XYZ⎤⎦⎥

将上面的二维点和三维点的坐标表示成齐次形式:

二维点坐标:m~=⎡⎣⎢uv1⎤⎦⎥,,三维点坐标:M~=⎡⎣⎢⎢⎢XYZ1⎤⎦⎥⎥⎥

参考前面的博客:三维重建学习(2):相机标定基础,我们可以建立一个常见的相机小孔成像模型:

s⋅m~=A[Rt]M~

其中:

A=⎡⎣⎢α00cβ0u0v01⎤⎦⎥

s为任意比例因子,R、t都是相机外参,R为旋转矩阵,t对应三个轴的平移。A是相机内参,(u0,v0)是坐标的主点,α和β是图像在u轴和v轴的比例因子,c是描述两个坐标轴亲倾斜角的参数(注:如果两个坐标轴相互垂直,则c=0,即默认情况下这个c都是为0的)。

模型平面与图像之间的单应性关系

R的第i列旋转矩阵为ri,那么R可以表示为:

R=[r1r2r3]

代入原方程中:

s⋅⎡⎣⎢uv1⎤⎦⎥=A[r1r2r3t]⎡⎣⎢⎢⎢XYZ1⎤⎦⎥⎥⎥

假设模型平面在世界坐标系中Z坐标为0,那么Z坐标的值都为0:

s⋅⎡⎣⎢uv1⎤⎦⎥=A[r1r2r3t]⎡⎣⎢⎢⎢XY01⎤⎦⎥⎥⎥

乘出来都还是0,省略掉这一部分:

s⋅[uv]=A[r1r2t]⎡⎣⎢XY1⎤⎦⎥

此时坐标表示也要变换一下:

二维点坐标:m~=[uv],,三维点坐标:M~=⎡⎣⎢XY1⎤⎦⎥

因此点M和它在图像上的映射点m之间的关系可以使用单应矩阵H来表示:

s⋅m~=H⋅M~

其中:

H=A[r1r2t]

很显然,H是一个3×3的矩阵。A对应着内参,[r1r2t]对应着外参。

内参的约束条件

令H=[h1h2h3],h1、h2、h3都是3×1的矩阵,各自对应一列。

则有[h1h2h3]=λA[r1r2t],式中λ是任意的标量。

我们知道旋转矩阵的每一列两两正交,即r1与r2正交。这里不对基础知识赘述,如果有疑问,请查看:旋转矩阵(Rotate Matrix)的性质分析。(吐槽一下:旋转矩阵真的是一个完美的矩阵)

根据r1与r2正交,我们能得到条件:

rT1r2=0,∥r1∥=∥r2∥=1

上面这个条件先放在这里,后面再用。

由前面公式:[h1h2h3]=λA[r1r2t]一一对应得到方程组:

⎧⎩⎨h1=λAr1h2=λAr2h3=λAt

推出:

{r1=λ−1A−1h1r2=λ−1A−1h2

代入前面的条件:

rT1r2=0,∥r1∥=∥r2∥=1

得到:(λ是常数)

rT1r2=λ−ThT1A−TA−1h2λ−1=λ−2hT1A−TA−1h2=0

{∥r1∥2=λ−2hT1A−TA−1h1=1∥r2∥2=λ−2hT2A−TA−1h2=1⇒λ−2hT1A−TA−1h1=λ−2hT2A−TA−1h2

由上面的式子我们可以发现,对于一个给定的单应性矩阵H,对于内参有2个基本的约束条件:λ−2hT1A−TA−1h2=0和λ−2hT1A−TA−1h1=λ−2hT2A−TA−1h2。

对于H矩阵来说,它是一个3×3的矩阵,有9个参数,那么就有8个自由度。对应的外参有6个(注:旋转矩阵R有3个,平移向量t有3个)。到这一步,我们只能得到内参的约束条件,却没法解出来。

解决相机标定

利用约束条件求出内参矩阵A

好的,还是看一下前面给出的约束条件,注意到中间都有这么一个东西:A−TA−1

我们试着将它表示出来:令B=A−TA−1。

我们在最前面给出了A的定义:

A=⎡⎣⎢α00cβ0u0v01⎤⎦⎥

计算A的逆矩阵,步骤就省略了,很简单。得到:

A=⎡⎣⎢⎢⎢⎢⎢1α00−cαβ1β0v0c−u0βαβ−v0β1⎤⎦⎥⎥⎥⎥⎥

计算出B来:

B=⎡⎣⎢⎢⎢⎢⎢⎢⎢1α−cαβv0c−u0βαβ01β−v0β001⎤⎦⎥⎥⎥⎥⎥⎥⎥⋅⎡⎣⎢⎢⎢⎢⎢1α00−cαβ1β0v0c−u0βαβ−v0β1⎤⎦⎥⎥⎥⎥⎥=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢1α2−cα2βv0c−u0βα2β−cα2βc2α2β+1β2−c(v0c−u0β)α2β2−v0β2v0c−u0βα2β−c(v0c−u0β)α2β2−v0β2(v0c−u0β)2α2β2+v20β2+1⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥

不难发现B是对称的,我们可以使用6个变量来表示出B。定义一个6维向量:

b=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢B11B12B22B13B23B33⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥

B可以表示为:

B=⎡⎣⎢B11B12B13B12B22B23B13B23B33⎤⎦⎥

与前面表示旋转矩阵时类似,我们假设H的第i列为:hi=⎡⎣⎢hi1hi2hi3⎤⎦⎥,那么H=[h1h2h3]。

对于hTiBhj,我们把前面的公式代入看看:

hTiBhj=[hi1hi2hi3]⋅⎡⎣⎢B11B12B13B12B22B23B13B23B33⎤⎦⎥⋅⎡⎣⎢hj1hj2hj3⎤⎦⎥=(hi1B11+hi2B12+hi3B13)hj1+(hi1B12+hi2B22+hi3B23)hj2+(hi3B13+hi2B23+hi3B33)hj3=hi1hj1B11+(hi2hj1+hi1hj2)B12+hi2hj2B22+(hi3hj1+hi1hj3)B13+(hi3hj2+hi2hj3)B23+hi3hj3B33

我们前面已经给出了一个6维向量b:

b=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢B11B12B22B13B23B33⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥

那么上面那一堆东西可以表示为:

hTiBhj=vTijb

其中:

vij=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢hi1hj1(hi2hj1+hi1hj2)hi2hj2(hi3hj1+hi1hj3)(hi3hj2+hi2hj3)hi3hj3⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥

回到我们前面推导出的约束条件:

{λ−2hT1A−TA−1h2=0λ−2hT1A−TA−1h1=λ−2hT2A−TA−1h2

这两个约束条件可以改写为齐次形式:

{vT12b=0(v11−v22)Tb=0

我们用一个新的矩阵V来表示这两个式子:

V=[vT12(v11−v22)T]

这里的V是一个2×6的矩阵。约束条件变为:V⋅b=0

如果观察了n张图片,那么可以得到n个方程V⋅b=0。我们想要解出b,b是一个6维向量,要求出唯一解,则至少需要6个方程。一个V⋅b=0有2个约束条件,那么要求出唯一解,至少需要3个V⋅b=0,即至少需要3张图片(n≥3)。

如果我们求出了唯一解b,那么就可以得到B,那就也可以求出相机内参A(注:使用cholesky分解)。

下面直接给出结果:(已知B,求解出A中的各个参数)

⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪v0=(B12B13−B11B23)/(B11B22−B212)λ=B33−[B213+v0(B12B13−B11B23)]/B11α=λ/B11−−−−−√β=λB11/(B11B22−B212)−−−−−−−−−−−−−−−−−√c=−B12α2β/λu0=cv0/α−B13α2/λ

利用内参矩阵A求解外参矩阵

通过前面的方法,假设我们已经求到了内参矩阵A

我们使用下面的式子表示点M和它在图像上的映射点m之间的关系:

s⋅m~=H⋅M~

如果我们已知图片中的点m的坐标,以及点M在三维空间中的坐标,s又只是个常数,那么我们可以求出单应性矩阵H。

对于已知的单应性矩阵H=[h1h2h3],我们有:

[h1h2h3]=λA[r1r2t]

解出外参:

⎧⎩⎨⎪⎪r1=λ−1A−1h1r2=λ−1A−1h2t=λ−1A−1h3

由旋转矩阵的性质得到:

{r3=r1×r2∥r1∥=∥r2∥=1

这些东西整合一下:

⎧⎩⎨⎪⎪⎪⎪⎪⎪r1=λ−1A−1h1r2=λ−1A−1h2r3=r1×r2t=λ−1A−1h3∥λ−1A−1h1∥=∥λ−1A−1h2∥=1⇒λ=∥A−1h1∥=∥A−1h2∥

这样就求出了外参的各项参数。

极大似然估计

普通形式

张正友在论文中提到,前面的这些数学原理和推导并没有太多的物理意义,仅仅是为后面的极大似然优化提供了一个初值。

假设我们得到了模型平面的n幅图片,模型平面上有m个点,假设图像上像素点的噪声服从独立的同一分布,下面给出极大似然优化问题:

∑i=1n∑j=1m∥mij−m^(A,Ri,ti,Mj)∥

其中:m^(A,Ri,ti,Mj)表示的是点Mj在第i幅图像上的投影,旋转矩阵R使用有三个参数的向量r表示,r平行于旋转轴,模长为旋转角度。这里的R和r关系符合Rodrigue公式(参考前面的博客:三维重建学习(1):基础知识:旋转矩阵与旋转向量)。

好了,这是一个非线性优化问题,他衡量的是点的实际坐标与估计值的误差,我们期望它尽可能地小。解决这个优化问题有很多种工具,但不是这里的重点,所以不做赘述。只是有一点需要注意,它需要一个A的初值,我们使用前面那一大堆公式导出一个猜测值赋给它。为什么这么大费周章?很简单,因为这比随机初始化初值收敛的快得多,有助于加快算法。

径向畸变的处理

如前面的博客:三维重建学习(2):相机标定基础中所说,通常畸变有两种:径向畸变、切向畸变。通常切向畸变可以忽略不计,我们只考虑径向畸变。

(u,v)为点在理想的(无畸变的)像素坐标系中的坐标,令(u~,v~)为实际观察到的坐标(有畸变)。同样地,令(x,y)表示理想的(无畸变)点在图像坐标系中的坐标,x~,y~为实际观察到的坐标(有畸变)。

下面给出张正友在论文中给出的公式:

x~=x[1+k1(x2+y2)+k2(x2+y2)2]y~=y[1+k1(x2+y2)+k2(x2+y2)2]

k1、k2是径向畸变参数。

从公式:u~=u0+αx~+cy~、v~=v0+βy~(注:由内参矩阵的参数导出),得到:

u~=u+(u−u0)[k1(x2+y2)+k2(x2+y2)2]v~=v+(v−v0)[k1(x2+y2)+k2(x2+y2)2]

从上面的式子我们可以得到两个方程:

u~−u=(u−u0)[k1(x2+y2)+k2(x2+y2)2]v~−v=(v−v0)[k1(x2+y2)+k2(x2+y2)2]

表示成矩阵形式:

[(u−u0)(x2+y2)(v−v0)(x2+y2)(u−u0)(x2+y2)2(v−v0)(x2+y2)2]⋅[k1k2]=[u~−uv~−v]

n幅图像中各有m个点,迭代所有的方程会得到一个有2mn个方程的方程组。

用矩阵表示来表示这个方程组:D⋅k=d,其中k=[k1k2]。

使用最小二乘法求解出k,直接套公式:

k=(DTD)−1DTd

如此求出了畸变参数后,我们可以回到前面的优化问题中再求解其他参数。

完整形式

下面给出完整的极大似然估计优化问题:

∑i=1n∑j=1m∥mij−m^(A,k1,k2,Ri,ti,Mj)∥

其中:m^(A,ki,kj,Ri,ti,Mj)表示的是点Mj在第i幅图像上的投影。

与前面类似,这里依然回一个非线性优化问题。其中内参矩阵A和[Rt]的初始值选取采用前面的方法求出,k1和k2的选取可以采用上一段的方法。

到这里,整个算法的数学原理已经推导完毕了。

在论文中,张正友还给出了相机标定的程序流程:

个人感觉用中文翻译意思上总是会有点偏差,姑且还是给出翻译后的流程:

建议采用如下校准步骤:

1. 打印一个图案,并把它贴到一个平面上;

2. 通过移动平面或者相机,从不同的方向拍摄一些图片;

3. 检测图片中的特征点;

4. 采用3.1节所述的方法,估计5个内参和全部的外参;

5. 使用最小二乘法(13)估计径向畸变系数;

6. 最小化优化问题(14),改进所有的参数

这里用到的数学公式全部都在前面介绍了,理应很清楚了,不做赘述。下一篇博客再进行程序实现。

参考资料:

[图像]摄像机标定(2) 张正友标定推导详解张正友标定法的真实理解Flexible Camera Calibration By Viewing a Plane From Unknown Orientations(Zhengyou Zhang)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。