——————————
本文将涉及 3 个坐标系——相机、图像和世界坐标系。
[
x
c
y
c
f
]
=
λ
[
X
c
Y
c
Z
c
]
上面的式子,是要取向量相等,则各元素相等。并不是齐次坐标的 up to a scale。
其中,
X
c
=
[
X
c
Y
c
Z
c
]
\mathbf{X}_c =
是三维场景下的点
X
\mathbf{X}
X 在相机坐标系下的坐标。
λ
=
f
Z
\lambda=\frac{f}{Z}
λ=Zf

这可以用一个关于齐次坐标的线性映射来表示(等式左右两边相差一个常数,the equation is only up to a scale factor)
[
x
c
y
c
f
]
⋍
[
1
0
0
0
0
1
0
0
0
0
1
0
]
[
X
c
Y
c
Z
c
1
]
注意,上面的
[
x
c
,
y
c
]
是在图 2 中
y
c
p
x
c
y_c p x_c
ycpxc坐标系下的二维坐标。
k
u
x
c
=
u
−
u
0
k_u x_c=u-u_0
kuxc=u−u0
k
v
y
c
=
v
0
−
v
k_v y_c=v_0-v
kvyc=v0−v
其中
k
k
k 的单位是
[
p
i
x
e
l
s
/
l
e
n
g
t
h
]
[pixels/length]
[pixels/length]
pixels是指高度或者宽度方向上的像素数目,length是指图像的高度值或宽度值(单位为米)。

上式可以表示为
x
=
[
u
v
1
]
=
[
f
k
u
0
u
0
0
−
f
k
v
v
0
0
0
1
]
[
x
c
y
c
f
]
=
C
[
x
c
y
c
f
]
\mathbf{x}=
C
\mathbf{C}
C 是一个
3
×
3
3\times3
3×3上三角矩阵,称作相机标定矩阵。
C
=
[
α
u
0
u
0
0
α
v
v
0
0
0
1
]
\mathbf{C}=
其中, α u = f k u , α v = − f k v \alpha_u=fk_u,\alpha_v=-fk_v αu=fku,αv=−fkv
[
X
c
Y
c
Z
c
1
]
=
[
R
t
0
T
1
]
[
X
w
Y
w
Z
w
1
]

最终,
x
=
[
u
v
1
]
=
C
[
1
0
0
0
0
1
0
0
0
0
1
0
]
[
R
t
0
T
1
]
[
X
w
Y
w
Z
w
1
]
=
C
[
R
∣
t
]
[
X
w
Y
w
Z
w
1
]
\mathbf{x}=
上面定义了
3
×
4
3\times4
3×4投影矩阵:从 3 维欧几里得空间到一张图像
x
=
P
[
X
1
]
\mathbf{x}=\mathbf{P}
P = C [ R ∣ t ] \mathbf{P}=\mathbf{C} [\mathbf{R}\mid\mathbf{t}] P=C[R∣t]