一、视图空间的基础数学框架
1.1 齐次坐标与变换矩阵
三维坐标系变换采用4×4齐次坐标矩阵,其通用形式为:
M = [ A 3 × 3 b 3 × 1 0 1 × 3 1 ] \mathbf{M} = \begin{bmatrix} \mathbf{A}_{3×3} & \mathbf{b}_{3×1} \\ \mathbf{0}_{1×3} & 1 \end{bmatrix} M=[A3×301×3b3×11]
其中:
- A \mathbf{A} A 包含旋转、缩放变换
- b \mathbf{b} b 为平移向量
- 坐标点表示为 ( x , y , z , 1 ) T (x,y,z,1)^T (x,y,z,1)T
1.2 相机参数化表示
相机状态由六自由度参数定义:
- 位置坐标: C = ( X , Y , Z ) \mathbf{C} = (X,Y,Z) C=(X,Y,Z)
- 欧拉角: ( θ x , θ y , θ z ) (θ_x,θ_y,θ_z) (θx,θy,θz)(俯仰、偏航、滚动)
- 缩放因子: s s s
二、相机坐标系变换原理
2.1 刚体变换分解
2.1.1 平移变换矩阵
将世界坐标原点平移至相机位置:
T = [ 1 0 0 − X 0 1 0 − Y 0 0 1 − Z 0 0 0 1 ] \mathbf{T} = \begin{bmatrix} 1 & 0 & 0 & -X \\ 0 & 1 & 0 & -Y \\ 0 & 0 & 1 & -Z \\ 0 & 0 & 0 & 1 \end{bmatrix} T= 100001000010−X−Y−Z1
2.1.2 旋转变换矩阵
构造基于观察方向的正交基:
- 前向向量: f = g ∥ g ∥ \mathbf{f} = \frac{\mathbf{g}}{\|\mathbf{g}\|} f=∥g∥g
- 右向向量: r = t × f ∥ t × f ∥ \mathbf{r} = \frac{\mathbf{t} \times \mathbf{f}}{\|\mathbf{t} \times \mathbf{f}\|} r=∥t×f∥t×f
- 上向向量: u = f × r \mathbf{u} = \mathbf{f} \times \mathbf{r} u=f×r
旋转矩阵的解析形式:
R = [ r x r y r z 0 u x u y u z 0 − f x − f y − f z 0 0 0 0 1 ] \mathbf{R} = \begin{bmatrix} r_x & r_y & r_z & 0 \\ u_x & u_y & u_z & 0 \\ -f_x & -f_y & -f_z & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} R= rxux−fx0ryuy−fy0rzuz−fz00001
2.2 视图矩阵合成
组合平移与旋转得到视图矩阵:
M v i e w = R ⋅ T = [ r − r ⋅ C u − u ⋅ C − f f ⋅ C 0 1 ] \mathbf{M}_{view} = \mathbf{R} \cdot \mathbf{T} = \begin{bmatrix} \mathbf{r} & -\mathbf{r}\cdot\mathbf{C} \\ \mathbf{u} & -\mathbf{u}\cdot\mathbf{C} \\ -\mathbf{f} & \mathbf{f}\cdot\mathbf{C} \\ 0 & 1 \end{bmatrix} Mview=R⋅T= ru−f0−r⋅C−u⋅Cf⋅C1
三、投影变换原理
3.1 正交投影
3.1.1 规范视体定义
正交投影将立方体视体映射到规范立方体[-1,1]³:
M o r t h o = [ 2 r − l 0 0 − r + l r − l 0 2 t − b 0 − t + b t − b 0 0 2 n − f − n + f n − f 0 0 0 1 ] \mathbf{M}_{ortho} = \begin{bmatrix} \frac{2}{r-l} & 0 & 0 & -\frac{r+l}{r-l} \\ 0 & \frac{2}{t-b} & 0 & -\frac{t+b}{t-b} \\ 0 & 0 & \frac{2}{n-f} & -\frac{n+f}{n-f} \\ 0 & 0 & 0 & 1 \end{bmatrix} Mortho=