三维计算机视觉的主要任务是利用三维物体的二维图像所包含的信息,获取三维物体的空间位置与形状等几何信息,并在此基础上识别三维物体。
摄像机关于空间平面的投影是平面到平面的一个二维中心投影变换
对于空间物体,由于摄像机将三维物体表面投影到二维平面上,是一个 ( 退化的 )射影变换,因此不可能从三维物体的单幅图像恢复其三维结构。能否从多幅图像恢复物体的三维结构?这是三维计算机视觉中三维重构问题
摄像机模型
摄像机的基本成像模型,通常称为基本针孔模型,由三维空间到平面的中心投影变换所给出。
令空间点 O c 是投影中心,它到平面 π 的距离为 f 。空间点 X c 在平面 π 上的投影 ( 或像 ) m 是以点 O c 为
端点并经过点 X c 的射线与平面 π 的交点,如图 3.1.1( a ) 所示。平面 π 称为摄像机的像平面,点 O c 称
为摄像机中心 ( 或光心 ) , f 称为摄像机的焦距,以点 O c 为端点且垂直于像平面的射线称为光轴或主
轴,主轴与像平面的交点 p 称为摄像机的主点。
知空间点 X c 与它的像点 m 满足下述关系:
其中,
分别为空间点和图像点的齐次坐标。它是从空间到像平面的一个齐次线性变换。
记 P = diag ( f , f , 1)( I , 0) ,则 m = P X c
矩阵 P 是一个 3 × 4 矩阵,通常称它为摄像机矩阵。这就是基本成像模型的代数表示
主点偏离图像中心
若主点在上述坐标系下的坐标为 ,则摄像机的投影关系变为:
P = K ( I , 0 )
,为摄像机内参数矩阵
摄像机矩阵的一般形式
令空间点在世界坐标系与摄像机坐标系的坐标分别为 , ,则:
其中C~ 表示摄像机中心在世界坐标系中的非齐次坐标
于是,摄像机矩阵的一般形式:
摄像机矩阵是一个秩 3 的 3 × 4 矩阵,因为它的前三列所构成的子矩阵是一个可逆矩阵。另外,由于摄像机矩阵的齐次性,所以它仅有 11 个独立元素