1、深度估计简述
单眼深度估计是一项计算机视觉任务,AI 模型从单个图像中预测场景的深度信息。模型估计场景中对象从一个照相机视点的距离。单目深度估计已广泛用于自动驾驶、机器人等领域。深度估计被认为是最困难的计算机视觉任务之一,因为它要求模型理解对象及其深度信息之间的复杂关系。但在估计场景的深度时,许多因素都会产生巨大干扰,比如光照条件、遮挡和纹理会极大地影响结果。
深度估计是从 2D 图像中了解场景几何结构的关键步骤。单目深度估计的目标是预测每个像素的深度值。这称为推断深度信息,仅使用一个 RGB 输入图像。深度估计技术分析透视、阴影和纹理等视觉细节,以估计图像中对象的相对距离。深度估计模型的输出通常是深度图。
要训练深度估计AI模型,我们首先需要生成深度图。我们使用一些常见的技术来生成带有相机的深度图。例如,飞行时间以及光探测和测距 (LiDAR) 是在机器人、工业自动化和自动驾驶汽车等领域使用的常用深度传感技术。
2、深度估计常见方法
在深度传感技术领域,没有适合所有应用的单一解决方案,就像图像算法一样,从来没有通用的能满足所有场景的算法。在某些情况下&