计算机视觉之三维重建(1)---摄像机几何

文章目录

  • 一、针孔模型和透镜
    • 1.1 针孔摄像机
    • 1.2 近轴折射模型
    • 1.3 透镜问题
  • 二、摄像机几何
    • 2.1 像平面和像素平面
    • 2.2 齐次坐标下的投影变换
    • 2.3 摄像机倾斜
    • 2.4 规范化摄像机
    • 2.5 世界坐标系
    • 2.6 Faugeras定理
    • 2.7 投影变换性质:
  • 三、其他投影摄像机模型
    • 3.1 弱透视投影摄像机
    • 3.2 正交投影摄像机


一、针孔模型和透镜

1.1 针孔摄像机

 1. 当我们设计摄像机记录世界时,我们首先会想到将胶片直接放到物体的前方,但是此时胶片上某点处的图像信息可能来自物体的多个位置,图像模糊使得我们无法分辨。

在这里插入图片描述

 2. 最早提出小孔成像的是中国的墨子。那如果我们在胶片和物体之间放一个有针孔的隔板,那么就可以实现物体的光线与胶片上的像素点一对一对应。

在这里插入图片描述

 3. 如下图是一个简单的针孔摄像机模型。物体经过针孔呈现在像平面的像是倒立的。为了研究方便,我们人为定义了一个虚拟像平面,上面的图像是正立的。

在这里插入图片描述

 4. 如下图所示通过数学模型建立三维坐标到二维坐标的映射,我们可以确定出摄像机坐标系与像平面坐标系相对应点处的位置关系。

在这里插入图片描述

在这里插入图片描述

 6. 光圈的大小会对成像有影响,当缩小光圈时,成像会越来越清晰,但也会越来越暗。
思考:那如何应对到达胶片的光线变少,我们可以增加透镜来解决。

在这里插入图片描述

在这里插入图片描述

1.2 近轴折射模型

 1. 焦点和焦距的概念图如下:

在这里插入图片描述

 2. 我们仍然可以建立数学模型来表示胶片上像素点与物体发射光线处的对应关系。

在这里插入图片描述

1.3 透镜问题

 1. 使用透镜带来的第一个问题是会造成失焦。透镜问题中的 “失焦” 主要指的是在拍摄过程中,由于焦距调整不当,导致拍摄主体在胶片或传感器上未能形成清晰的图像。具体来说,当物体上离相机较远的点P在胶片上成像时,如果物体上较近的点在胶片上映射到多个位置,那么就无法形成清晰的焦点,从而产生虚像。

在这里插入图片描述

 2. 失焦的原因可以归结为焦距设置的不准确。每个透镜都有一个特定的 “聚焦” 距离,只有在该距离上的物体才能被清晰地成像。此外,景深也是一个重要的因素。景深是指在摄影机镜头或其他成像器前沿能够取得清晰图像的所成影像的景物空间范围。在一定景深范围内,物体能够形成清晰的像;而超出这个范围,物体则可能形成虚像。

 3. 使用透镜带来的第二个问题是会造成径向畸变。透镜问题中的径向畸变是一种常见的光学现象,它主要沿着透镜的半径方向分布。当光线经过透镜时,由于透镜的制造精度或组装工艺的偏差,光线在远离透镜中心的地方比靠近中心的地方更加弯曲,从而导致图像的失真。这种失真在普通廉价的镜头中尤为明显。

在这里插入图片描述

 4. 径向畸变的产生与透镜的曲率半径、折射率以及光线入射角等因素有关。当光线经过透镜时,由于不同位置的光线受到不同程度的折射,导致它们在成像平面上无法准确聚焦,从而产生径向偏移。这种偏移随着离透镜中心距离的增加而变得更加明显。

 径向畸变主要分为两种类型:桶形畸变和枕形畸变。桶形畸变通常表现为图像边缘向中心收缩,使得图像呈现出一种 “桶状” 的效果;而枕形畸变则表现为图像边缘向外扩张,形成一种 “枕状” 的效果。

二、摄像机几何

2.1 像平面和像素平面

 1. 首先,像平面是一个连续的平面,通常用于描述光线通过透镜后在成像介质(如胶片或图像传感器)上形成的图像。在像平面上,每个点都对应着一定的光线强度和颜色信息,从而构成了我们所看到的图像。这个平面的坐标原点一般设定在图像的中心,即主光轴与图像传感器的交点,以便更准确地描述图像的物理位置和关系,常常使用物理单位如毫米来描述像素在图像中的位置。

 而像素平面则是与图像的存储和显示方式紧密相关的离散平面。在数字图像处理中,图像被表示为一个由多个像素组成的矩阵,每个像素都对应着像素平面上的一个点。这些像素点按照一定的规律排列,共同构成了我们看到的数字图像。像素平面的坐标原点通常设定在图像的左上角顶点,这与计算机图像处理中的常见坐标系统相一致。

在这里插入图片描述

 2. 我们需要对小孔成像模型进行修正。由于在像平面和像素平面中坐标系的原点选择位置和物理单位不同,所以我们只需要在像平面下加上偏置和乘上系数就可以了。第二幅图中 α α α β β β 一般是由摄像机自身决定的。

在这里插入图片描述

在这里插入图片描述

 3. 思考 P P P P ′ P' P 的变换是线性的吗? 答:不是线性的,由于 x x x y y y 变化时 z z z 也有可能变化, z z z 并不是一个恒定的常数,所以并不是线性的。

2.2 齐次坐标下的投影变换

 1. 齐次坐标(Homogeneous Coordinate)是一个用于投影几何里的坐标系统。齐次坐标表示法将一个原本是 n 维的向量用一个 n+1 维向量来表示,从而能够表达更多的信息。

在这里插入图片描述

 2. 下面表达式中 P h P_h Ph 代表物体齐次坐标形式(三维), P h ′ P'_h Ph 代表像的齐次坐标形式(像素平面), P h P_h Ph P h ′ P'_h Ph 之间通过一个三行四列的矩阵 M M M 进行变换。

在这里插入图片描述

在这里插入图片描述

2.3 摄像机倾斜

 1. 摄像机倾斜是指摄像机向一侧或者上下方倾斜拍摄的一种摄像技术,主要是由于工艺制作不好的原因。当摄像机发生倾斜时,拍摄到的图像会相应地发生旋转或倾斜。这种旋转或倾斜会导致图像中的物体和背景之间的相对位置发生变化,从而在像素平面上形成新的几何布局。这种几何变换可能会使得原本水平或垂直的线条变得倾斜,或者使得物体的形状和比例发生扭曲。

 2. 摄像机倾斜情况下,变换矩阵 M M M 也要做出相应的改变。

在这里插入图片描述

 3. 综上所示,最终得到的摄像机坐标系下的摄像机模型如下图所示。反映了摄像机坐标系下的物体某处坐标到像素平面的映射。内参数矩阵 K K K α 、 β 、 θ 、 c x 、 c y α、β、θ、c_x、c_y αβθcxcy 五个参数。

在这里插入图片描述

2.4 规范化摄像机

 规范化摄像机通常指的是将摄像机的参数和设置调整到一种标准或基准状态,以确保拍摄出的图像具有一致性、准确性和可预测性。:此时物体所取的位置应该是与摄像机坐标系的中心相对应。

在这里插入图片描述

2.5 世界坐标系

 1. 世界坐标系是系统的绝对坐标系,用于描述物体在三维空间中的位置。在没有建立用户坐标系之前,画面上所有点的坐标都是以该坐标系的原点来确定各自的位置的。世界坐标系通常由三个轴表示,分别是 x x x 轴、 y y y 轴和 z z z 轴,其中 x x x 轴表示东西方向, y y y 轴表示南北方向, z z z 轴表示高度或海拔。每个点在这个坐标系中都有一个独特的坐标值,可以用 ( x , y , z ) (x, y, z) (x,y,z) 的形式表示。

 2. 假设世界坐标系 P w P_w Pw 做一个旋转与平移后转换到摄像机坐标系 P P P(齐次坐标),那么存在旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列),对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。

在这里插入图片描述

 3. 世界坐标系下的摄像机模型如下所示, P w P_w Pw 表示世界坐标系, P ′ P' P 表示像素平面的齐次坐标系。

在这里插入图片描述

 4. 对于旋转矩阵有三个自由度,平移矩阵有三个自由度,那么外参数总共有六个自由度。 同时考虑外参数和内参数情况下,投影矩阵 M M M 有11个自由度。旋转矩阵 R R R(三行三列),平移矩阵 T T T(三行一列)。

在这里插入图片描述

2.6 Faugeras定理

 1. Faugeras定理是一个关于计算机视觉和摄影几何的重要定理,它主要关注于如何从多视图几何中提取场景的三维结构信息。Faugeras定理通常表述为:在给定足够多的视图和相应的摄像机参数的情况下,我们可以唯一地重建出场景的三维结构。这意味着,通过拍摄同一场景的多张照片,并知道每张照片的摄像机参数(如位置、方向、焦距等),我们可以利用这些信息和Faugeras定理来恢复出场景的三维模型。

 2. Faugeras定理介绍如下:

在这里插入图片描述

2.7 投影变换性质:

 1. 在计算机视觉中,投影变换是一个关键概念,它涉及将三维物体或场景投影到二维图像平面的过程。这种变换模拟了光线如何通过摄像机的镜头并在图像传感器上形成图像的过程。

 2. 投影变化的性质如下所示,共有五条,可对应右边的图来理解。

在这里插入图片描述

三、其他投影摄像机模型

3.1 弱透视投影摄像机

 1. 弱透射投影摄像机是一种特殊的摄像机模型,它在投影过程中采用了弱透视投影的原理。在弱透视投影中,像素坐标与三维坐标之间的关系相对简单,通常只需要一个放大系数就可以进行转换。

在这里插入图片描述

 2. 当观察的场景或物体与摄像机很远时,此时观察的场景或物体近似于平面。比如摄像机照一个人,当之间的距离很远时,人的脸可以看成一个平面,那么应用弱透射投影摄像机可以提供相对准确的投影结果。

在这里插入图片描述

3.2 正交投影摄像机

 正交投影摄像机是一种特殊的摄像机,其投影方式遵循正交投影的原理。正交投影是一种投影变换,其中物体在三维空间中的平行线在投影到二维平面上时仍保持平行。这种投影方式在制图、建模等领域中特别常见,因为它能够保持物体的尺寸和形状不变,不产生透视效果。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/754322.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析:在 Node.js 中删除文件的正确姿势

引言 在 Node.js 中处理文件尤其是移除文件,对于维护高效应用程序至关重要。储存和秩序当道的今天,删除不必要或冗余的文件能力显得尤为关键。本文深入探讨你会想要使用这个强大功能的时刻和原因,并通过各种案例展示了这个概念,同…

明远创意生活引领经典家纺品牌“大朴”走向新生

十二年前,有一个初创的国产家纺品牌,大胆地向消费者喊出领先于行业的标准——“无甲醛、无荧光增白剂、无致癌物”。凭借这样极致的健康承诺,“大朴”国内销售规模迅速超过一亿人民币,成功引领行业风气,收获了众多忠实粉丝。 2023年,因资金链断裂,“大朴”原公司破产清算,这个…

滴答拍摄影项目|基于Spring Boot框架+ Mysql+Java+ Tomcat的滴答拍摄影项目设计与实现(可运行源码+数据库+设计文档)

推荐阅读100套最新项目 最新ssmjava项目文档视频演示可运行源码分享 最新jspjava项目文档视频演示可运行源码分享 最新Spring Boot项目文档视频演示可运行源码分享 2024年56套包含java,ssm,springboot的平台设计与实现项目系统开发资源(可…

使用 stable-diffusion 入门级教程【Mac】

最近一直在短视频平台刷到AI生成的图片,质量也非常不错。术哥也跟我讲解了下如何安装使用。于是周末试了试。 也差点变成从入门到放弃了,所以也把过程中遇到的问题记录一下。 目前基本上运行正常,只是内存稍微小了点,把质量调低即…

创建一个electron-vite项目

前置条件:非常重要!!! npm: npm create quick-start/electronlatest yarn: yarn create quick-start/electron 然后进入目录,下载包文件,运行项目 到以上步骤,你已经成功运行起来一个 electr…

爬虫技术实战案例解析

目录 前言 案例背景 案例实现 案例总结 结语 前言 作者简介: 懒大王敲代码,计算机专业应届生 今天给大家聊聊爬虫技术实战案例解析,希望大家能觉得实用! 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!&#x1…

Flutter-底部弹出框(Widget层级)

需求 支持底部弹出对话框。支持手势滑动关闭。支持在widget中嵌入引用。支持底部弹出框弹出后不影响其他操作。支持弹出框中内容固定头部和下面列表时,支持触摸头部并在列表不在头部的时候支持滑动关闭 简述 通过上面的需求可知,就是在界面中可以支持…

机器学习-04-分类算法-04-支持向量机SVM

总结 本系列是机器学习课程的系列课程,主要介绍机器学习中分类算法,本篇为分类算法与SVM算法部分。 本门课程的目标 完成一个特定行业的算法应用全过程: 懂业务会选择合适的算法数据处理算法训练算法调优算法融合 算法评估持续调优工程化…

HTML5球体下落粒子爆炸特效

HTML5球体下落粒子爆炸特效,源码由HTMLCSSJS组成,双击html文件可以本地运行效果,也可以上传到服务器里面 下载地址 HTML5球体下落粒子爆炸特效

阿里云2核4G4M轻量应用服务器价格165元一年

阿里云优惠活动,2核4G4M轻量应用服务器价格165元一年,4Mbps带宽下载速度峰值可达512KB/秒,系统盘是60GB高效云盘,不限制月流量,2核2G3M带宽轻量服务器一年87元12个月,在阿里云CLUB中心查看 aliyun.club 当前…

数据结构—稀疏多项式相加

利用链表实现两个稀疏多项式相加。 代码 #include <iostream> using namespace std;// 定义多项式项结构体 typedef struct {int x; // 系数int y; // 指数 } Elemtype;// 定义链表节点结构体 typedef struct Node {Elemtype data;struct Node* next; } *LinkList, N…

数据结构中单向链表(无头)的学习

一.数据结构 1.定义 一组用来保存一种或者多种特定关系的数据的集合&#xff08;组织和存储数据&#xff09; 程序的设计&#xff1a;将现实中大量而复杂的问题以特定的数据类型和特定的存储结构存储在内存中&#xff0c; 并在此基础上实现某个特定的功能的操…

VSCode + PicGo + Github 实现markdown图床管理

目录 PicGo客户端VSvode插件 PicGo客户端 PicGo 是一个图片上传管理工具 官网&#xff1a;https://molunerfinn.com/PicGo/ github图传使用说明&#xff1a;https://picgo.github.io/PicGo-Doc/zh/guide/config.html#GitHub图床 步骤&#xff1a; 1、创建一个github公开仓库…

小程序搜索排名优化二三事

小程序的优化主要是排名优化和性能优化两个版块。性能优化这方面主要靠开发者自己完善&#xff0c;我们团队提供的服务就是把产品的排名打上去&#xff0c;获得更多的自然流量&#xff0c;实现盈利。 如何提升小程序的搜索排名主要从如下几个方面出发&#xff1a; 首先要知道…

2023新版mapinfo美化电子地图 新版2013Arcgis shp电子地图 下载

2023新版MapInfo和电子地图美化&#xff0c;以及2013版ArcGIS的SHP电子地图设计&#xff0c;是地理信息系统&#xff08;GIS&#xff09;领域中的两个重要话题。下面将分别对这两个主题进行描述。 样图&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1WB4AGsycyBGagVq5…

文心一言赋能问卷生成,打造高效问卷调研工具

当前&#xff0c;各种大语言模型&#xff08;LLM&#xff0c;Large Language Model&#xff09;井喷式发展&#xff0c;基于LLM的应用也不断涌现。但是&#xff0c;当开发者基于LLM开发下游应用时&#xff0c;LLM直接生成的结果在格式、内容等方面都存在许多不确定因素&#xf…

【数据结构和算法初阶(C语言)】二叉树的顺序结构--堆的实现/堆排序/topk问题详解---二叉树学习日记②

目录 ​编辑 1.二叉树的顺序结构及实现 1.1 二叉树的顺序结构 2 堆的概念及结构 3 堆的实现 3.1堆的代码定义 3.2堆插入数据 3.3打印堆数据 3.4堆的数据的删除 3.5获取根部数据 3.6判断堆是否为空 3.7 堆的销毁 4.建堆以及堆排序 4.1 升序建大堆&#xff0c;降序建小堆 4.2堆…

【C语言步行梯】一级指针、二级指针、指针数组等 | 指针详谈

&#x1f3af;每日努力一点点&#xff0c;技术进步看得见 &#x1f3e0;专栏介绍&#xff1a;【C语言步行梯】专栏用于介绍C语言相关内容&#xff0c;每篇文章将通过图片代码片段网络相关题目的方式编写&#xff0c;欢迎订阅~~ 文章目录 什么是指针&#xff1f;指针的大小指针类…

SpringMVC | SpringMVC中的“JSON数据交互“ 和“RESTful支持“

目录: 1.JSON 数据交互1.1 JSON概述1.2 JSON的“数据结构”对象结构数组结构 1.3 JSON的“数据转换” (JSON交互) 作者简介 &#xff1a;一只大皮卡丘&#xff0c;计算机专业学生&#xff0c;正在努力学习、努力敲代码中! 让我们一起继续努力学习&#xff01; 该文章参考学习教…

HUAWEI Pocket 2外屏实时查看App动态,小小窗口大便捷

当我们点外卖、等候飞机时&#xff0c;不少人习惯频繁点亮手机查看外卖配送进度、值机时间。 这时候&#xff0c;手机亮屏、解锁、打开对应App查看状态对于我们来说就显得非常繁琐。而华为Pocket 2结合HarmonyOS 4系统的实况窗功能&#xff0c;与常显外屏的搭配使用&#xff0…