图像处理与视觉感知---期末复习重点(1)

文章目录

  • 一、概述
  • 二、图像处理基础
    • 2.1 视觉感知要素
    • 2.2 像素间的一些基本关系
      • 2.2.1 相邻像素
      • 2.2.2 连通性
      • 2.2.3 距离度量
    • 2.3 基本坐标变换
    • 2.4 空间变换与灰度值


一、概述

 1. 图像的概念及分类。
 图像是用各种观测系统以不同形式和手段观测客观世界而获得的、可以直接或间接作用于人的视觉系统而产生的视知觉实体。
 图像分为模拟图像和数字图像:(1) 模拟图像:二维空间和亮度都是连续值的图像。亮度值连续且不分等级。 (2) 数字图像:二维空间和亮度都是用有限数字数值表示的图像。

 2. 像素表示的矩阵、矢量形式。
 一幅图像可分解为许多个单元。每个基本单元叫做图像元素,简称像素。

在这里插入图片描述

 3. 图像工程的三个层次。

在这里插入图片描述

二、图像处理基础

2.1 视觉感知要素

 1. 亮度适应与辨别:
 (1) 主观亮度:即人眼感知到的亮度,是进入人眼的光强的对数函数。
 (2) 亮度适应现象:感知亮度不是亮度的简单函数。① 马赫带:视觉系统往往会在不同强度区域的边界处出现“ 下冲”或“上冲”现象(毛边)。② 同时对比:感知区域的亮度与背景亮度相关。

 2. 当在白天进入一个黑暗剧场时,在能看清并找到空座位时需要适应一段时间,试述发 生这种现象的视觉原理?
 答:人的视觉绝对不能同时在整个亮度适应范围工作,它是利用改变其亮度适应级来完成亮度适应的,即所谓的亮度适应范围。同整个亮度适应范围相比,能同时鉴别的光强度级的总范围很小。因此,白天进入黑暗剧场时,人的视觉系统需要改变亮度适应级,因此,需要适应一段时间,亮度适应级才能被改变。

2.2 像素间的一些基本关系

2.2.1 相邻像素

 1. 相邻像素:4邻域、D邻域、8邻域。

 2. 4邻域:像素 p ( x , y ) p(x,y) p(x,y) 的4邻域是 (x+1,y);(x-1,y);(x,y+1);(x,y-1)。用 N 4 ( p ) N_4(p) N4(p) 表示像素 p p p 的4邻域。

在这里插入图片描述

 3. D邻域:像素 p ( x , y ) p (x,y) p(x,y) 的D邻域是对角上的点 (x+1,y+1);(x+1,y-1);(x-1,y+1);(x-1,y-1)。用 N D ( p ) N_D(p) ND(p) 表示像素 p p p 的D邻域。

在这里插入图片描述

 4. 8邻域:像素 p ( x , y ) p(x,y) p(x,y) 的8邻域是4邻域的点+D邻域的点。用 N 8 ( p ) N_8(p) N8(p) 表示像素 p p p 的8邻域,即 N 8 ( p ) = N 4 ( p ) + N D ( p ) N_8(p)=N_4(p)+N_D(p) N8(p)=N4(p)+ND(p)

在这里插入图片描述

2.2.2 连通性

 1. 两个像素连通的两个必要条件是:两个像素的位置是否相邻;两个像素的灰度值是否满足特定的相 似性准则(或者是否相等)。

 2. 4连通:对于具有值 V V V 的像素 p p p q q q,如果 q q q 在集合 N 4 ( p ) N_4(p) N4(p) 中, 则称这两个像素是4连通的。

在这里插入图片描述

 3. 8连通:对于具有值 V V V 的像素 p p p q q q,如果 q q q 在集合 N 8 ( p ) N_8(p) N8(p) 中, 则称这两个像素是8连通的。

在这里插入图片描述

 4. 对于具有值 V V V 的像素 p p p q q q,如果: q q q 在集合 N 4 ( p ) N_4(p) N4(p) 中;或 q q q 在集合 N D ( p ) N_D(p) ND(p) 中,并且 N 4 ( p ) N_4(p) N4(p) N 4 ( q ) N_4(q) N4(q) 的交集为空(没有值V的像素)则称这两个像素是m连通的。

在这里插入图片描述

 5. 通路的定义:一条从具有坐标 ( x , y ) (x,y) (x,y) 的像素 p p p,到具有坐标 ( s , t ) (s,t) (s,t) 的像素 q q q 的通路,是具有坐标 ( x 0 , y 0 ) , ( x 1 , y 1 ) , . . . , ( x n , y n ) (x_0,y_0),(x_1,y_1),...,(x_n,y_n) (x0,y0)(x1,y1)...(xn,yn) 的不同像素的序列。其中, ( x 0 , y 0 ) = ( x , y ) (x_0,y_0)=(x,y) (x0,y0)=(x,y) ( x n , y n ) = ( s , t ) (x_n,y_n)=(s,t) (xn,yn)=(s,t) ( x i , y i ) (x_i,y_i) (xi,yi) ( x i − 1 , y i − 1 ) (x_{i-1},y_{i-1}) (xi1,yi1) 是邻接的, 1 ≤ i ≤ n 1 ≤ i ≤ n 1in n n n 是路径的长度。如果 ( x 0 , y 0 ) = ( x n , y n ) (x_0,y_0)=(x_n,y_n) (x0,y0)=(xn,yn),则该通路是闭合通路。

在这里插入图片描述

2.2.3 距离度量

 1. 基本定义如下:

在这里插入图片描述

在这里插入图片描述

 2. 一道例题如下,通过上面的公式可以解决下面题目中的距离问题。

在这里插入图片描述

在这里插入图片描述

2.3 基本坐标变换

 1. 坐标变换可借助矩阵写为: v ′ = T v v' =Tv v=Tv

在这里插入图片描述

 2. 例子:先放大2倍,然后旋转45度,然后再缩小0.5倍。

在这里插入图片描述

 3. 平移变换并不是矩阵乘法的形式,而是矩阵加法的形式。

在这里插入图片描述

 4. 改变图像的像素值,我们称为滤波(Filtering)。改变图像的像素位置,我们称为扭曲(Warping)。

在这里插入图片描述

 5. 转置变换:图像转置是指将图像像素的x坐标和y坐标互换。图像的大小会随之改变,高度和宽度将互换。

在这里插入图片描述

 6. 尺度变换(放缩变换):

在这里插入图片描述

 7. 旋转变换矩阵:

在这里插入图片描述

2.4 空间变换与灰度值

 1. 几何变换可在一幅图像中的像素间修改空间联系。几何变换通常又叫做橡皮片变换,因为它们可以被看做在一片橡皮片上打印图像,然后根据预先确定的规则拉伸这个橡皮片的过程。

 2. 在数字图像处理中,几何变换由两个基本操作组成:空间变换,它定义了图像平面上像素的重新安排;灰度级插补,处理空间变换后图像中像素灰度级的赋值。

 3. 空间变换:图显示了在失真和相应的校正图像中的四边形区域,四边的顶点是相应的 “连接点”。

 4. 灰度级插补:图像经几何位置校正后,在校正空间中各像点的灰度值等于被校正图像对应点的灰度值。一般校正后的图像某些像素点可能挤压在一起,或者分散开,不会恰好落在坐标点上,因此常采用内插法来求得这些像素点的灰度值。
 常用的有:最邻近插值法、双线性插值法(一阶插值)、高阶插值法。

 5. 最近邻插值法:计算与点 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 临近的四个点,将与点 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 最近的整数坐标点 ( x , y ) (x,y) (xy) 的灰度值取为 P ( x 0 , y 0 ) P(x_0,y_0) P(x0y0) 点灰度近似值。

在这里插入图片描述

 6. 线性插值法:

在这里插入图片描述

 7. 三阶插值:是指用 ( x , y ) (x ,y) (x,y) 周围的16个网格点灰度按三次多项式进行内插的高精度算法。

在这里插入图片描述

 8. 常用的灰度插值有几种,概括它们的优缺点:

  • 最邻近插值法, 这种方法简单但效果不太好。
  • 双线性插值(一阶插值):计算量大,但缩放后图像质量高,不会出现图像不连续的情况。
  • 高阶插值:计算量最大,插值后图像的视觉质量最好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/724808.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nodejs版本管理工具nvm安装和环境变量配置

1、下载nvm.exe https://github.com/coreybutler/nvm-windows/releases2、安装 1.在D盘根目录新建一个dev文件夹,在dev里面再新建一个nodejs。 2.双击下载好的nvm.exe 修改文件路径,且路径中不能有中文 3.安装完成后在D:\dev\nvm打开settings.txt&…

大模型交互-超拟人合成

1、超拟人合成:将文字转化为自然流畅的人声,在实时语音合成的基础上,精准模拟人类的副语言现象,如呼吸、叹气、语速变化等,使得语音不仅流畅自然,更富有情感和生命力。 2、唤醒的持久运行--->合成能力加…

kerberos学习系列一:原理

1、简介 Kerberos 一词来源于古希腊神话中的 Cerberus —— 守护地狱之门的三头犬。 Kerberos 是一种基于加密 Ticket 的身份认证协议。Kerberos 主要由三个部分组成:Key Distribution Center (即KDC)、Client 和 Service。 优势: 密码无需进行网络传…

Docker数据卷篇

1. 数据卷(容器数据管理) 引言:在之前的nginx案例中,修改nginx的html页面时,需要进入nginx内部。并且因为没有编辑器,修改文件也很麻烦。 这就是因为容器与数据(容器内文件)耦合带…

Scrapy与分布式开发(3):Scrapy核心组件与运行机制

Scrapy核心组件与运行机制 引言 这一章开始讲解Scrapy核心组件的功能与作用,通过流程图了解整体的运行机制,然后了解它的安装与项目创建,为后续实战做好准备。 Scrapy定义 Scrapy是一个为了爬取网站数据、提取结构性数据而编写的应用框架…

Claude3荣登榜首,亚马逊云科技为您提供先行体验!

Claude3荣登榜首,亚马逊云科技为您提供先行体验! 个人简介前言抢先体验关于Amazon BedrockAmazon Bedrock 的功能 Claude3体验教程登录Amazon Bedrock试用体验管理权限详细操作步骤1.提交应用场景详细信息2.请求模型的访问权限3.请求成功,开始…

【LeetCode】674. 最长连续递增序列(简单)——代码随想录算法训练营Day52

题目链接&#xff1a; 题目描述 给定一个未经排序的整数数组&#xff0c;找到最长且 连续递增的子序列&#xff0c;并返回该序列的长度。 连续递增的子序列 可以由两个下标 l 和 r&#xff08;l < r&#xff09;确定&#xff0c;如果对于每个 l < i < r&#xff0c…

Mybatis实现分页查询数据(代码实操讲解)

在MyBatis中实现分页查询的常见方式有两种&#xff1a;使用MyBatis内置的分页插件如PageHelper&#xff0c;或者手动编写分页的SQL语句。下面我将为你提供两种方式的示例代码。 使用PageHelper分页插件 首先&#xff0c;确保你的项目中已经添加了PageHelper的依赖。在Maven项…

overleaf latex 笔记

overleaf: www.overleaf.com 导入.tex文件 1.代码空一行&#xff0c;代表文字另起一段 2. 1 2 3 排序 \begin{enumerate} \item \item \item \end{enumerate} 3.插入图片 上传图片并命名 \usepackage{float}导包\begin{figure}[H]&#xff1a;表示将图…

面试题--02

粘包问题 粘包问题是在TCP协议下&#xff0c;发送方发送的多个数据包在接收方接收时&#xff0c;数据之间没有明确的分界线&#xff0c;导致接收方无法正确区分每个数据包&#xff0c;从而无法正确读取数据。 解决办法&#xff1a; 1、服务器和客户端提前协商好每个消息的长度…

数据分析Pandas专栏---第十四章<Pandas训练题(中)>

前言: 继续上一篇: 数据分析Pandas专栏---第十三章&#xff1c;Pandas训练题(初)&#xff1e;-CSDN博客 正文: 题1: 如何将DataFrame的列按照指定的顺序进行排序&#xff1f; 题目&#xff1a; 给定一个DataFrame&#xff0c;包含订单编号、商品名称、商品数量等列&…

【网络安全】漏洞挖掘入门教程(非常详细),小白是如何挖漏洞(技巧篇)0基础入门到精通!

温馨提示&#xff1a; 初学者最好不要上手就去搞漏洞挖掘&#xff0c;因为漏洞挖掘需要很多的系统基础知识和一些理论知识做铺垫&#xff0c;而且难度较大…… 较合理的途径应该从漏洞利用入手&#xff0c;不妨分析一些公开的CVE漏洞。很多漏洞都有比较好的资料&#xff0c;分…

【四】【SQL Server】如何运用SQL Server中查询设计器通关数据库期末查询大题

数据库学生选择1122 数据库展示 course表展示 SC表展示 student表展示 数据库学生选课1122_3 第十一题 第十二题 第十三题 第十四题 第十五题 数据库学生选课1122_4 第十六题 第十七题 第十八题 第十九题 第二十题 数据库学生选课1122_5 第二十一题 第二十二题 结尾 最后&…

保留数据的重装系统教程!(win10系统)

上车警告&#xff01;&#xff01;&#xff01; 本教程无需思考&#xff0c;跟着操作一步一步来就能完成系统的重装。原理是将C盘系统重装&#xff0c;其他盘符数据保存。适用于系统盘重装数据或更改系统版本。 重要提示&#xff01;&#xff01;&#xff01; C盘有重要学习资…

Long-term Correlation Tracking LCT目标跟踪算法原理详解(个人学习笔记)

目录 1. 算法总览2. 算法详解2.1. 基础相关滤波跟踪2.2. 各模块详解2.2.1. 相关跟踪2.2.2. 在线检测器 3. 算法实现3.1. 算法步骤3.2. 实现细节 4. 相关讨论&总结 1. 算法总览 LCT的总体流程如上图所示&#xff0c;其思想为&#xff1a;将长时跟踪&#xff08;long-term tr…

第五节 JDBC驱动程序类型

JDBC驱动程序是什么&#xff1f; JDBC驱动程序在JDBC API中实现定义的接口&#xff0c;用于与数据库服务器进行交互。 例如&#xff0c;使用JDBC驱动程序&#xff0c;可以通过发送SQL或数据库命令&#xff0c;然后使用Java接收结果来打开数据库连接并与数据库进行交互。 JDK…

18.四数之和

题目&#xff1a;给你一个由 n 个整数组成的数组 nums &#xff0c;和一个目标值 target 。请你找出并返回满足下述全部条件且不重复的四元组 [nums[a], nums[b], nums[c], nums[d]] &#xff08;若两个四元组元素一一对应&#xff0c;则认为两个四元组重复&#xff09;&#x…

(力扣题库)字符串相乘(C++)

题意如下&#xff1a; 给定两个以字符串形式表示的非负整数 num1 和 num2&#xff0c;返回 num1 和 num2 的乘积&#xff0c;它们的乘积也表示为字符串形式。 注意&#xff1a;不能使用任何内置的 BigInteger 库或直接将输入转换为整数。 示例 1: 输入: num1 "2"…

每日一题 — 有效三角形的个数

611. 有效三角形的个数 - 力扣&#xff08;LeetCode&#xff09; 思路&#xff1a; 双指针思想&#xff0c;先将数据排序 然后先固定最大的数Max&#xff0c;也就是数组最后的数再定义一左一右两个下标 left 、 right&#xff0c;当这个值相加大于最大的数&#xff0c;那么他两…

Pytorch学习 day05(RandomCrop、Transforms工具使用总结)

RandomCrop 将PIL或Tensor格式的输入图片&#xff0c;随机裁剪指定尺寸的部分输入尺寸可以为序列或单个整形数字代码如下&#xff1a; from PIL import Image from torchvision import transforms from torch.utils.tensorboard import SummaryWriterimg Image.open("i…