图像处理 --- 二、数字图像处理基础

1. 色度学基础

电磁光波谱组成:

1.1 三基色原理

人眼的视网膜上存在大量能在适当亮度下分辨颜色的锥状细胞,它们分别对应红、绿、蓝三种颜色,即分别对红光、绿光、蓝光敏感。由此,红(R)、绿(G)、蓝(B)这三种颜色被称为三基色。

三基色原理:

自然界中的绝大部分色光都可以用特殊选定的三种基本单色光复合而成。

国际照明委员会(CIE)选择 红色(波长700.00nm), 绿色(波长546.1nm), 蓝色(波长435.8nm)三种颜色作为标色系统的三基色。

根据人眼的三基色吸收特性,人眼所感受到的颜色其实是三种基色按照不同比例的组合。

任意彩色C 可表示为:C = R + G + B

1.1.1 光的三基色

加色法

红+蓝=品红

红+绿=黄

绿+蓝=青

R+G+B=W

1.1.2 颜色的三基色

**减色法:**自然光照射在物体上,物体反射的光线即为物体的颜色(我们看到的光线)。

C=G+B=W-R(减红原色) 青

M=R+B=W-G(减绿原色) 品红

Y=R+G=W-B(减蓝原色) 黄

在印刷行业,以色料减色法为基础的基本模型为CMY,但是目前生产不出理想品质的幽默,所以实用模型是CMYK,其中K为黑色(作用:强调暗色,加深暗部色彩,因为实际应用中青色、品红、黄色叠加很难形成真正的黑色)

2. 颜色模型

人眼视觉的感受颜色可用色调(hue)、饱和度(saturation)和亮度(brightness)来表示。

  • 色调:它表示颜色的种类,取决于主波长;
  • 饱和度:表示颜色浓淡的物理量。通常用混入白光量的比例来衡量(加入白光越多即饱和度越低);
  • 亮度(灰度):人眼所感受到的颜色敏感程度的物理量。

CIE 色度图:

越接近边缘线,色度越饱和,越接近中心越欠饱和,中心为白色。边缘线上的颜色即为纯色。

2.1 颜色模型

各种表示颜色的方法,称作颜色模型。目前使用最多的是面向机器(如显示器、摄像机、打印机等)的RGB模型和面型颜色处理(也面向人眼视觉)的HSI(HSV)模型。

2.1.1 RGB模型

在三维直角坐标系中,用相互垂直的三个坐标轴代表R、G、B三个分量,并将R、G、B分别限定在[0,1],则该单位正方体代表颜色空间,其中的一个点就代表一种颜色。

其中远点代表黑色,离远点最远的点为白色,黑白之间的线上则为灰度值。

下图是:RGB24比特彩色立方体图像

在这里插入图片描述

2.1.2 HSI模型

HSI 模型利用颜色的三个属性色调H(hue)、饱和度S(saturation)和亮度I(intensity)组成一个表示颜色的圆柱体,如图:

2.1.3 RGB 和 HSI 之间的模型转换

1)RGB 转换到 HSI

公式:

2)HSI 转换到 RGB(三种情况)

3. 人的视觉特性

由于时间关系,后续再补充此节内容

4. 图像数字化

原理:图像数字化就是将一幅画面转化成计算机能处理的形式——数字图像的过程

在这里插入图片描述

  • 就是把一幅图画分割成如图的一个个小区域(像元或像素),并将各小区域 灰度用整数来表示,形成一幅点阵是的数字图像。

  • 它包括采样量化两个过程。像素的属性=(位置,灰度/颜色)。

4.1 图像数字化过程

一幅图像采样和量化后的函数,就可以表示为数字图像。

在这里插入图片描述

4.1.1 采样

  • 空间上连续的图像变换成离散点的操作称为采样。

  • 采样间隔:

    • 采样点之间的距离。

4.1.2 量化

  • 将像素灰度转换成离散的整数值的过程。
  • 一幅数字图像中不同灰度值的个数称为灰度级,用 G 表示一幅数字图像中不同灰度值的个数称为灰度级,用 G 表示。一般数字图像灰度技术G为2的整数幂,即 G=2g (2的g次方),g为量化bit数。若一幅数字图像的量化灰度级数G=256=2 8 级,灰度值范围0~255,常称为 8 bit 量化。
  • 图像数据量:一幅 M x N、 灰度级为G 的图像所需的存储空间 M x N x g (bit) 为图像数据量。

因此连续图像到数字图像的转化过程如下:

连续图像——> 采样 ——> 量化 ——> 数字图像。

4.2 采样、量化参数与数字化图像间的关系

4.2.1 采样

  • 采样间隔越大,所得图像像素越少,空间分辨率低,质量越差;
  • 采样间隔越小,所得图像像素越多,空间分辨率高,图像质量好,但数据大。

在这里插入图片描述

4.2.2 量化

  • 量化等级越多,所得图像层次越丰富,灰度分辨率越高,质量越好,但数据量大;

  • 量化等级越少,所得图像层次欠丰富,灰度分辨率越低,质量变差,会出现假轮廓现象,但数据量小。

在这里插入图片描述

4.3 数字图像的表示

数字图像用矩阵来描述:

以一幅数字图像 F 左上角像素中心为坐标原点,一幅 m x n 的数字图像用矩阵来表示为:

在这里插入图片描述

数字图像根据灰度级数的差异可分为:黑白图像、灰度图像和彩色图像。

4.3.1 黑白图像

图像的每个像素只能是黑或者白,没有中间的过渡,故又称二值图像。二值图像的像素值为0或者1。

在这里插入图片描述

4.3.2 灰度图像

每个像素的信息由一个量化的灰度来描述的图像,没有彩色信息。字节(8位)可表示256级灰度 [0,255]。

在这里插入图片描述

4.3.3 彩色图像

彩色图像是指每个像素有 R、G、B 分量构成的图像,其中 R、G、B 是由不同的灰度级来描述。3个字节(24位)可表示一个像素。

在这里插入图片描述

4.4 数字图像的特点

  • 信息量大:一幅遥感图像 N = 1024,G = 28 = 256,则容量 = N2K = 8Mb

  • 占用频带宽:

    ​ 与语音信息相比,图像信息占用的带宽要打几个数量级。处理难度大,成本高。这就对图像(频带)的压缩提出了必须的要求。

  • 像素间相关性大:

    • 同福图像相邻像素间具有相同(或相近)灰度的可能性;
    • 运动图像的相邻帧对应像素间的相关性更大。
    • 综上两点说明,图像压缩的可能性很大
  • 视觉效果的主观性大:

    • 图像是图和像的有机结合,在处理中充分考虑人的视觉特点。

5. 灰度直方图

5.1 概念

图像灰度直方图是反映一幅图像中各个灰度级像素出现的频率与灰度的关系。以灰度级为横坐标,频率为纵坐标,绘制频率同灰度级的关系图就是一幅弧度图像的直方图。它是图像的一个重要特征,反映了图像灰度分布的状况。

如图是一幅灰度直方图:

在这里插入图片描述

频率计算式为: Vi = ni /n ,

  • Vi 表示:灰度级为 i 像素出现的频率;
  • ni 表示:灰度级为 i 出现的像元个数;
  • n 表示:图像的总像素。

5.2 灰度直方图的性质

  • 灰度直方图只能反映图像的灰度分布情况,而不能反映图像像素的位置,即丢失了像素的位置信息。

  • 一幅图像对应唯一的灰度直方图,反之则不成立。不同的图像可对应相同的直方图。

    • 例如:
  • 一幅图像分成多个区域,多个区域的直方图之和即为原图像的直方图。

6. 像素间的基本关系

一幅图像由基本单元像素组成,像素间存在着一定的关系,包括邻域、邻接和连通,以及像素间的距离。

6.1 像素的邻域

对于任一像素(i,j),该像素周围的像素构成的集合{(i+p,j+p), p、q取合适的整数},叫做该像素的邻域。

  • 4——邻域 N4 §:包括水平和垂直4个邻近像素;
  • 8——邻域 N8 §:包括水平、垂直和对角8个邻近像素;
  • 对角邻域 ND §:包括对角的4个邻近像素。

在这里插入图片描述

6.2 邻接与连通

6.2.1 邻接

判断是否邻接有两个必要条件:

  • 两个像素是否邻域
  • 两个像素的灰度值满足特定的相似规则

令V 表示关于邻接的灰度值集合(相似准则)。

a、4-邻接:

像素p和q的灰度值都属于V,且q在集合N4 § 中,则称像素p和q是 4-邻接

b、8-邻接:

像素p和q的灰度值都属于V,且q在集合N8 § 中,则称像素p和q是 8-邻接

c、m-邻接:

像素p和q的灰度值都属于V,如满足下列条件之一:

1)、q在集合N4 § 中;

2)、q在集合ND §中,且集合 N4 §∩N4 (q) 中的像素的灰度值不属于V。

则称像素p和q是m-邻接的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/491897.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Bug调试(lldb)

原文网址:http://www.cnblogs.com/Twisted-Fate/p/4760156.html 今天博主有一些Bug调试的需求,遇到了一些困难点,在此和大家分享,希望能够共同进步. Xcode的Bug调试方法大概有以下几种: 1.断点,全局断点,条件断点配合Nslog找出Bug 2.静态分析工具:Analyze,静态检测内…

解密!谷歌这样搞定美军世纪难题,从眼科诊断到无人驾驶

来源:智东西导语:谷歌AI部门负责人Jeff Dean,在开发者大会中详细介绍了该公司如何利用AI技术解决科学问题。5月14日消息,在加利福尼亚州山景城举行的谷歌年度I / O开发者大会上,谷歌研究小组高级研究员、谷歌人工智能部…

CSDN中图片缩放与居中

1. 直接上传图片 代码示例: ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210628233911771.png?x-oss-processimage/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3poYl9mZW5n,size_16,color_FFFFFF,t_70#pic_cent…

tensorflow中创建多个计算图(Graph)

转自https://blog.csdn.net/dcrmg/article/details/79028032 tf中可以定义多个计算图,不同计算图上的张量和运算是相互独立的,不会共享。计算图可以用来隔离张量和计算,同时提供了管理张量和计算的机制。计算图可以通过Graph.device函数来指…

文体中心场地预订小程序开发笔记-功能设计

首页 1.推荐活动: 展示最新、最受欢迎或即将举办的文体活动。2.新闻与公告: 提供关于文体中心的最新新闻和通知。 活动浏览与报名 3.活动列表: 用户可以查看文体中心的各类文体活动,包括体育赛事、文艺演出、培训课程等。4.活动…

【剑指offer】面试题40:数组中只出现一次的数字

题目: 一个整型数组里除了两个数字之外,其他的数字都出现了两次。请写程序找出这两个只出现一次的数字。 思路: 因为只有两个只出现一次的数字,所以所有数字进行异或之后得到值res一定不是0.这样,res中其中至少1bit不是…

图像处理 --- 4.1 图像增强的点运算

1. 图像增强的点运算 1.1 概念 图像增强: 采用一系列计数改善图像的视觉效果,或将图像转换成一种更适合于人或机器进行分析和处理的形式。 1.2 图像增强的主要方法 按照图像的作用域来说: 空间域增强:直接对图像各种像素进行…

5G临时牌照或将发放,商用大幕已经开启

报告来源:广发证券、华泰证券、网络资料前 言:5月17日是世界电信日,业内认为这是5G临时牌照发放的重要时间点。日前中国联通在活动上表示,北京联通已率先开展面向商用的5G规模试验,近期北京将开始5G的试商用。这侧面印…

大三下 期中试卷

自己做的,仅供参考。对错自负 湛江师范学院2014-2015学年度第 2学期 期中试卷 科目:LINUX网络服务器管理 题号 一、 操作 二、 C 编程 三、 shell编程 四、 辩论 总分 评分 复核 分值 25 25 25 25 100 蔡广基 得分 得分…

tf.nn.dropout

转自:https://blog.csdn.net/huahuazhu/article/details/73649389 tf.nn.dropout是TensorFlow里面为了防止或减轻过拟合而使用的函数,它一般用在全连接层。 Dropout就是在不同的训练过程中随机扔掉一部分神经元。也就是让某个神经元的激活值以一定的概…

常用照片尺寸

常用照片尺寸对照表:

无人驾驶中用到的八大坐标系

本文来源:智车科技第一个叫作eci地心惯性坐标系(如图,红色o-xyz坐标系所示,低新惯性坐标系(i系)的原点位于地球原点,z轴沿地轴指向北极,x轴和y轴位于赤道平面内,与z轴满足…

np.random.get_state()

转自https://blog.csdn.net/Strive_For_Future/article/details/81210907 state np.random.get_state() 功能:获取随机生成器 np.random的状态 作用:常与np.random.set_state() 搭配使用。使随机生成器random保持相同的状态(state&#x…

c#之内置类型

内置类型:就是.NET Framework System命名空间中写好的类型。 下面看看C#都有哪些内置类型 上面的内置类型,除了string和object外,其他的都被称作简单类型。也可以把左边的看作C#类型的关键字,左边是类型的别名,关键字和…

图像处理 --- 三、图像变换 3.1图像变换的基本概念

1. 图像变换的基本概念 1.1 什么是变换 《线性代数》中: 线性空间中,如果x是一个向量,U 是一个矩阵,则:y U x ,定义了向量 x 到向量 y 的一个线性变换。 如果 n 阶矩阵 U 满足: UT U I ,称…

tf.parse_single_example

parse_single_example(serialized,features,nameNone,example_namesNone ) 参数: serialized:一个标量字符串张量,单个序列化的例子。features:一个 dict,映射功能键到 FixedLenFeature 或 VarLenFeature值。name&am…

全球5G专利能力榜T0P15出炉:谁是冠军?

来源:通信产业网第50个世界电信和信息社会日(5月17日)即将到来。在5G即将商用的关口,今年,世界电信日的主题定调为“缩小标准化差距”。实际上,标准专利对通信技术发展起着至关重要的作用,它不仅…

对于软件工程的理解

对软件工程的理解: 软件工程是一门研究用工程化方法构建和维护有效的、实用的和高质量的软件的学科。它涉及程序设计语言、数据库、软件开发工具、系统平台、标准、设计模式等方面。 不懂的问题: 1.软件工程是否需要很强的数学思维? 2.做软…

tf.train.Coordinator和tf.train.start_queue_runners

TensorFlow提供了两个类来实现对Session中多线程的管理:tf.Coordinator和 tf.QueueRunner,这两个类往往一起使用。 Coordinator类用来管理在Session中的多个线程,可以用来同时停止多个工作线程并且向那个在等待所有工作线程终止的程序报告…

图像处理 --- 三、图像变换 3.2 图像的几何变换

2. 图像的几何变换 图像几何变换是指用数学建模的方法来描述图像位置、大小、形状等变化。图像几何变换是图像处理及分析的基础。 图像的几何变换包括:图像平移、比例缩放、旋转和图像插值。 图像几何变换的实质:改变像素空间位置或估算新空间位置上的…