数字图像基础

数字图像基础

人眼感知视觉

  • 锥状体(亮视觉)+ 杆状体(暗视觉)
  • 人的视觉系统感知的亮度是进入人眼光强的对数函数
  • 亮度适应现象: 视觉系统不能同时在一个范围内工作,而通过改变其整个灵敏度来实现

光与电磁波谱

  • 可见光波长范围:0.43微米-0.79微米
  • 单色光的唯一属性是强度,也称灰度
  • 彩色光属性:发光强度、光通量和亮度

图像感知与获取

  • 滤光器 + 传感器(光二极管)
  • f ( x , y ) = i ( x , y ) r ( x , y ) f(x, y) = i(x, y) r(x, y) f(x,y)=i(x,y)r(x,y),其中 i ( x , y ) i(x, y) i(x,y) r ( x , y ) r(x, y) r(x,y) 分别为入射分量和反射分量

图像取样与量化

  • 目的:将连续的图像转换为数字形式
  • 对坐标值进行数字化为取样;对幅值数字化称为量化
  • 量化的精度依赖于所用的离散级数和取样信号的噪声
  • 数字图像表示
    • 显示成灰度阵列
    • 显示为二维数字阵列
  • 离散灰度级
    • 为了便于储存,常取2的整数次幂
    • 动态范围:系统中最大可度量灰度与最小可检测灰度之比
      • 上限取决于饱和度,下限取决于噪声
    • 对比度:图像中最高与最低灰度级间的灰度差
    • k 比特图像:图像有 2 k 2^k 2k 个灰度级,需要 M × N × k M\times N\times k M×N×k 比特来储存
  • 空间分辨率
    • 度量方法:每单位距离线对数和每单位距离像素数
  • 灰度分辨率
    • 定义:用于量化灰度的比特数,一般为8比特
  • 图像内插
    • 基本的图像重取样方法,通过内插来调整图像的大小
    • 最邻近内插:会导致某些直边缘的严重失真
    • 双线性内插: v ( x , y ) = a x + b y + c x y + d v(x,y)=ax+by+cxy+d v(x,y)=ax+by+cxy+d
    • 双三次内插: v ( x , y ) = ∑ i = 0 3 ∑ j = 0 3 a i , j x i y j v(x,y)=\sum^3_{i=0}\sum^3_{j=0}a_{i,j}x^iy^j v(x,y)=i=03j=03ai,jxiyj
  • 像素间基本关系
    • 相邻像素(4邻域): ( x + 1 , y ) , ( x − 1 , y ) , ( x , y + 1 ) , ( x , y − 1 ) (x+1,y),(x-1,y),(x,y+1),(x,y-1) (x+1,y),(x1,y),(x,y+1),(x,y1)
    • 对角相邻像素(与相邻像素共称为8邻域): ( x − 1 , y + 1 ) , ( x + 1 , y + 1 ) , ( x − 1 , y − 1 ) , ( x + 1 , y − 1 ) (x-1,y+1),(x+1,y+1),(x-1,y-1),(x+1,y-1) (x1,y+1),(x+1,y+1),(x1,y1),(x+1,y1)
    • 邻接性、连通性、区域与边界
      • 4邻接、8邻接、m邻接
      • 闭合通路、连通分量、联通集
      • 内边界、外边界
      • 一个有限区域的边界形成一条闭合通路
  • 距离度量
    • 距离或度量必须满足三个条件:
      • D ( p , q ) ≥ 0 D(p,q)≥0 D(p,q)0 D ( p , q ) = 0 D(p,q)=0 D(p,q)=0 当且仅当 p = q p=q p=q
      • D ( p , q ) = D ( q , p ) D(p,q)=D(q,p) D(p,q)=D(q,p)
      • D ( p , z ) ≤ D ( p , q ) + D ( q , z ) D(p,z)≤D(p,q)+D(q,z) D(p,z)D(p,q)+D(q,z)
    • 欧式距离: D e ( p , q ) = [ ( x − s ) 2 + ( y − t ) 2 ) ] 1 2 D_e(p,q)=[(x-s)^2+(y-t)^2)]^{\frac{1}{2}} De(p,q)=[(xs)2+(yt)2)]21
    • D 4 D_4 D4(城市街区距离): D 4 ( p , q ) = ∣ x − s ∣ + ∣ y − t ∣ D_4(p,q)=|x-s|+|y-t| D4(p,q)=xs+yt
      • 其中 D 4 = 1 D_4 = 1 D4=1 的像素是 ( x , y ) (x,y) (x,y) 的4邻域
    • D 8 D_8 D8 (棋盘距离): D 8 ( p , q ) = m a x ( ∣ x − s ∣ , ∣ y − t ∣ ) D_8(p,q)=max(|x-s|,|y-t|) D8(p,q)=max(xs,yt)
      • 其中 D 8 = 1 D_8 = 1 D8=1 的像素是 ( x , y ) (x,y) (x,y) 的8邻域
  • 数学工具
    • 阵列与矩阵操作
    • 线性操作与非线性操作
    • 算术操作:对应像素间的加减乘除
      • 对含噪声图片进行图像平均
      • 增强差别的图像相减
      • 使用图像相乘或相除来矫正阴影
      • 图像标准化操作(0-K): f m = f − m i n ( f ) ; f s = K [ f m / m a x ( f m ) ] f_m=f-min(f);\ f_s=K[f_m/max(f_m)] fm=fmin(f); fs=K[fm/max(fm)]
    • 集合与逻辑操作
      • 灰度图像的补集: A c = { ( x , y , K − z ∣ ( x , y , z ) ∈ A } A^c=\{(x,y,K-z|(x,y,z)\in A\} Ac={(x,y,Kz(x,y,z)A}
      • 灰度图像的并集: A ⋃ B = { m a x z ( a , b ) ∣ a ∈ A , b ∈ B } A\bigcup B=\{max_z(a,b)|a\in A,b \in B\} AB={maxz(a,b)aA,bB}
    • 空间操作
      • 单像素操作:以灰度为基础直接改变单个像素的值, s = T ( z ) s=T(z) s=T(z)
        邻域操作:如取平均, g ( x , y ) = 1 m n ∑ ( r , c ) ∈ S x y f ( r , c ) g(x,y)=\frac{1}{mn}\sum _{(r,c)\in S_{xy}}f(r,c) g(x,y)=mn1(r,c)Sxyf(r,c)
      • 几何空间变换与图像配准:仿射变换
    • 向量与矩阵操作
    • 图像变换:对输入图像进行变换,在变换域执行指定的任务,再用反变换返回空间域
      • 二维线性变换
        T ( u , v ) = ∑ u = 0 M − 1 ∑ v = 0 N − 1 f ( x , y ) r ( x , y , u , v ) T(u,v)=\sum^{M-1}_{u=0}\sum^{N-1}_{v=0}f(x,y)r(x,y,u,v) T(u,v)=u=0M1v=0N1f(x,y)r(x,y,u,v)
        f ( x , y ) = ∑ u = 0 M − 1 ∑ v = 0 N − 1 T ( u , v ) s ( x , y , u , v ) f(x,y)=\sum^{M-1}_{u=0}\sum^{N-1}_{v=0}T(u,v)s(x,y,u,v) f(x,y)=u=0M1v=0N1T(u,v)s(x,y,u,v)
        其中, r ( x , y , u , v ) r(x,y,u,v) r(x,y,u,v) 称为正变换核, s ( x , y , u , v ) s(x,y,u,v) s(x,y,u,v) 称为反变换核
    • 概率方法
      z i , i = 0 , 1 , 2 , … L − 1 z_i,i=0,1,2,…L-1 zi,i=012L1 表示一幅 M × N M×N M×N 大小数字图像中所有可能的灰度值
      • 灰度级 z k z_k zk 出现的概率: p ( z k ) = n k M N p(z_k)=\frac{n_k}{MN} p(zk)=MNnk
      • 平均灰度: m = ∑ k = 0 L − 1 p ( z k ) = 1 m=\sum^{L-1}_{k=0}p(z_k)=1 m=k=0L1p(zk)=1
      • 灰度的方差: σ 2 = ∑ k = 0 L − 1 ( z k − m ) 2 p ( z k ) \sigma^2=\sum^{L-1}_{k=0}(z_k-m)^2p(z_k) σ2=k=0L1(zkm)2p(zk)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/70782.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这几招真管用!找回丢失的iPhone的好方法!

你昂贵的iPhone不见了。它丢了吗?它被偷了吗?如果你把iPhone弄丢了,你可以从各种其他来源找到它,包括iPad、Mac、iCloud和Apple Watch。 你可以使用iCloud网站上的苹果“查找我的”应用程序、你的任何其他苹果设备或你家人注册的设备来追踪它。或者从“查找我的”应用程序…

Java基础知识点汇总

一、Java基础知识点整体框架 详细知识点见链接资源,注:框架是用Xmind App完成,查看需下载。 二、基础知识各部分概况 2.1 认识Java 2.2 数据类型和变量 2.3 运算符 2.4 程序逻辑控制 2.5 方法的使用 2.6 数组的定义和使用 2.7 类和对象 2.8 …

移植STM32官方加密库STM32Cryptographic

感谢这位博主,文章具有很高的参考价值: STM32F1做RSA,AES数据加解密,MD5信息摘要处理_我以为我爱了的博客-CSDN博客 概述 ST官方在很多年前就推出了自己的加密库,配合ST芯片用起来非常方便,支持ST的所有…

借助CIFAR10模型结构理解卷积神经网络及Sequential的使用

CIFAR10模型搭建 CIFAR10模型结构 0. input : 332x32,3通道32x32的图片 --> 特征图(Feature maps) : 3232x32即经过32个35x5的卷积层,输出尺寸没有变化(有x个特征图即有x个卷积核。卷积核的通道数与输入的通道数相等,即35x5&am…

使用U盘同步WSL2中的git项目

1、将U盘挂载到WSL2中 假设U盘在windows资源管理器中被识别为F盘,需要在WSL2中创建一个目录挂载U盘 sudo mkdir /mnt/f sudo mount -t drvfs F: /mnt/f后续所有的操作都完成后,拔掉U盘前,可以使用下面的命令从WSL2中安全的移除U盘 umount …

SpringCloud(十)——ElasticSearch简单了解(一)初识ElasticSearch和RestClient

文章目录 1. 初始ElasticSearch1.1 ElasticSearch介绍1.2 安装并运行ElasticSearch1.3 运行kibana1.4 安装IK分词器 2. 操作索引库和文档2.1 mapping属性2.2 创建索引库2.3 对索引库的查、删、改2.4 操作文档 3. RestClient3.1 初始化RestClient3.2 操作索引库3.3 操作文档 1. …

网络技术二十二:NATPPP

NAT 转换流程 产生背景 定义 分类 常用命令 PPP PPP会话建立过程 认证 PPP会话流程

第 3 章 栈和队列(循环队列的顺序存储结构实现)

1. 背景说明 和顺序栈相类似,在队列的顺序存储结构中,除了用一组地址连续的存储单元依次存放从队列头到队列尾的元素之外, 尚需附设两个指针 front 和 rear 分别指示队列头元素及队列尾元素的位置。约定:初始化建空队列时&#x…

qt nodeeditor编译安装

目录 1. 下载源码 2. Qt creator编译源码 2.1 编译debug模式 (MinGW) 2.2 编译release模式 (MinGW) 1. 下载源码 https://github.com/paceholder/nodeeditor/archive/refs/tags/3.0.10.zip 2. Qt creator编译源码 解压文件…

error:0308010C:digital envelope routines::unsupported

Vue 报错error:0308010C:digital envelope routines::unsupported 出现这个错误是因为 node.js V17版本中最近发布的OpenSSL3.0, 而OpenSSL3.0对允许算法和密钥大小增加了严格的限制,可能会对生态系统造成一些影响. 方法1 打开终端(按健winR弹出窗口&a…

Java 数据库改了一个字段, 前端传值后端接收为null问题解决

前端传值后端为null的原因可能有很多种,我遇到一个问题是,数据库修改了一个字段,前端传值了,但是后台一直接收为null值, 原因排查: 1、字段没有匹配上,数据库字段和前端字段传值不一致 2、大…

c语言 4.0

💂 个人主页: 程序员爱摸鱼🤟 版权: 本文由【程序员爱摸鱼】原创、在CSDN首发、需要转载请联系博主💬 如果文章对你有帮助、欢迎关注点赞收藏(一键三连)哦💅 想寻找共同成长的小伙伴,可以互粉哦 💬文章目录…

软件架构设计(六) 软件架构风格-MDA(模型驱动架构)

概念 模型驱动架构MDA, 全称叫做Model Driven Architecture。 Model:表示客观事物的抽象表示Architecture:表示构成系统的部件,连接件及其约束的规约Model Driven: 使用模型完成软件的分析,设计,构建,部署和维护等 开发活动MDA起源于分离系统规约和平台实现的思想。之前…

stable diffusion实践操作-复制-清空-保存提示词

系列文章目录 stable diffusion实践操作 stable diffusion实践操作-webUI教程 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 系列文章目录前言一、右上生成图标附近按钮介绍1. 箭头介绍(复现别人的…

视频汇聚/视频云存储/视频监控管理平台EasyCVR启动时打印starting server:listen tcp,该如何解决?

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同,可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.265自动转码H.264、平台级联等。为了便于用户二次开发、调用与集成,…

JSON是什么?认识 json

目录 一 Json定义 二 Json语法规则 三 json 的代码演示 一 Json定义 轻量级的文本数据交换格式具有自我描述性【看到某个Json数据就能知道它的特点】比xml传输速度快【跨平台】 二 Json语法规则 (1)语法 两种数据结构:对象和数组 大括号…

FlinkCDC 菜鸟教程-文章目录

系列文章目录 背景篇 环境篇 准备一台已经安装了 Docker 的 Linux 或者 MacOS 电脑。准备教程所需要的组件版本对应关系安装环境检查 工具篇 flinkkibana 概念篇 Docker 介 绍Docker Compose 介 绍Kibana介 绍 实践篇 演示: Mysql CDC 导入 Elasticsearch 启动服务准备…

数据结构与算法学习(day3)——快速排序

文章目录 前言复习冒泡排序时遇到的问题快速排序 前言 (1)在本章的学习此前,需要复习前一章的内容,动手敲一遍解题。上一章讲的是冒泡排序算法,我在回顾的时候重新敲了一遍重新,就发了一些问题,…

极客时间:数据结构与算法之美【学习笔记+思考实践】

本篇是 《极客时间:数据结构与算法之美》课程的学习笔记和带有自己的一些思考实践。原文学习链接如下:https://time.geekbang.org/column/intro/100017301 开篇词 | 从今天起,跨过“数据结构与算法”这道坎01 | 为什么要学习数据结构和算法&a…

java面试题-spring与mybatis框架面试题

spring与mybatis框架面试题 面试官:Spring框架中的单例bean是线程安全的吗? 候选人: 嗯! 不是线程安全的,是这样的 当多用户同时请求一个服务时,容器会给每一个请求分配一个线程,这是多个线程会…