matplotlib与opencv图像读取与显示的问题

个人博客:Sekyoro的博客小屋
个人网站:Proanimer的个人网站

最近在用opencv和matplotlib展示图片,但是遇到了一些问题,这里展开说说
首先需要明确的是,opencv和matplotlib读取图片都是通道在最后,而前者默认可见光图像是BGR,后者是RGB.此外还有PIL以及imageio等读取图像的工具,这里不一一赘述.

Opencv

对于opencv,使用cv2.imshow,cv2.imread以及cv2.imwrite来读写以及显示.

imshow

显示图像的缩放取决于图像深度:
对 8 位无符号图像,按原样显示;
对 16 位无符号或 32 位整数图像,将像素值范围 [0,255*255] 映射到 [0,255] 显示;
对 32 位浮点图像,将像素值范围 [0,1] 映射到 [0,255] 显示;

当cv2.imshow()处理图像深度为CV_8U(默认范围为[0,255])时,按原数据显示;

当处理图像深度为CV_16U(默认范围为[0,65535])时,除以256,映射到[0,255];

当图像深度为CV_32F和CV_64F时(默认范围为[0,1]),乘以255映射到[0,255],超过255直接饱和;

当输入负数时,当作0来处理

import numpy as np
import cv2img = np.zeros((500, 500, 1))
print(img.dtype)
img[150:170, 150:350] = 10
img[250:270, 150:350] = -1
img[350:370, 150:350] = -10
print(img[350:170, 150:350])
cv2.imshow('img', img)
cv2.waitKey()

由于numpy默认类型float64,浮点数会乘以255,所以只有最上面有一条白线.负值直接黑色

image-20231116201141606
import numpy as np
import cv2
# 新建numpy数组,注意np.zero()创建的数据类型为float64
img = np.zeros((500, 500, 1))
print(img.dtype)
img[150:170, 150:350] = 10
img[250:270, 150:350] = 255
img[350:370, 150:350] = 1
print(img[350:170, 150:350])
cv2.imshow('img', img)
cv2.waitKey()
image-20231116201615437

而如果是大于1的浮点数,也是直接饱和.

如果是uint8,如果超出255,则会被numpy截取,也就是取模

img = np.zeros((500, 500, 1),dtype=np.uint8)
print(img.dtype)
img[150:170, 150:350] = 10
img[250:270, 150:350] = 20
img[350:370, 150:350] = 30
cv2.imshow('img', img)
print(img[350:370, 150:350])
cv2.waitKey()
image-20231116201823217
img = np.zeros((500, 500, 1),dtype=np.uint8)
print(img.dtype)
img[150:170, 150:350] = 10
img[250:270, 150:350] =  512
img[350:370, 150:350] = 255
cv2.imshow('img', img)
print(img[250:270, 150:350])
cv2.waitKey()

打印img[250:270, 150:350]的值发现是0

image-20231116202123379
img = np.zeros((500, 500, 1))
print(img.dtype)
img[150:170, 150:350] = 10
img[250:270, 150:350] =  512
img[350:370, 150:350] = 255
cv2.imshow('img', img)
print(img[250:270, 150:350])
cv2.waitKey()
image-20231116202222468

所以这涉及两个问题,一个是本身numpy的截取另一个是opencv的截取机制.

img = np.zeros((500, 500, 1), dtype=np.uint16)
print(img.dtype)
img[150:170, 150:350] = 2
img[250:270, 150:350] = 255*255
img[350:370, 150:350] = 255*100
cv2.imshow('img', img)
cv2.waitKey(0)
print(img[250:270, 150:350])
cv2.imwrite("test.png", img)
image-20231116202916344

如果是16位无符号整数,会除以255.

最后注意,如果是int32可能会报错

imwrite

机制与imshow类似,不过会根据保存文件的后缀进行编码参数.

cv2.imwrite() 能保存 BGR 3通道图像,或 8 位单通道图像、或 PNG/JPEG/TIFF 16位无符号单通道图像

注意:如果保存float32的图像值超过了1,此时会与imshow机制不同,表现为值被归到0-255

a = np.ones([255,255,1],dtype=np.float32)
a[0:255,0:255] = 10
print(a)
cv2.imshow("img",a)
cv2.waitKey()
cv2.imwrite("test.png",a)

在这里插入图片描述

image-20231116222107874

上面有两张图,分别是imwrite的图片与imshow的图片,由于是浮点数,imshow展示时乘了255导致饱和白色.所以会说imwrite对浮点数不友好,不符合imshow的道理,

imread

注意如果有通道则通道在最后,可以设置

IMREAD_UNCHANGED = -1, //如果设置,则返回的数据带有alpha通道(R,G,B,A 四个通道),否则没有alpha通道
IMREAD_GRAYSCALE = 0, //如果设置,则将图像转换为单通道灰度图像
IMREAD_COLOR = 1, //如果设置,则将图像转换成3通道BGR彩色图像
IMREAD_ANYDEPTH = 2, //如果设置,则在输入具有相应深度时返回16位/32位图像,否则将其转换为8位
IMREAD_ANYCOLOR = 4, //如果设置,则图像可能以任何颜色格式读取
IMREAD_LOAD_GDAL = 8, //如果设置,使用gdal驱动程序加载图像
IMREAD_REDUCED_GRAYSCALE_2 = 16, //如果设置,总是将图像转换为单通道灰度图像且图像大小减少1/2
IMREAD_REDUCED_COLOR_2 = 17, //如果设置,总是将图像转换为3通道BGR彩色图像且图像大小减少1/2
IMREAD_REDUCED_GRAYSCALE_4 = 32, //如果设置,总是将图像转换为单通道灰度图像且图像大小减少1/4
IMREAD_REDUCED_COLOR_4 = 33, //如果设置,总是将图像转换为3通道BGR彩色图像且图像大小减少1/4
IMREAD_REDUCED_GRAYSCALE_8 = 64, //如果设置,总是将图像转换为单通道灰度图像且图像大小减少1/8
IMREAD_REDUCED_COLOR_8 = 65, //如果设置,总是将图像转换为3通道BGR彩色图像且图像大小减少1/8
IMREAD_IGNORE_ORIENTATION = 128 //如果设置,不会根据EXIF的方向标志旋转图像

Matplotlib

imshow

主要讲讲matplotlib的imshow

matplotlib在imshow时,如果接收到的是二维矩阵,会自动归一化,映射到彩色。如果输入的矩阵里面值都是一样的,归一化会把他们全部变为255,也就是呈现黑色。

用于在使用 cmap 映射到颜色之前将标量数据缩放到 [0, 1] 范围的归一化方法。默认情况下,使用线性缩放,将最低值映射到 0,将最高值映射到 1。

imshow的输入

图像数据。支持的数组形状有:(M,N):具有标量数据的图像。使用归一化和颜色图将值映射到颜色。请参阅参数norm、cmap、vmin、vmax。

(M, N, 3):具有 RGB 值(0-1 float 或 0-255 int)的图像。

(M, N, 4):具有 RGBA 值(0-1 float 或 0-255 int)的图像,即包括透明度。前两个维度(M、N)定义图像的行和列。超出范围的 RGB(A) 值将被剪裁。

所以如果使用单通道的数据,会默认norm,而这种norm是根据输入值的min-max进行norm,并不是norm到0-255

image-20231116210309620

img = torch.ones(152,152,1,dtype=torch.uint8)*220
img = img.numpy()
plt.imshow(img,cmap="gray")
plt.show()

解决办法是设置vmin=0,vmax=255,当然使用三通道也可以

image-20231116210559535

相关问题

  1. matplotlib 可视化图像明明255,结果出来全为黑色的问题_plt.imshow 不加vmin和vmax参数是全黑的_佳hong的博客-CSDN博客
  2. 有关函数cv2.imshow()处理不同图像深度时的数据转化问题_cv2.cv_8u图像深度-CSDN博客这篇文章有点问题,目前opencv将负值作为0处理
  3. opencv中imwrite对float的处理 - siren27 - 博客园 (cnblogs.com)
  4. 【精选】使用 tiff/png 文件类型对 uint16_t/float 数据类型存取的无聊实验_float存储方式和uint16-CSDN博客

如有疑问,欢迎各位交流!

服务器配置
宝塔:宝塔服务器面板,一键全能部署及管理
云服务器:阿里云服务器
Vultr服务器
GPU服务器:Vast.ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/204805.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用cpolar+Plex在Windows系统上搭建私人媒体影音站点公网可访问

文章目录 1.前言2. Plex网站搭建2.1 Plex下载和安装2.2 Plex网页测试2.3 cpolar的安装和注册 3. 本地网页发布3.1 Cpolar云端设置3.2 Cpolar本地设置 4. 公网访问测试5. 结语 1.前言 用手机或者平板电脑看视频,已经算是生活中稀松平常的场景了,特别是各…

ERP软件定制开发对企业的优势|app小程序搭建

ERP软件定制开发对企业的优势|app小程序搭建 随着科技的不断发展,企业管理也面临了更多的挑战。为了更好地适应市场需求和提高运营效率,越来越多的企业开始选择使用ERP软件进行管理。然而,市场上现成的ERP软件并不能完全满足企业的需求&#…

兰州电力博物馆 | OLED透明展示台:创新展示,增强互动体验

产品:8片55寸OLED透明屏 应用场景:OLED透明屏利用其高透明度的特点,可以叠加在文物展示台上面,这种展示方式既让观众看到了文物原貌,又能了解其内部结构和细节特点,打破空间的束缚。 项目时间&#xff1a…

opencv知识库:cv2.add()函数和“+”号运算符

需求场景 现有一灰度图像,需求是为该图像增加亮度。 原始灰度图像 预期目标图像 解决方案 不建议的方案——“”运算符 假设我们需要为原始灰度图像的亮度整体提升88,那么利用“”运算符的源码如下: import cv2img_path r"D:\pych…

SCADA软件工具有多少免费的?

随着工业自动化的飞速发展,SCADA系统已经成为工业领域智能化转型绕不开的重要工具,不少个人和公司也都加入到了学习研究SCADA系统的队伍中。数维图小编耗费大量时间整理了国内外免费(非完全免费)的SCADA软件工具,有部分…

电源模块测试系统测试稳压电源 提升电源稳定性和可靠性

稳压电源是用来将不稳定的电压转换为稳定的输出电压的电子装置,其性能、稳定性和可靠性直接影响着工作状态。稳压电源测试是保证电子设备稳定工作的重要环节,那么如何测试稳压电源呢? 一、静态测试 静态测试是通过万用表或数字电压表测量稳压电源的输出…

ComplexHeatmap热图专栏 | 6. 3D热图绘制教程

本期教程 原文链接https://mp.weixin.qq.com/s/EyBs6jn78zOomcTv1aP52g 6 3D热图的绘制教程 基于《热图绘制教程》专栏,本教程已更新了5个章节,不知道大家是否有所收获。对于小杜个人来说,真的需要不断的复习和练习才可以记住,但…

RedHat9中安装Mysql8.0+出现“错误:GPG 检查失败“的处理

近期通过VM安装了RedHat9,之后在RedHat9中安装Mysql8.0的时候出现了个问题:“错误:GPG 检查失败”,如图所示: 解决方案:重新导入新的秘钥即可,如下所示: rpm --import https://rep…

vr建筑虚拟实景展厅漫游体验更直观全面

随着科技的不断进步,纯三维、可交互、轻量化的三维线上展览云平台,打破时间界限,以其独特的魅力,给予客户更多的自主性、趣味性和真实性,客户哪怕在天南地北,通过网络、手机即可随时随地参观企业线上立体化…

泳道图绘制全攻略,一图胜千言,快速上手

泳道图是一种流程图的形式,通过在不同的泳道中展示不同的参与者,帮助我们更好地理解和分析流程。它是一种非常有用的工具,可以帮助我们在团队协作、流程管理和问题解决等方面取得更好的效果。 1. 泳道图的定义 泳道图是一种以泳道为基础的流程…

浅析pyqt事件机制

pyqt事件机制 一、什么是pyqt事件机制? ​ 事件是指用户操作或系统发生的各种动作,比如鼠标点击、键盘输入、窗口大小变化等。事件可以由用户或操作系统触发,然后被传递给应用程序进行处理。PyQt的事件机制通过事件循环(Event L…

如何通过内网穿透实现无公网IP也能远程访问内网的宝塔面板

文章目录 一、使用官网一键安装命令安装宝塔二、简单配置宝塔,内网穿透三、使用固定公网地址访问宝塔 宝塔面板作为建站运维工具,适合新手,简单好用。当我们在家里/公司搭建了宝塔,没有公网IP,但是想要在外也可以访问内…

SVN修改已提交版本的日志方法

1.在工做中一直是使用svn进行項目的版本控制的,有时候因为提交匆忙,或是忘了添加Log,或是Log内容有错误。遇到此类状况,想要在查看项目的日志时添加log或是修改log内容,遇到以下错误: Repository has not b…

链表的应用

链表优点:链表各个节点个数可以灵活变动,学生多时可以增加节点,少时可以减少节点,链表不要求存储空间连续,空间利用率高 链表:链表中每个节点在内存中位置不一定连续,所以每一节点中一定有个字…

【EI会议征稿】第十届机电一体化与工业信息学国际学术研讨会(ISMII 2024)

第十届机电一体化与工业信息学国际学术研讨会(ISMII 2024) 2024 10th International Symposium on Mechatronics and Industrial Informatics 随着往年九届的成功举办,2024年第十届机电一体化与工业信息学国际学术研讨会(ISMII…

深入理解Flexbox:构建灵活的布局系统

由于篇幅限制,我将提供一个详细的文章大纲和部分内容。您可以根据这个大纲扩展文章内容,以满足3000字的要求。 深入理解Flexbox:构建灵活的布局系统 引言 在现代web设计中,创建灵活且响应式的布局是非常重要的。Flexbox&#xf…

Google DeepMind推出大模型 Gemini (vs GPT4):规模最大、能力最强的人工智能模型

系列文章目录 文章目录 系列文章目录前言谷歌和 Alphabet 首席执行官桑达尔-皮查伊(Sundar Pichai)的说明一、Gemini 介绍二 、最先进的性能三、新一代功能四、复杂的推理能力五、理解文本、图像、音频及其他内容六、先进的编码技术七、更可靠、可扩展、…

推荐一个可以记录历史进价的进销存软件?

“我是卖数码产品的,数码产品价格变动是比较大的,每次采购时候我都会多家对比价格,再决定在哪个厂家进货。所以基本上我每次进价价格都不一样,但是之前的询价情况又很难一一单独记录,让我采购的时候很被动。” “准备…

java--枚举

1.枚举 枚举是一种特殊类 2.枚举类的格式 注意: ①枚举类中的第一行,只能写一些合法的标识符(名称),多个名称用逗号隔开。 ②这些名称,本质是常量,每个常量都会记住枚举类的一个对象。 3.枚举类的特点 ①枚举类的…

预测:2024年的安防监控行业将迎来怎样的变化?

随着科技的飞速发展,安防监控视频技术已经成为我们生活中的重要部分。通过对其发展趋势的深入了解,我们可以对未来做出更为精确的预测。本文将探讨2024年安防监控视频技术的可能发展趋势。 1、5G技术的普及将加速安防视频监控技术的发展 5G的高速率、低…