HALCON-从入门到入门-图像格式的互相转换

1.废话

上次说到了图片的读取和写入到本地,这次说一下图片的格式相关。

位图和矢量图

photoshop处理出来的图片肯定叫做图片,那么coreDraw处理出来的图片是不是也叫图片。

之间就有区分,一种叫做位图,一种叫做矢量图

位图和矢量图在定义、分辨率、色彩丰富度、文件大小和绘制工具等方面存在显著差异。选择使用哪种类型的图像取决于具体的应用场景和需求。例如,如果需要制作色彩丰富、逼真的自然景象或照片,位图是更好的选择;而如果需要制作可无限放大且不失真的Logo、图标或图形设计,矢量图则更为合适。

  • 位图
    • 也称为点阵图像或栅格图像,由像素(图片元素)的单个点组成。
    • 每个像素点都有特定的位置和颜色信息。
    • 存储原理是将图片的每一个像素点的颜色保存起来。
    • 与分辨率紧密相关,分辨率越高,图像越清晰。
    • 放大图像时,像素点也会放大,导致图像出现马赛克状,即失真现象。
    • 色彩丰富,能够制作出色彩和亮度变化丰富的图像。
    • 可以逼真地表现自然界各类实物。
  • 矢量图
    • 也称为面向对象的图像或绘图图像,在数学上定义为一系列由点连接的线。
    • 矢量文件中的图形元素称为对象,每个对象都是一个自成一体的实体,具有颜色、形状、轮廓、大小和屏幕位置等属性。
    • 存储原理是使用一系列数学方程表示图片中的线条,再另外保存每个区域的颜色信息。
    • 与分辨率无关,可以无限放大而不失真。
    • 无论放大、缩小或旋转,都保持清晰度和图像质量。
    • 色彩相对不丰富,难以表现色彩层次丰富的逼真图像效果。
    • 常用于表示标识、图标、Logo等简单直接的图像。

我们处理的当然是位图,至于矢量图我们是不关心的,这里只是作为图像概念的扩充。


图像在硬盘中保存的时候有多种格式,比如说jpg,png这种

那么硬盘上的图像文件主要的经常用到的格式有哪些呢

  1. BMP格式
    • 全称:BitMaP
    • 与硬件设备无关的图像文件格式
    • 使用位映射存储格式,不采用其他任何压缩,因此文件占用空间较大
    • 图像深度可选lbit、4bit、8bit及24bit
    • Windows环境中运行的图形图像软件都支持BMP图像格式
  2. JPEG格式
    • 全称:Joint Photographic Experts Group
    • 俗称:JPG
    • 一种有损压缩格式
    • 优点:图像压缩在很小的储存空间,适合网络传输
    • 缺点:图像中重复或不重要的资料会被丢失,容易造成图像数据的损伤
  3. PNG格式
    • 全称:Portable Network Graphics
    • 优点:提供无损压缩图像文件,长度比GIF小30%
    • 支持24位和48位真彩色图像
    • 支持透明背景和变显图像
  4. GIF格式
    • 全称:Graphics Interchange Format
    • 优点:支持透明背景和动画
    • 只支持256色
    • 压缩率一般在50%左右
  5. TIFF格式
    • 全称:Tagged Image File Format
    • 优点:无损压缩,2-3倍的压缩比
  6. RAW格式
    • 未经处理直接从CCD或CMOS上所得到的原始图像信息
    • 文件超大,但特别适合后期出片调整

此外,还有其他一些格式如PSD(Photoshop的源文件格式)、AI(Adobe Illustrator的文件格式)、EPS(封装的PostScript文件)等,这些格式通常用于专业的图形设计和编辑软件。

在halcon中的图像格式有哪些呢?

当我们读取一张图片进来的时候,我们按照彩色和黑白分,有通道数的概念。

三通道的可以表示彩色图像,单通道的只能是黑白图像。

举个例子:

我们读取了一张图像,这张图像在硬盘中是jpg格式,那么读取到halcon中,看得出来是带颜色的,旁边有棕色的桌面。

我们把鼠标指向变量窗口看一下。

出来一个框,看起来这张图的通道数是3

也就是说这是一张三通道的图,不难理解,这个三个通道应该就是RGB三通道。

这张图的类型是byte,什么意思呢,就是每个通道的像素的灰度值,取值范围是0-255。

用byte 一个字节表示,8bit表示,换算到十进制就是0-255.

在halcon中除了常用的byte格式之外,还有real格式(灰度值取值范围类似于float)

uint2格式,灰度值取值范围为0-65535

同理,int2格式的取值范围为-32768-32767

halcon中图像像素灰度值的存储内存不同,格式不同,一共如上图所示。

2.彩色图像转黑白图像

跟着我们上面的步骤,我们读进来一张三通道的图,那么我们把通道给分开

把每个通道给分出来,使用下面的算子

decompose3 (Image2, Image1, Image21, Image3)

将一张三通道的图片分成三张单通道的图片,合理

目前三张都是黑白的图片了。

那假如说我现在手里有三张黑白的图片 byte类型的,我想合成一张彩色的图像怎么做的

下面这个算子

compose3 (Image1, Image1, Image1, MultiChannelImage)

这两个算子还有很多类似的算子

不光可以拆分或者合并三通道的,若干通道的都行。

为什么我们要拆分彩色图片呢,因为多通道图片多了一个通道维度,很多时候不好处理,很多算子对应的目标都是单通道图片,所以我们就拆分通道分别处理。

彩色转黑白图

不想拆分通道,简单点,之间将彩色图转黑白,使用下面算子


rgb1_to_gray (Image2, GrayImage)

这个算子就是将三个通道的值按照一定比例相乘相加得到新图片的灰度值(单通道的)

具体比例系数是

好的,处理完彩色图像之后如下图所示

3.byte转real

0-255对于我来说不够用,我想要每个像素的灰度值表示为小数

这时候就需要用到我们的real格式

转图像合适的算子如下:

convert_image_type (GrayImage, ImageConverted, 'real')

在转换的时候记得注意,如果是小转大:

        比如说byte转real,那么直接转,不会丢失精度;

        如果说是real转byte,大于255的灰度值会变为255,灰度值为小数的会忽略掉后面的小数。

这个需要注意,以免出现图像处理异常。

转换之后我们得到了real格式的图像。

同理,其他格式也是这么转换过来的,不同的格式适用于不同的计算场景。

常规的机器视觉,byte类型图像完全够用,设计到3d视觉,需要用到深度图的,那么uint2格式的深度图能够更加适合。

4.叮嘱

另外如果是特殊格式需要保存到本地的话,建议都用tiff格式,其他格式可能会出现意想不到的问题。

比如我现在有一张5通道的图片,前三个通道的颜色信息,第四个通道是法向量信息,第五个通道是高度信息,那么我将这张图存成bmp格式就会出现问题。

另外png格式理论上来说可以保存单通道的图像,也可以保存4个通道的图像,第四个通道是透明度通道,因为png格式图片允许其中某些像素是透明的,而bmp格式就不允许了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/20960.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI大模型探索之路-实战篇13: 从对话到报告:打造能记录和分析的Agent智能数据分析平台

系列篇章💥 AI大模型探索之路-实战篇4:深入DB-GPT数据应用开发框架调研 AI大模型探索之路-实战篇5:探索Open Interpreter开放代码解释器调研 AI大模型探索之路-实战篇6:掌握Function Calling的详细流程 AI大模型探索之路-实战篇7…

echarts 图表不显示的问题

是这样的,点击详情,再点击统计,切换的时候就不会显示echarts图表,刚开始使用的是next Tick,没有使用定时器,后来加上了定时器就实现了如下所示: 代码是如下 const chartContainer ref(null); …

【Text2SQL 论文】DBCopilot:将 NL 查询扩展到大规模数据库

论文:DBCopilot: Scaling Natural Language Querying to Massive Databases ⭐⭐⭐⭐ Code: DBCopilot | GitHub 一、论文速读 论文认为目前的 Text2SQL 研究大多只关注具有少量 table 的单个数据库上的查询,但在面对大规模数据库和数据仓库的查询时时却…

UML静态图-对象图

概述 静态图包含类图、对象图和包图的主要目的是在系统详细设计阶段,帮助系统设计人员以一种可视化的方式来理解系统的内部结构和代码结构,包括类的细节、类的属性和操作、类的依赖关系和调用关系、类的包和包的依赖关系。 对象图与类图之间的关系&…

Day46 动态规划part06

完全背包问题 完全背包和01背包问题唯一不同的地方就是,每种物品有无限件。先遍历物品还是先遍历背包以及遍历顺序 根据递推公式可知:每一个dp需要根据上方和左方的数据推出,只要保证数据左上方数据是递推出来的这种两个for循环的顺序就是可…

【python学习】Anaconda的介绍、下载及conda和pip换源方式(切换到国内镜像源)

什么是Anaconda Anaconda 是一个专为数据科学和机器学习预装了多种库的Python发行版。 提供了包管理与环境管理的功能解决了多个版本python并存的问题解决了第三方包安装问题 如何下载Anaconda 官网地址:https://www.anaconda.com/ 点击右上角的 Free Download …

C语言王国——选择与循环(1)

目录 一、引言 二、选择结构 1,if语句 1.1,if...else...语句 1.2,多分支语句 1.3悬空else的问题 2,switch语句 2.1,switch 2.2,break 2.3,default 一、引言 写了几个C语言代码我发现C语…

华为坤灵交换机S300, S500, S210,S220, S200, S310 如何WEB抓包

通过S系列交换机配置端口镜像实现抓包 1、应用场景 端口镜像是指将经过指定端口(源端口或者镜像端口)的报文复制一份到另一个指定端口(目的端口或者观察端口)。在网络运营与维护的过程中,为了便于业务监测和故障定位,网络管理员时常要获取设备上的业务报…

队列——一种操作受限的线性表

队列 队列(Queue)简称队,也是一种操作受限的线性表,只允许在表的一端进行插入,而在表的另一端进行删除。向队列中插入元素称为入队或进队,删除元素称为出队或离队。队列中的元素是先进先出(Fir…

MySQL学习——选项文件的使用

MySQL 的许多程序都可以从选项文件(有时也被称为配置文件)中读取启动选项。选项文件提供了一种方便的方式来指定常用的选项,这样你就不必每次运行程序时都在命令行上输入这些选项。 要确定一个程序是否读取选项文件,你可以使用 -…

man命令的作用

man命令是Linux操作系统中一个非常实用的命令,它用于查看命令的手册页面,帮助用户了解特定命令的用法、选项和参数。这不仅对新用户在学习如何使用新命令时很有帮助,也方便了经验丰富的用户快速查找命令的详细信息。以下是具体介绍&#xff1…

[论文精读]Supervised Community Detection with Line Graph Neural Networks

论文网址:[1705.08415] Supervised Community Detection with Line Graph Neural Networks (arxiv.org) 英文是纯手打的!论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误,若有发现欢迎评论指正!文章偏向于笔记,谨慎食用 ⭐内涵大量可视…

高速模拟信号链的设计学习

目录 概述: 定义: 断开: 链路设计: 结论: 概述: 由于对共模参数及其与设备之间的关联缺乏了解,客户仍然会提出许多技术支持问题。ADC数据表指定了模拟输入的共模电压要求。关于这方面没有太…

jenkins应用2

1.jenkins应用 1.jenkins构建的流程 1.使用git参数化构建,用标签区分版本 2.git 拉取gitlab远程仓库代码 3.maven打包项目 4.sonarqube经行代码质量检测 5.自定义制作镜像发送到远程仓库harbor 6.在远程服务器上拉取代码启动容器 这个是构建的整个过程和步骤…

C# 反射类Assembly 程序集(Assembly)用法

常见的两种程序集: 可执行文件(.exe文件)和 类库文件(.dll文件)。 在VS开发环境中,一个解决方案可以包含多个项目,而每个项目就是一个程序集。 他们之间是一种从属关系,也就是说&…

【NLP开发】Python实现聊天机器人(微信机器人)

🍺NLP开发系列相关文章编写如下🍺:1🎈【小沐学NLP】Python实现词云图🎈2🎈【小沐学NLP】Python实现图片文字识别🎈3🎈【小沐学NLP】Python实现中文、英文分词🎈4&#x1…

转让北京电力施工总承包二级资质变更条件和流程

在电力工程领域,资质等级是企业能否参与竞标、承接工程的重要标志之一。北京电力工程总包二级资质的转让,是指已经取得该资质的企业将其资质转让给需要的企业。这种转让是基于合作与共赢的原则,旨在推动电力工程行业健康、稳定发展&#xff0…

记录使用自定义编辑器做试题识别功能

习惯了将解析写在代码注释,这里就直接上代码啦,里面用到的bxm-ui3组件库是博主基于element-Plus做的,可以通过npm i bxm-ui3自行安装使用 // 识别方法: // dom 当前识别数据所在区域, questionType 当前点击编辑选择的题目类型&a…

Qt | Qt 资源简介(rcc、qmake)

1、资源系统是一种独立于平台的机制,用于在应用程序的可执行文件中存储二进制文件(前面所讨论的数据都存储在外部设备中)。若应用程序始终需要一组特定的文件(比如图标),则非常有用。 2、资源系统基于 qmake,rcc(Qt 的资源编译器,用于把资源转换为 C++代码)和 QFile …

java—MyBatis框架

简介 什么是 MyBatis? MyBatis 是一款优秀的持久层框架,它支持自定义 SQL、存储过程以及高级映射。MyBatis 免除了几乎所有的 JDBC 代码以及设置参数和获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO&…