BMP格式详解

BMP(全称Bitmap)是Windows操作系统中的标准图像文件格式,可以分成两类:设备相关位图(DDB)和设备无关位图(DIB),使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP文件所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于BMP文件格式是Windows环境中交换与图有关的数据的一种标准,因此在Windows环境中运行的图形图像软件都支持BMP图像格式。

这里通过一个具体的例子对BMP格式做一个简单的介绍。

1、整体信息

BMP格式的文件从头到尾依次是如下信息:

  • bmp文件头(bmp file header):共14字节;
  • 位图信息头(bitmap information):共40字节;
  • 调色板(color palette):可选;
  • 位图数据;
最常见的就是24位图,所谓的24位图,就是说一个像素的颜色信息用24位来表示,也就是说,对于三原色BRG,每一个颜色都用以字节(8)位来表示。除了24位图,还有1位(单色),2位(4色,CGA),4位(16色,VGA),8位(256色),16位(增强色),24位(真彩色)和32位等。

下面通过下面的图片做详细介绍:


  图像的部分信息如下:


2、bmp文件头(bmp file header)

bmp文件头包含如下信息:

  • bfType:2字节,文件类型;
  • bfSize:4字节,文件大小;
  • bfReserved1:2字节,保留,必须设置为0;
  • bfReserved2:2字节,保留,必须设置为0;
  • bfOffBits:4字节,从头到位图数据的偏移;
下图的数据就是bmp文件头:

一共14字节,下面逐个解释。
0-1:bfType,表示文件类型,BMP格式的文件这两个字节是0x4D42,10进制就是19778,字符显示就是‘BM’;
2-5:bfSize,表示文件的大小,这里的是0x0004B436,十进制是308278,也就是301kb,检查文件信息,验证正确;
6-7:bfReserved1,保留位,必须设置为0;
8-9:bfReserved2,保留位,必须设置为0;
a-d:bfOffBits,4字节的偏移,表示从文件头到位图数据的偏移,这里是0x00000436,十进制是1078,后面会做验证;
3、位图信息头(bitmap information)
位图信息头一共40字节,包含如下内容:
  • biSize:4字节,信息头的大小,即40;
  • biWidth:4字节,以像素为单位说明图像的宽度;
  • biHeight:4字节,以像素为单位说明图像的高度,同时如果为正,说明位图倒立(即数据表示从图像的左下角到右上角),如果为负说明正向;
  • biPlanes:2字节,为目标设备说明颜色平面数,总被设置为1;
  • biBitCount:2字节,说明比特数/像素数,值有1、2、4、8、16、24、32;
  • biCompression:4字节,说明图像的压缩类型,最常用的就是0(BI_RGB),表示不压缩;
  • biSizeImages:4字节,说明位图数据的大小,当用BI_RGB格式时,可以设置为0;
  • biXPelsPerMeter:表示水平分辨率,单位是像素/米,有符号整数;
  • biYPelsPerMeter:表示垂直分辨率,单位是像素/米,有符号整数;
  • biClrUsed:说明位图使用的调色板中的颜色索引数,为0说明使用所有;
  • biClrImportant:说明对图像显示有重要影响的颜色索引数,为0说明都重要;
下图数据是位图信息头:

一共40字节,解释如下:
0e-11:4字节的biSize,这里是0x28,即十进制的40,验证正确;
12-15:4字节的biWidth,这里是0x00000280,即十进制的640,用像素表示图像的宽度,查看文件信息验证正确;
16-19:4字节的biHeight,这里是0x000001E0,即十进制的480,用像素表示图像的高度,查看文件信息验证正确;同时,这是一个正数,表示图像是倒立的,即图像数据是从左下角到右上角排列的;
1a-1b:2字节的biPlanes,值为0x0001;
1c-1d:2字节的biBitCount,值是0x0008,即8,表示每个像素用8位表示,一共有256个颜色;
1e-21:4字节的biCompression,值是0,即BI_RGB格式,不压缩;
22-25:4字节的biSizeImage,图像的大小,值是0x0004B000,十进制为307200,由上面的bfSize(文件大小)和bfOffBits(文件头到数据的偏移)分别是308278和1078可以得到,biSizeImage=bfSize-bfOffBits,即图像大小=文件大小-偏移量;
26-29:4字节的biXPelsPerMeter,水平分辨率,值是0x00000EC4,十进制3780;
2a-2d:4字节的biYPelsPerMeter,垂直分辨率,值是0x00000EC4,十进制3780;
2e-31:4字节的biClrUsed,使用的颜色索引数,值是0x00000100,十进制256,与1c-1d得到的结论一致;
32-35:4字节的biClrImportant,重要的颜色索引数,值是0x00000100,十进制256;
4、调色板(Color Palette)
调色板是可选的,不过这里的8位色图有调色板。那么接下来的数据就是调色板了。调色板就是一个颜色的索引,这里是8位色图,一共有256中颜色,由于每个颜色都有RGB三原色,也就是要3个字节表示,这样的话256个颜色就不能表示所有的颜色,所以就需要一个索引,用一个字节的索引指向4个字节表示的颜色(RGB加上Alpha值)。如果把这4个字节表示为一个Color类型,那么调色板就是Color的数组。由于Color类型也是一个数组,调色板就像一个二维数组palette[N][4],其中N是颜色的数量,这里就是256。因此,这个例子中的调色板的大小就是256x4=1024字节,在调色板之前,有14字节的bmp文件头,40字节的位图信息头,加上1024字节的调色板,一共1078字节,也就是说真正的图像数据前面有1078字节,这和bmp文件头中的bfOffBits相符,验证了我们的讨论。
有的图像没有调色板,比如下面的24位色图:

头部数据如下:

根据上面的讨论可以知道,biBitCount是24(0x18),bfOffBits是54(0x36),即没有调色板,位图信息头接下来就是图像数据了。
调色板中的数据每4字节一组,分别表示蓝、绿、红和Alpha值。按照第一个图像举例来说:
索引绿Alpha
001103700
100104900
200184400
3011D5800
5、位图数据
接下来就是位图数据了。由于是8位色图,所以每个像素用1个字节表示,取出每个字节,显示到相应的设备上就可以了。
注意,这里的biHeight为正数,说明图像倒立,从左下角开始到右上角,以行为主序排列。
如果是24位色图,按照BGR的顺序排列,32位色图按照BGRAlpha排列。
位图数据排列还有一个规则,就是对齐。
Windows默认的扫描的最小单位是4字节,如果数据对齐满足这个值的话对于数据的获取速度等都是有很大的增益的。因此,BMP图像顺应了这个要求,要求每行的数据的长度必须是4的倍数,如果不够需要进行比特填充(以0填充),这样可以达到按行的快速存取。这样的话,位图数据的大小就不一定是宽x高x每像素字节数了,因为每行还可能有0填充。
填充后的每行数据如下:

其中,BPP是每像素的比特数(Bits Per Pixel),即biBitCount,Width是宽度,单位是像素即bfWidth。
对于我们这个例子,BPP是8,Width是480,正好是4的倍数,也就是没有填充。来计算一下:
RowSize=4*(8*480/32)=480字节,验证没有填充。
那么以上面第二个图片24位色图为例,按照数据可以得到:
  • biBitCount=0x0018=24;
  • bfWidth=0x000001c6=454;
  • bfHeight=0x00000053=83;
  • biSizeImage=0x0001BA3c=113212;
按照没填充计算:454*83*3=113046 bytes,与真实值相差166字节。
按照填充公式,每行有数据4*(24*454/32)=1364 字节,真正的数据有454*3=1362字节,也就是说每行填充了2字节0,一共83行,共填充83*2=166字节,验证了我们的讨论。
在程序中,我们可以用下面的代码计算每行的数据:
int bytesPerLine=((bfWidth*biBitCount+31)>>5)<<2;
那么,位图数据大小为:
int imageSize=bytesPerLine*bfHeight;
这样的话,每扫描完一行数据,最后的几个字节可能是填充的0,需要跳过:
int skip=4-((bfWidth*biBitCount)>>3)&3;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/385490.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode 5. 最长回文子串(Longest Palindromic Substring)

推荐理由&#xff1a;暴力解法太 naive&#xff0c;中心扩散不普适&#xff0c;Manacher 就更不普适了&#xff0c;是专门解这个问题的方法。而用动态规划我认为是最有用的&#xff0c;可以帮助你举一反三的方法。 补充说明&#xff1a;Manacher 算法有兴趣的朋友们可以了解一…

请求转发与请求重定向的区别

请求转发&#xff1a; 请求转发&#xff0c;即request.getRequestDispatcher().forward()&#xff0c;是一种服务器的行为&#xff0c;客户端只有一次请求&#xff0c;服务器端转发后会将请求对象保存&#xff0c;地址栏中的URL地址不会改变&#xff0c;得到响应后服务器端再将…

StringBuilder详解

1、简介 StringBuilder和StringBuffer一样&#xff0c;都是继承自抽象类AbstractStringBuilder类&#xff0c;也是一个可变的字符序列。StringBuilder和StringBuffer非常相似&#xff0c;甚至有互相兼容的API&#xff0c;不过&#xff0c;StringBuilder不是线程安全的&#xf…

【线程】互斥锁

一、互斥锁 1. 函数原型 pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr); pthread_mutex_destroy(pthread_mutex_t *mutex); 分析&#xff1a; pthread_mutex_t 类型&#xff0c;其本质是一个结构体&#xff0c;为简化…

ArrayList详解

1、简介 ArrayList是Java集合框架中的一个重要的类&#xff0c;它继承于AbstractList&#xff0c;实现了List接口&#xff0c;是一个长度可变的集合&#xff0c;提供了增删改查的功能。集合中允许null的存在。ArrayList类还是实现了RandomAccess接口&#xff0c;可以对元素进行…

【进程】进程组

一、进程组 1. 进程组 &#xff08;1&#xff09;进程组&#xff0c;也称之为作业&#xff0c;BSD与1980年前后向UNIX中增加的一个新特性&#xff0c;代表一个或多个进程的集合。每个进程都属于一个进程组&#xff0c;在waitpid函数和kill函数的参数中都曾经使用到&#xff0c…

函数wait、waitpid、孤儿进程、僵尸进程

一、函数wait、waitpid 一个进程在终止时会关闭所有文件描述符&#xff0c;释放在用户空间释放的内存&#xff0c;但它的PCB还保留着&#xff0c;内核在其中保存一些信息&#xff1a;如果是正常终止时则保存着退出状态&#xff0c;如果是异常终止则保存着导致该进程终止的信号是…

MySQL中的字符集与字符序

这篇文章详细介绍一下MySQL中的字符集和字符序相关的问题&#xff0c;里里外外地了解一下字符集和字符序的方方面面&#xff0c;同时重点说明一下开发中需要注意的问题。 文章基于MySQL 8.0&#xff0c;也会涉及到5.7版本。主要参考MySQL手册&#xff1a;https://dev.mysql.com…

MySQL中的JSON

从5.7.8开始&#xff0c;MySQL开始支持JSON类型&#xff0c;用于存储JSON数据。 JSON类型的加入模糊了关系型数据库与NoSQL之间的界限&#xff0c;给日常开发也带来了很大的便利。 这篇文章主要介绍一下MySQL中JSON类型的使用&#xff0c;主要参考MySQL手册&#xff1a;https…

【C++ Primer | 15】虚函数表剖析(一)

一、虚函数 1. 概念 多态指当不同的对象收到相同的消息时&#xff0c;产生不同的动作 编译时多态&#xff08;静态绑定&#xff09;&#xff0c;函数重载&#xff0c;运算符重载&#xff0c;模板。运行时多态&#xff08;动态绑定&#xff09;&#xff0c;虚函数机制。为了实现…

【Leetcode | 02】二叉树、线性表目录

二叉树序号题号1 94. 二叉树的中序遍历 295. 不同的二叉搜索树 II396. 不同的二叉搜索树4 98. 验证二叉搜索树 5100. 相同的树6101. 对称二叉树7102. 二叉树的层次遍历8103. 二叉树的锯齿形层次遍历9104. 二叉树的最大深度10105. 从前序与中序遍历序列构造二叉树11106. 从中序与…

Leetcode 118. 杨辉三角

给定一个非负整数 numRows&#xff0c;生成杨辉三角的前 numRows 行。 在杨辉三角中&#xff0c;每个数是它左上方和右上方的数的和。 示例: 输入: 5 输出: [[1],[1,1],[1,2,1],[1,3,3,1],[1,4,6,4,1] ] class Solution { public:vector<vector<int>> generate(…

管道符、重定向与环境变量

输入输出重定向 输入重定向&#xff1a;将文件内容导入到命令中&#xff1b;输出重定向&#xff1a;将命令执行后显示到屏幕上的内容导入到文件中&#xff0c;不在屏幕中显示。共分为&#xff1a;标准输入重定向&#xff08;文件描述符为0&#xff09;、标准覆盖输出&#xff0…

【C++ Primer | 0 】字符串函数实现

1. memcpy函数原型&#xff1a; void* memcpy(void* dst, const void* src, size_t size); void* memmove(void* dst, const void* src, size_t size); 分析&#xff1a; source和destin所指的内存区域可能重叠&#xff0c;但是如果source和destin所指的内存区域重叠,那么这个…

编写Shell脚本(批处理,一次执行多条命令)

Bash终端的优势&#xff1a;1.上下键重复执行命令&#xff1b;2.tab键自动补齐&#xff1b;3.提供有用的环境变量&#xff1b;4.批处理。 shell脚本文件建议以.sh为后缀。 其实vim创建文本文件时&#xff0c;对名字无要求&#xff0c;但最好规定格式。 echo $SHELL&#xff08…

判断用户的参数(条件测试语句)

说明$?: $&#xff1f;为上一次命令的执行返回值&#xff0c;若上一次命令正常执行&#xff0c;则返回0&#xff1b;若执行出错&#xff0c;则返回一个非0的随机数。比如创建一个已经存在的目录&#xff0c;则返回一个非0数。 另外&#xff0c;测试语句成立返回0&#xff0c…

流程控制语句(bash)

1.if控制语句 if then fi if then else fi if then elif then elif then else fi if 条件表达式 then 命令序列&#xff08;满足条件才执行&#xff09; #注意&#xff0c;如果if与then&#xff08;elif与then&#xff09;写在同一行&#xff0c;要用;隔开&#xff…