字节序、位序

字节序

    字节序,又称端序、尾序,英文单词为Endian,该单词来源于于乔纳森·斯威夫特的小说《格列佛游记》,小说中的小人国因为吃鸡蛋的问题而内战,战争开始是由于以下的原因:我们大家都认为,吃鸡蛋前,原始的方法是打破鸡蛋较大的一端。可是当今皇帝的祖父小时候吃鸡蛋,一次按古法打鸡蛋时碰巧将一个手指弄破了,因此他的父亲,当时的皇帝,就下了一道敕令,命令全体臣民吃鸡蛋时打破鸡蛋较小的一端,违令者重罚。老百姓们对这项命令极为反感。历史告诉我们,由此曾发生过六次叛乱,其中一个皇帝送了命,另一个丢了王位…关于这一争端,曾出版过几百本大部著作,不过大端派的书一直是受禁的,法律也规定该派的任何人不得做官。 1980年,Danny Cohen在其著名的论文"On Holy Wars and a Plea for Peace"中,为平息一场关于字节该以什么样的顺序传送的争论,而引用了该词。

         在计算机科学领域中,字节序是指存放多字节数据的字节(byte)的顺序,典型的情况是整数在内存中的存放方式和网络传输的传输顺序。有时候也可以用指位序(bit)。为了更好地理解,先看下面这段小程序,这个程序是把一个包含4位数字的字符串转换为16进制整数来存储,16进制整数的每一个字节存储一位数字字符。比如:”1234”,转换成16进制整数0x01020304。

程序1清单:

#include <stdio.h>

#include <conio.h>

 

int main( )

{

     char input[4] = {0};

     int integer   = 0;

     int i;

     printf("/r/n请输入一个位数,每一位的范围是从到0到9/r/n");

     for(i = 0; i < 4; i++)

     {

         input[i] = getch();

         if(input[i] > '9' || input[i] < '0')

         {

              printf("input error!/r/n");

              return 1;

         }

         putch(input[i]);

     }

    getch();

     putch('/n');

 

     for(i = 0; i < 4; i++)

     {

         input[i] = input[i] - '0';

     }

 

     memcpy((void*)&integer, (void*)input, 4);

 

     printf("转换后的进制数是:0x%08x/r/n", integer);

 

     getch();

 

     return 0;

}

 

现在来分析一下这段代码

首先,定义了一个字符数组input,用来接收用户输入的4个数字字符;

第二,把4个字符数字转换成对应的数字;

第三,把转换的数字复制到整型变量integer中;

最后在屏幕上打印。

如果在PPC或者ARM的机器上编译运行这个程序,那么会在屏幕上打印出结果:0x01020304,这与我们的预期一致;但是在X86的机器上则打印出的结果是:0x04030201。这个令人惊讶的结果正是字节序问题引起。下面来详细谈谈这个问题。

 

    从计算机诞生之后,就有几种不同的字节序,典型的是大端序(big endian)和小端序(little endian),当然还有不常见的混合序(middle endian)。这些用来都是描述多字节数据在内存中的存放方式的。以上面的16进制数0x01020304为例,在计算机中需要用4个字节来保存它,’01’, ’02’,’03’,’04’各占一个字节。按照人类的计数习惯,最左边的’01’,称之为最高有效位(MSB,Most Significant Byte,它具有最高权重);最右边的’04’称之为最低有效位(LSB, Least Significant Byte,他具有最低权重);在计算机中需要用4个字节来保存它,其中’01’, ’02’,’03’,’04’各占一个字节。大端序的计算机保存这个数值时,按照从低地址到高地址的顺序分别保存MSB到LSB四个字节,0x01020304的存储情况如下图所示:

 

而小端序的计算机则以相反的顺序来保存它,如下图所示:

 

 

可以看到,在小端序的计算机中,0x01020304的保存顺序恰好与上面的程序1中相反,这就是最后输出结果为0x04030201的原因;大端序的计算机中两者保存顺序一致,所以打印正确。

 

    我们可以在VC集成环境中来验证上面的分析。在VS2005中调试下面的小程序,在return语句处设置断点,断住后打开内存窗口查看&i处的内容。可以直观的看到在x86(小端序)的机器上整数的存放方式。

程序2清单:

#include <stdio.h>

int main()

{

     int i = 0x01020304;

     printf("i = %#x/r/n",i);

     return 0;

}

 

 

 

 

 

再看看如何才能让程序1在大端序和小端序的机器上都能正确执行呢?一个办法就是利用预编译宏,针对不同的机器定义定义不同的数据结构。下面是一个例子:

程序3清单:

#include <stdio.h>

#include <conio.h>

 

typedef union

{

     struct{

#ifdef BIG_ENDIAN

     char msb;

     char midb1;

     char midb2;

     char lsb;

#else

     char lsb;

     char midb2;

     char midb1;

     char msb;

#endif

     } bytes;

     int  var;

} INTEGER;

 

int main()

{

     int  i          = 0;

     char input[5]   = {0};

     INTEGER integer = {0};

 

     printf("/r/n请输入一个位数,每一位的范围是从到到/r/n");

     for(i = 0; i < 4; i++)

     {

         input[i] = getch();

         if(input[i] > '9' || input[i] < '0')

         {

              printf("input error!/r/n");

              return 1;

         }

         putch(input[i]);

     }

    getch();

     putch('/n');

 

     integer.bytes.msb   = input[0] - '0';

     integer.bytes.midb1 = input[1] - '0';

     integer.bytes.midb2 = input[2] - '0';

     integer.bytes.lsb   = input[3] - '0';

 

     printf("转换后的进制数是:0x%08x/r/n", integer.var);

 

     getch();

 

     return 0;

}

可以看到,这段代码定义了两套数据结构,通过BIG_ENDIAN这个宏定义来决定使用哪一套数据结构。这是个笨拙却有效的方法。下面这个例子则漂亮一些:

程序4清单

#include <stdio.h>

#include <conio.h>

#include <memory.h>

#include <winsock2.h>

 

int main( )

{

     char input[4] = {0};

     int integer   = 0;

     int i;

     printf("/r/n请输入一个位数,每一位的范围是从到到/r/n");

     for(i = 0; i < 4; i++)

     {

         input[i] = getch();

         if(input[i] > '9' || input[i] < '0')

         {

              printf("input error!/r/n");

              return 1;

         }

         putch(input[i]);

     }

    getch();

     putch('/n');

 

     for(i = 0; i < 4; i++)

     {

         input[i] = input[i] - '0';

     }

 

     memcpy((void*)&integer, (void*)input, 4);

 

     integer = ntohl(integer);

 

     printf("转换后的进制数是:0x%08x/r/n", integer);

 

     getch();

 

     return 0;

}

这个程序利用了大端序与人类书写习惯一致的特点,通过ntohl函数将整数进行转换。这个函数的功能是将网络序转换成主机序,在大端机器上它什么也不做,在小端机器上它会将输入参数的值转换成小端序的值。在windows环境下链接时别忘了将Ws2_32.lib库添加进来。

 

主机序和网络序

主机序就是指主机的端序。

网络字节序(网络序)指多字节数据在网络传输中的顺序,TCP协议规定网络序是大端序,即高字节先发送。因此大端序的机器接受到的数据可直接使用,小端序机器则需要转换后使用。BSD socket API中定义了一组转换函数,用于16和32bit整数在网络序和本机字节序之间的转换。htonl,htons用于本机序转换到网络序;ntohl,ntohs用于网络序转换到本机序。一般来说,为了保证程序的可移植性,编写代码时,发送的数据需要使用htonl、htons转换,接收到的数据要使用ntohl、ntohs转换。

注意:不存在对单字节整数进行转换的函数”ntohc”和”htonc”!

位序

         位序,一般用于描述串行设备的传输顺序。一般说来大部分硬件都是采用小端序(先传低位),因此,对于一个字节数据,大部分机器上收发的顺序都一样,不会有问题,这就是为什么没有针对单字节数据的API接口”ntohc”和”htonc”。当然,也有例外,比如­I2C协议就是采用了大端序。这些细节只有在网络协议的数据链路层底端才会碰到,对一般的程序员来说很少涉及。

         但是在C语言中存在一种特殊的数据结构:位域。它的存在,使得C程序员能方便地进行位操作(比如在网络协议中经常出现1bit或者多bit的标示位,它们不是一个完整的字节)。但同时也引起一些难以察觉的问题,这些问题的根源仍然是前面提到的端序。

 

         与字节序一样,一个字节中的8个bit顺序在不同端序的机器上并不相同。大端机器上从低地址到高地址顺寻分别是msb->lsb,如下图:

 

 

小端序的机器上则正好相反

 

现代计算机的最小存储单位是BYTE,无法对bit寻址,因此我们无法直接观察每个字节内部bit的顺序。但是我们仍然可以通过位域来间接观察字节内部bit顺序,以印证上面的说法。

在C语言中,位域与结构体类似,其语法规定:先声明的成员位于低地址,后声明的成员位于高地址。那么下面的位域中:

typedef struct OneByte

{

     bt0 : 1;

     bt1 : 1;

     bt2 : 1;

     bt3 : 1;

     bt4 : 1;

     bt5 : 1;

     bt6 : 1;

     bt7 : 1;

}

成员bt0就位于一个字节中最低地址bit0处,成员bt7就位于一个字节的最地址bit7处。

 

我们看看下面的程序。

#include <stdio.h>

 

typedef struct OneByte

{

     char bt0 : 1;

     char bt1 : 1;

     char bt2 : 1;

     char bt3 : 1;

     char bt4 : 1;

     char bt5 : 1;

     char bt6 : 1;

     char bt7 : 1;

} ONE_BYTE;

 

int main()

{

     ONE_BYTE onebyte = {0};

    

     onebyte.bt7 = 1;

 

     printf("onebyte = %#x/r/n", *((unsigned char *)&onebyte));

 

     return 0;

}

 

当bt7赋值为1后,onebyte在内存中是这个样子的:

 

而在VC2005中编译运行的结果如下:

 

0x80转换成二进制是1000 0000。由于在X86(小端序)中,高地址bit7是msb,因此onebyte的值是0x80了;这就证实了前面的说法。 相应的如果是在大端序计算机中,bit7是lsb,则onebyte的值是0x01。

 

 

 

未完待续

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/435898.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

怎么抓取屏幕截图计算机考试时间,定时抓屏快照(电脑截屏工具)V4.8 最新版

定时抓屏快照(电脑截屏工具)是一款非常实用的电脑屏幕定时抓拍软件。想定时截取电脑屏幕&#xff1f;定时抓屏快照(电脑截屏工具)轻松帮助用户。马上要放假了&#xff0c;家长一定很担心小孩最新的上网情况&#xff0c;看是在电脑上玩什么&#xff0c;用户通过该软件可以及时了…

【转】matlab函数编译成dll供Cpp调用的方法

转自&#xff1a;https://www.cnblogs.com/vincenzo/archive/2009/09/09/1563467.html 以前做过matlab7与c的混合编程&#xff1a;将m函数编译成dll给C调用&#xff0c;从而加快开发的进度。但是今天在matlab2008b下面又做了一遍&#xff0c;发现matlab又改了很多东西&#xf…

可以测试流放之路伤害的软件,测试平台及细节一览 - 《流放之路》国服硬件需求测试:低配也能续写ARPG传奇 - 超能网...

测试平台、场景说明测试平台测试平台配置主要分为两套&#xff0c;第一套配置为Skylake平台基础搭建的ASUS MAXIMUS VIIIGEN(Z170)主板&#xff0c;处理器为Intel Core i7-6700K&#xff0c;内存是G.Skill Ripjaws V 4GB DDR43200x2组成的双通道&#xff1b;第二套配置为Kaveri…

关于增强(五)-Class Enhancement

Class/Interface增强允许增加&#xff0c; 对已有的方法增加可选参数 添加方法&#xff0c;事件&#xff0c;事件处理 参考接口 对存在的方法添加出口&#xff0c;其中包括方法开始前的出口&#xff08;Pre-Exit&#xff09;&#xff0c;方法结束快结束的出口(Post-Exit)&#…

【转】彻底理解cookie,session,token

转自&#xff1a;https://zhuanlan.zhihu.com/p/63061864 彻底理解cookie&#xff0c;session&#xff0c;token 发展史 1、很久很久以前&#xff0c;Web 基本上就是文档的浏览而已&#xff0c; 既然是浏览&#xff0c;作为服务器&#xff0c; 不需要记录谁在某一段时间里都浏…

【转】c#数字图像处理(一)Bitmap类、 Bitmapdata类和 Graphics类

转自&#xff1a;https://www.cnblogs.com/dearzhoubi/p/8553763.html Bitmap类、 Bitmapdata类和 Graphics类是C#图像处理中最重要的3个类,如果要用C# 进行图像处理,就一定要掌握它们。 1.1 Bitmap类 Bitmap对象封装了GDI中的一个位图,此位图由图形图像及其属性的像素数据组成…

【转】c#数字图像处理(二)彩色图像灰度化,灰度图像二值化

转自&#xff1a;https://www.cnblogs.com/dearzhoubi/p/8571652.html 为加快处理速度,在图像处理算法中,往往需要把彩色图像转换为灰度图像,在灰度图像上得到验证的算法,很容易移 植到彩色图像上。 24位彩色图像每个像素用3个字节表示,每个字节对应着R、G、B分量的亮度(红、绿…

【转】c#数字图像处理(三)灰度直方图

转自&#xff1a;https://www.cnblogs.com/dearzhoubi/p/8621804.html 灰度直方图是灰度的函数,描述的是图像中具有该灰度级的像素的个数。如果用直角坐标系来表示,则它的横坐标是灰度级,纵坐标是该灰度出现的概率(像素的个数)。 using System; using System.Collections.Gener…

电梯门禁系统服务器一般在哪,别被吓住了,电梯门禁(梯控)安装其实并不难...

电梯门禁又称梯控&#xff0c;主要用于对电梯的出入权限进入控制&#xff0c;只有授权卡在读卡器刷过后&#xff0c;才能到达指定楼层。梯控的使用越来越普遍了&#xff0c;很多人觉得梯控很神秘&#xff0c;很高不可攀&#xff0c;其实说到底它不过是门禁的一种&#xff0c;只…

【转】c#数字图像处理(四)线性点运算

转自&#xff1a;https://www.cnblogs.com/dearzhoubi/p/8622325.html 灰度图像的点运算可分为线性点运算和非线性点运算两种。 4.1线性点运算定义 线性点运算就是输出灰度级与输入灰度级呈线性关系的点运算。在这种情况下,灰度变换函数的形式为: g(x, y)pf(x,y)L 其中 f(x,…

工作人员做好项目协调服务器,项目团队协作做好三件事

原标题&#xff1a; 项目团队协作做好三件事大家也许在小时候就听过三个和尚的故事&#xff1a;当庙里有一个和尚时&#xff0c;他一切自己做主&#xff0c;做得很自在;当庙里有两个和尚时&#xff0c;他们通过协商可以自觉地进行分工合作&#xff0c;同样做的不错;可当庙里来了…

给vc6插上翅膀

最重要的当然是VC助手了。。我比较喜欢低版本的Visual.Assist.v6.0.0.1079.zip&#xff0c;环保类型的 但无奈我的vs2005也想使用这个插件&#xff0c;所以我选择了VisualAssistXv10&#xff0c;目前装的是Visual.Assist.X.10.4.1626.0 以前还用过一些版本很奇怪的&#xff0c;…

【转】[程序集清单定义与程序集引用不匹配]分析及解决

转自&#xff1a;https://www.cnblogs.com/shuangzimuchangzhu/p/8572817.html 什么是程序集清单(Assembly Manifest)? 我们知道&#xff0c;在.net中。程序是以程序集为单位进行打包的&#xff0c;通常一个.exe文件或一个.dll文件就是一个程序集。程序集一般包含了以下几个部…

dos如何修改远程服务器的密码,dos命令登入远程服务器

dos命令登入远程服务器 内容精选换一换远程桌面链接Windows云服务器报错&#xff1a;连接被拒绝&#xff0c;因为没有授权此用户账户进行远程登录。Windows远程桌面相关权限配置异常。在运行窗口输入secpol.msc&#xff0c;打开组策略编辑器打开"本地策略 > 用户权限分…

设计模式C++实现 ——状态模式

软件领域中的设计模式为开发人员提供了一种使用专家设计经验的有效途径。设计模式中运用了面向对象编程语言的重要特性&#xff1a;封装、继承、多态&#xff0c;真正领悟设计模式的精髓是可能一个漫长的过程&#xff0c;需要大量实践经验的积累。最近看设计模式的书&#xff0…

【转】正确认识动脉压力波形

转自&#xff1a;https://www.sohu.com/a/288192545_377325 前言 早在50多年前&#xff0c;就已经在麻醉患者中开始进行直接动脉血压监测。尽管对动脉压力波形的形态和细节进行分析可以给我们提供一些有用的诊断信息&#xff0c;但现代的医生似乎很少关注它。临床实践中的这些…

2008服务器ftp上传文件,win2008怎么开通服务器ftp上传

win2008怎么开通服务器ftp上传 内容精选换一换GPU加速型实例如需使用OpenGL/DirectX/Vulcan等图形加速能力则需要安装GRID驱动并自行购买和配置使用GRID License。此外&#xff0c;GRID驱动配合vDWS类型License&#xff0c;也支持CUDA&#xff0c;用来满足既需要计算加速也需要…

【转】DICOM中几个判断图像方向的tag

转自&#xff1a;https://www.cnblogs.com/h2zZhou/p/9072967.html 在DICOM标准里&#xff0c;有三个TAG与成像的方向相关。 参考来源&#xff1a;Kitware关于DICOM方向的说明 http://public.kitware.com/IGSTKWIKI/index.php/DICOM_data_orientation 包括 1、Image Positi…

学习 SQL 语句 - Select(4): 排序

Order By Asc|Desc本例效果图:代码文件:unit Unit1;interfaceusesWindows, Messages, SysUtils, Variants, Classes, Graphics, Controls, Forms,Dialogs, StdCtrls, ExtCtrls, Grids, DBGrids, DB, ADODB;typeTForm1 class(TForm)DBGrid1: TDBGrid;DataSource1: TDataSource;…

【转】Ubuntu 16.04 远程桌面

转自&#xff1a;实现Windows直接远程访问Ubuntu 18.04&#xff08;旧版本也支持,无需安装第三方桌面,直接使用自带远程工具&#xff09; - 法号阿兴 - 博客园 一、设置Ubuntu 16.04 允许进行远程控制 首先&#xff0c;我们先设置Ubuntu的远程控制&#xff0c;将其设置为允许被…