Big-endian与Little-endian详尽说明

大端与小端存储详尽说明

大端与小端存储详尽说明
- 一. 什么是字节序
- 二. 什么是大端存储模式
- 三. 什么是小端存储模式
- 四. 大小端各自的特点
- 五. 为什么会有大小端模式之分
- 六. 为什么要注意大小端问题
- 六. 大小端判定程序
- 七. 大端小端的转换
- - 1）16位大小端转换
  - 2）32位大小端转换
- 八. 大小端数据的存取
- - 1）存储时
  - 2）读取时

一. 什么是字节序

字节序，也就是字节的顺序，指的是多字节的数据在内存中的存放顺序。
在几乎所有的机器上，多字节对象都被存储为连续的字节序列。
不同的CPU有不同的字节序类型，最常见的有两种：
Little-Endian：将低序字节存储在起始地址（低位编址），也就是小端存储模式。
Big-Endian：将高序字节存储在起始地址（高位编址），也就是下面说的大端存储模式。

二. 什么是大端存储模式

数据的低位保存在内存中的高地址中，数据的高位保存在内存中的低地址中；这样的存储模式有点儿类似于把数据当作字符串顺序处理：地址由小向大增加，而数据从高位往低位放；
高字节数据存储在低地址。
16进制数据：0x12345678
存储方式：（低地址）12|34|56|78（高地址）
数组表示：
buf[3] (0x78) – 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) – 高位
记忆方法: 地址的增长顺序与值的增长顺序相反。

三. 什么是小端存储模式

数据的低位保存在内存中的低地址中，数据的高位保存在内存中的高地址中；这种存储模式将地址的高低和数据位权有效地结合起来，高地址部分权值高，低地址部分权值低，和我们的逻辑方法一致。
16进制数据：0x12345678
存储方式：（低地址）78|56|34|12（高地址）
数组表示：
buf[3] (0x12) – 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) – 低位
记忆方法: 地址的增长顺序与值的增长顺序相同

四. 大小端各自的特点

小端模式：强制转换数据不需要调整字节内容，1、2、4字节的存储方式一样。
大端模式：符号位的判定固定为第一个字节，容易判断正负。网络传输一般使用的就是Big Endian，也被称之为网络字节序，或网络序。
在这里插入图片描述

五. 为什么会有大小端模式之分

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
我们常用的x86结构是小端模式，而KEIL C51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。
因此可以说大端存储或小端存储都是由系统设定的，两者区别在于低地址存储的数据，因此可以写程序进行判断。

六. 为什么要注意大小端问题

C/C++语言编写的程序里数据存储顺序是跟编译平台所在的CPU相关的，而JAVA编写的程序则唯一采用big endian方式来存储数据。试想，如果你用C/C++语言在x86平台下编写的程序跟别人的JAVA程序互通时会产生什么结果？就拿上面的 0x12345678来说，你的程序传递给别人的一个数据，将指向0x12345678的指针传给了JAVA程序，由于JAVA采取big endian方式存储数据，很自然的它会将你的数据翻译为0x78563412。
因此，在你的C程序传给JAVA程序之前有必要进行字节序的转换工作。

六. 大小端判定程序

请写一个C函数，若处理器是Big_endian的，则返回0；如果Little_endian的，则返回1。

int checkLittleEndian()
{{union w{int a;char b;} c;c.a = 1;return (c.b == 1);}
}

联合体union的存放顺序是全部成员都从低地址开始存放，解答利用该特性，轻松地得到了CPU对内存采用Little-endian仍是Big-endian模式读写。

void Endianness()
{int a = 0x12345678;if( *((char*)&a) == 0x78)cout << "Little Endian" << endl;elsecout << "Big Endian" << endl;
}

这一种是通过强制类型转换的方式来判断大小端的。如果是小端的话，低位字节0x78的内容应该是存放在低地址中。

七. 大端小端的转换

1）16位大小端转换

#define BSWAP_16(x) \   (uint_16)((((uint_16)(x) & 0x00ff) << 8) | \  (((uint_16)(x) & 0xff00) >> 8) \  )

或者是函数的形式

uint_16 bswap_16(uint_16 x)
{return (((uint_16)(x) & 0x00ff) << 8) | \(((uint_16)(x) & 0xff00) >> 8) ;
}

2）32位大小端转换

#define BSWAP_32(x) \   (uint_32)((((uint_32)(x) & 0xff000000) >> 24) | \  (((uint_32)(x) & 0x00ff0000) >> 8) | \  (((uint_32)(x) & 0x0000ff00) << 8) | \  (((uint_32)(x) & 0x000000ff) << 24) \  )

或者是函数的形式

uint_32 bswap_32(uint_32 x)  
{  return (((uint_32)(x) & 0xff000000) >> 24) | \  (((uint_32)(x) & 0x00ff0000) >> 8) | \  (((uint_32)(x) & 0x0000ff00) << 8) | \  (((uint_32)(x) & 0x000000ff) << 24) ;  
}

八. 大小端数据的存取

1）存储时

1）先按照数据类型开辟一个空间。
int a；4字节|——|——|——|——|
2）数据定义。a=0x123456；
3）数据分割成存储单元（字节）。
0x12——0x34——0x56
4）不用考虑谁先放谁后放，我们要按顺序放，先放0x12，再放0x34……
5）大端存储方式，先往低地址放
|0x12|0x34|0x56|——|
小段存储方式，先往高地址放
|——|0x56|0x34|0x12|

2）读取时

读取时：
1）大端依次读出，小端倒叙读出。读取时，字节内部是一个整体不受倒叙影响。
2）读取后，就和之前未存储时顺序一致了，也就是数没发生变化。
char只占有一个字节，因此字符不需要考虑大小端，而字符串又是单个字符的组合，因此也不需要考虑大小端。因此，在网络通信中，通信信息为字符串，不需要考虑大小端问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/590561.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！