本文目录
- 一、MAC地址
- 二、IP地址
- 三、子网掩码
- 四、TCP/IP四层模型
- 五、协议
- 六、socket
- 七、字节序
一、MAC地址
网卡是一块被设计用来允许计算机在计算机网络上进行通讯的计算机硬件,又称为网络适配器或网络接口卡NIC。其拥有 MAC 地址,属于 OSI模型的第2层,它使得用户可以通过电缆或无线相互连接。
每一个网卡都有一个被称为 MAC地址的独一无二的 48 位串行号。网卡的主要功能:1.数据的封装与解封装、2.链路管理、3.数据编码与译码。
MAC地址(Media Access Control Address),直译为媒体存取控制位址,也称为局域网地址以太网地址、物理地址或硬件地址,它是一个用来确认网络设备位置的位址,由网络设备制造商生产时烧录在网卡中。在 OSI 模型中,第三层网络层负责 IP 地址,第二层数据链路层则负责 MAC位址。MAC地址用于在网络中唯一标识一个网卡,一台设备若有一或多个网卡,则每个网卡都需要并会有一个唯一的 MAC 地址。
MAC地址的长度为 48 位(6个字节),通常表示为 12 个 16 进制数,如:00-16-EA-AE-3C-40 就是一个MAC 地址,其中前3个字节,16 进制数 00-16-EA 代表网络硬件制造商的编号,它由IEEE(电气与电子工程师协会)分配,而后3个字节,16进制数 AE-3C-40 代表该制造商所制造的某个网络产品(如网卡)的系列号。只要不更改自己的 MAC地址,MAC地址在世界是唯一的。也就是MAC地址就如同身份证上的身份证号码,具有唯一性。
二、IP地址
IP 协议是为计算机,网络相互连接进行通信而设计的协议。在因特网中,它是能使连接到网上的所有计算机网络实现相互通信的一套规则,规定了计算机在因特网上进行通信时应当遵守的规则。任何厂家生产的计算机系统,只要遵守IP协议就可以与因特网互连互通。各个厂家生产的网络系统和设备,如以太网、分组交换网等,它们相互之间不能互通,不能互通的主要原因是因为它们所传送数据的基本单元(技术上称之为“帧”)的格式不同。IP 协议实际上是一套由软件程序组成的协议软件,它把各种不同“帧"统一转换成“IP 数据报”格式,这种转换是因特网的一个最重要的特点,使所有各种计算机都能在因特网上实现互通,即具有“开放性"的特点。正是因为有了IP 协议,因特网才得以迅速发展成为世界上最大的、开放的计算机通信网络。因此,IP 协议也可以叫做“因特网协议"。
IP 地址(Internet Protocol Address)是指互联网协议地址,又译为网际协议地址。IP 地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。
IP 地址是一个 32 位的二进制数,通常被分割为4个“8 位二进制数”(也就是4个字节)。但是通常是以“点分十进制”表示成(a,b,c,d)的形式。
三、子网掩码
子网掩码是在 IPv4 地址资源紧缺的背景下为了解決 IP 地址分配而产生的虚拟IP 技术,通过子网掩码将A、B、C三类地址划分为若干子网,从而显著提高了 IP 地址的分配效率,有效解决了 IP 地址资源紧张的局面。另一方面,在企业内网中为了更好地管理网络,网管人员也利用子网掩码的作用,人为地将一个较大的企业内部网络划分为更多个小规模的子网,再利用三层交换机的路由功能实现子网互联,从而有效解决了网络广播风暴和网络病毒等诸多网络管理方面的问题。
在大多数的网络教科书中,一般都将子网掩码的作用描述为通过逻辑运算,将IP 地址划分为网络标识(Net.ID)和主机标识(Host.ID),只有网络标识相同的两台主机在无路由的情况下才能相互通信。
根据 RFC950 定义,子网掩码是一个 32 位的2进制数,其对应网络地址的所有位都置为1,对应于主机地址的所有位置都为 0。子网掩码告知路由器,地址的哪一部分是网络地址,哪一部分是主机地址,使路由器正确判断任意 IP 地址是否是本网段的,从而正确地进行路由。网络上,数据从一个地方传到另外一个地方,是依靠 IP 寻址。从逻辑上来讲,是两步的。第一步,从IP 中找到所属的网络,好比是去找这个人是哪个小区的:第二步,再从 IP 中找到主机在这个网络中的位置,好比是在小区里面找到这个人。
子网掩码的设定必须遵循一定的规则。与二进制IP地址相同,子网掩码由1和0组成,且1和0分别连续。子网掩码的长度也是 32 位,左边是网络位,用二进制数字“1"表示,1的数目等于网络位的长度;右边是主机位,用二进制数字“0”表示,0 的数目等于主机位的长度。这样做的目的是为了让掩码与IP地址做按位与运算时用0遮住原主机数,而不改变原网络段数字,而且很容易通过0的位数确定子网的主机数(2 的主机位数次方-2,因为主机号全为1时表示该网络广播地址,全为0时表示该网络的网络号,这是两个特殊地址)。通过子网掩码,才能表明一台主机所在的子网与其他子网的关系,使网络正常工作。
四、TCP/IP四层模型
五、协议
应用层常见的协议有:FTP协议(File Transfer Protocol文件传输协议)、HTTP协议(Hyper TextTransfer Protocol超文本传输协议)、NFS(Network File System 网络文件系统)。
传输层常见协议有:TCP协议(Transmission Control Protocol传输控制协议)、UDP协议(UserDatagram Protocol 用户数据报协议)。
网络层常见协议有:IP 协议(Internet Protocol因特网互联协议)、ICMP协议(Internet ControlMessage Protocol 因特网控制报文协议)、IGMP 协议(Internet Group Management Protocol 因特网组管理协议)。
网络接口层常见协议有:ARP协议(Address Resolution Protocol地址解析协议)、RARP协议(Reverse Address Resolution Protocol 反向地址解析协议)。
- UDP协议
- TCP
- IP协议
- 以太网帧协议
类型:0x800表示 IP、0x806表示 ARP、0x835表示 RARP
- ARP协议
- 数据包封装分用过程
六、socket
socket 可以看成是两个网络应用程序进行通信时,各自通信连接中的端点,这是一个逻辑上的概念。它是网络环境中进程间通信的 AP!,也是可以被命名和寻址的通信端点,使用中的每一个套接字都有其类型和一个与之相连进程。通信时其中一个网络应用程序将要传输的一段信息写入它所在主机,的 socket 中,该 socket 通过与网络接口卡(NIC)相连的传输介质将这段信息送到另外一台主机的 socket 中,使对方能够接收到这段信息。socket 是由IP 地址和端口结合的,提供向应用层进程传送数据包的机制。
socket 本身有“插座”的意思,在 Linux 环境下,用于表示进程间网络通信的特殊文件类型。本质为内核借助缓冲区形成的伪文件。既然是文件,那么理所当然的,我们可以使用文件描述符引用套接字。与管道类似的,Linux 系统将其封装成文件的目的是为了统一接口,使得读写套接字和读写文件的操作一致。区别是管道主要应用于本地进程间通信,而套接字多应用于网络进程间数据的传递。
七、字节序
现代 CPU 的累加器一次都能装载(至少)4 字节(这里考虑 32 位机),即一个整数。那么这 4字节在内存中排列的顺序将影响它被累加器装载成的整数的值,这就是字节序问题。在各种计算机体系结构中,对于字节、字等的存储机制有所不同,因而引发了计算机通信领域中一个很重要的问题,即通信双方交流的信息单元(比特、字节、字、双字等等)应该以什么样的顺序进行传送。如果不达成一致的规则,通信双方将无法进行正确的编码/译码从而导致通信失败。
字节序分为大端字节序(Big-Endian)和小端字节序(Little-Endian)。
大端字节序是指一个整数的最高位字节(23~31 bit)存储在内存的低地址处,低位字节(0~7 bit)存储在内存的高地址处;小端字节序则是指整数的高位字节存储在内存的高地址处,而低位字节则存储在内存的低地址处。
通过下面的代码可以测出自己正在用的linux虚拟机是小端序还是大端序:
通过定义一个联合体(union)来实现检测。联合体中包含一个2字节的short变量value和一个长度为2的字符数组bytes。由于联合体的特性,value和bytes共享同一块内存空间。
代码将value赋值为0x0102,然后检查bytes数组中的两个字节的值。如果bytes[0]等于1且bytes[1]等于2,说明当前主机使用的是大端字节序;如果bytes[0]等于2且bytes[1]等于1,说明当前主机使用的是小端字节序。如果既不满足大端也不满足小端的条件,则输出“未知”。
这段代码利用了联合体的内存共享特性,通过检查value的字节存储顺序来判断当前主机的字节序。
#include <stdio.h>int main() {union {short value; // 2字节char bytes[sizeof(short)]; // char[2]} test;test.value = 0x0102;if((test.bytes[0] == 1) && (test.bytes[1] == 2)) {printf("大端字节序\n");} else if((test.bytes[0] == 2) && (test.bytes[1] == 1)) {printf("小端字节序\n");} else {printf("未知\n");}return 0;
}
当格式化的数据在两台使用不同字节序的主机之间直接传递时,接收端必然错误的解释之。解决问题的方法是:发送端总是把要发送的数据转换成大端字节序数据后再发送,而接收端知道对方传送过来的数据总是采用大端字节序,所以接收端可以根据自身采用的字节序决定是否对接收到的数据进行转换(小端机转换,大端机不转换)。
网络字节顺序是 TCP/IP 中规定好的一种数据表示格式,它与具体的 CPU 类型、操作系统等无关,从而可以保证数据在不同主机之间传输时能够被正确解释,网络字节顺序采用大端排序方式。
BSD Socket提供了封装好的转换接口,方便程序员使用。包括从主机字节序到网络字节序的转换函数:htons、htonl;从网络字节序到主机字节序的转换函数:ntohs、ntohl。(如果本身就是大端了,那么函数不会进行转换。)
h - host 主机,主机字节序
to - 转换成什么
n - network 网络字节序
s - short unsigned short
l - long unsigned int
#include <arpa/inet.h>
// 转换端口
uint16_t htons(uint16_t hostshort); // 主机字节序 - 网络字节序
uint16_t ntohs(uint16_t netshort); // 主机字节序 - 网络字节序
// 转IP
uint32_t htonl(uint32_t hostlong); // 主机字节序 - 网络字节序
uint32_t ntohl(uint32_t netlong); // 主机字节序 - 网络字节序
示例代码如下:
// htons 转换端口unsigned short a = 0x0102;printf("a : %x\n", a);unsigned short b = htons(a);printf("b : %x\n", b);输出:
a : 102
b : 201
// htonl 转换IPchar buf[4] = {192, 168, 1, 100};int num = *(int *)buf;int sum = htonl(num);unsigned char *p = (char *)∑printf("%d %d %d %d\n", *p, *(p+1), *(p+2), *(p+3));printf("=======================\n");// ntohlunsigned char buf1[4] = {1, 1, 168, 192};int num1 = *(int *)buf1;int sum1 = ntohl(num1);unsigned char *p1 = (unsigned char *)&sum1;printf("%d %d %d %d\n", *p1, *(p1+1), *(p1+2), *(p1+3));输出:
100 1 168 192
192 168 1 1
(上面的代码中:这里将buf的地址强制转换为int类型的指针,然后解引用得到一个整数num。但是这种类型转换是不安全的,因为buf是一个char数组,直接将其地址转换为int指针并解引用可能会导致未定义行为。在实际应用中,应该使用memcpy来安全地将字节数组转换为整数。假设num为:0x6401A8C0,经历过htonl之后,sum的值为0xC0A80164)