文章目录
- 键入网址到网页显示,期间发生了什么?
- 1. HTTP
- 2. 真实地址查询 —— DNS
- 3. 指南好帮手 —— 协议栈
- 4. 可靠传输 —— TCP
- 5. 远程定位 —— IP
- 6. 两点传输 —— MAC
- 7. 出口 —— 网卡
- 8. 送别者 —— 交换机
- 9. 出境大门 —— 路由器
- 10. 互相扒皮 —— 服务器与客户端
键入网址到网页显示,期间发生了什么?
总结:
浏览器解析URL地址,根据解析得到的Web服务器和请求文件路径创建HTTP请求消息
=> 委托操作系统将该消息发送给Web服务器,故需要Web服务器的IP地址
=> 根据Web服务器的域名通过DNS查询Web服务器的IP地址
=> 查询到IP地址后,浏览器调用socket库委托协议栈
=> TCP报文(三报文握手,与服务器建立连接)
=> IP报文 => MAC报文 => 网卡(将数字信号转换为电信号在网线上传输)
=> 交换机 => (离开子网)路由器......
=> 路由器 => 交换机
=> 服务器 => 服务器进行扒皮 => 将请求的网页封装在HTTP响应报文
=> 加TCP、IP、MAC头部
=> 网卡 => 交换机 => 路由器....
=> 路由器 => 交换机
=> 客户端 => 客户端扒皮 => 给浏览器渲染页面
=> 客户端四报文挥手 => 连接断开
1. HTTP
浏览器第一步工作是解析URL
当蓝色部分URL元素省略,请求的是根目录下事先设置的默认文件
第二步:生产HTTP请求信息
根据web服务器和文件名生成HTTP请求
2. 真实地址查询 —— DNS
通过浏览器解析URL并生成请求消息后,委托操作系统将消息发送给Web服务器
发送前,查询服务器域名对应的IP地址,委托OS发送消息必须提供IP地址
DNS服务器: 保存Web服务器域名与IP的对应关系
域名的层级关系
由.分割,www.server.com 越靠右层级越高(其实com后还有一个.,代表根域名)
类似于树状结构
根域的DNS服务器信息保存在互联网的所有DNS服务器中。
因此,客户端只要找到任意一台DNS服务器,就可以通过它找到根域DNS服务器,再一路找到位于下层的某台目标DNS服务器
域名解析的工作流程
在①中,若本地DNS服务器在缓存里找到www.server.com则直接返回其IP地址,否则②
(指路不带路)
每次解析域名都要经过那么多的步骤?
浏览器会先看自身有没有对这个域名的缓存,如果有,就直接返回,如果没有,就去问操作系统,操作系统也会去看自己的缓存,如果有,就直接返回,如果没有,再去 hosts 文件看,也没有,才会去问「本地 DNS 服务器」。
3. 指南好帮手 —— 协议栈
通过DNS获取到IP后,就可以把HTTP的传输工作交给操作系统的协议栈
上面的部分向下面的部分委托工作
应用程序(浏览器)通过调用socket库,来委托协议栈工作。
协议栈:
- 上部分:负责收发数据的TCP协议和UDP协议,接收应用层的委托执行收发数据的操作
- 下部分:IP协议,控制网络包收发操作,将网络包发送给对方
- IP中还包括 ICMP 协议 和 ARP协议
- ICMP:告知网络包传送过程中产生的错误以及各种控制信息
- ARP:根据IP地址查询相应的以太网MAC地址
- IP中还包括 ICMP 协议 和 ARP协议
IP下面的网卡驱动程序负责控制网卡硬件,而最下面的网卡则负责完成实际的收发操作
数据包看了这份指南表示:“原来我需要那么多大佬的协助啊,那我先去找找 TCP 大佬!”
4. 可靠传输 —— TCP
HTTP基于TCP协议传输
TCP报文头部格式
-
源端口号、目的端口号:必不可少,如果没有,数据不知道发送给哪个应用
-
序号:解决包乱序的问题
-
确认号:目的是确认发出去对方是否收到,如果没有收到就应该重新发送,直到送达。解决丢包的问题
-
状态位:
- SYN:发起一个连接
- ACK:回复
- RST:重新连接
- FIN:结束连接
TCP是面向连接的,因此双方要维护连接状态,这些带状态位的包的发送,会引起双方状态变更
-
窗口大小:
- 流量控制
- 拥塞控制:控制发送的速度
TCP三次握手连接
- 客户端、服务端都处于CLOSE状态,先是服务端主动监听某个端口,处于LISTEN状态。 [ 收听状态 ]
- 客户端向服务端发起连接 SYN=1,seq=x,之后处于SYN-SENT状态 [ 同步已发送状态 ](SYN报文段不携带数据,但消耗一个序号)
- 服务端收到SYN后,发送SYN=1,ACK=1(ACK客户端的SYN),ack=x+1,seq=y,之后服务端处于SYN-RCVD状态 [ 同步收到状态 ]
- 客户端收到服务端的SYN和ACK后,发送对SYN的确认ACK = 1,seq=x+1,ack=y+1,之后客户端处于ESTABLISHED状态 [ 连接已建立 ],一发一收
- 服务端收到ACK的ACK后,处于ESTABLISHED状态,一发一收
服务器端的资源在完成第二次握手时分配,客户端的资源在完成第三次握手 时分配
查看TCP的连接状态
Linux: netstat -napt
TCP分割数据
HTTP请求消息较长,超过MSS
长度,需要把HTTP的数据拆解成一块块的数据发送
MTU
:网络包的最大长度,以太网中一般为1500字节
MSS
:除去IP和TCP头部后,一个网络包所能容纳的TCP数据的最大长度
数据会被以MSS
的长度为单位进行拆分,拆分出来的每一块数据都会被放进单独的网络包。在每个被拆分的数据加上TCP头信息,交给IP模块来发送数据
TCP报文生成
TCP协议里面有两个端口,一个是浏览器监听的端口(随机生成),一个是Web服务器监听的端口(HTTP默认端口号:80,HTTPS默认端口号:443)
双方建立连接后,TCP报文中数据部分存放HTTP头部+数据,TCP报文需交给网络层处理
TCP报文 = TCP头部+HTTP报文
5. 远程定位 —— IP
TCP模块在执行连接、收发、断开等各阶段操作时,都需要委托IP模块将数据封装成网络包发送给通信对象
IP报文头部格式
- 源地址IP:客户端输出的IP地址
- 目标地址IP:通过DNS域名解析得到的Web服务器IP
- 协议号:HTTP是经过TCP传输,IP包头的协议号填写06(十六进制),表示协议为TCP
假设客户端有多个网卡,就会有多个IP地址,IP头部的源地址选择哪个IP?
在多块网卡中判断应该选择哪块网卡发送包
根据路由表 规则,判断哪一个网卡作为源地址IP
Linux中使用 route -n 查看当前系统的路由表
假设Web服务器的目标地址是
192.168.10.200
将该目标地址与每条条目的子网掩码进行与运算,一致则匹配成功
注:第三条条目的目标地址和子网掩码都是0.0.0.0
,表示默认网关 ,如果其他所有条目都无法匹配,就会自动匹配这一行。并且后续就把包发给路由器,Gateway
即是路由器的 IP 地址。
IP报文 = IP头部+TCP头部+HTTP报文
6. 两点传输 —— MAC
网络包还需要在IP头部前面加上MAC头部
MAC包头格式
MAC头部是以太网使用的头部,包含了接收方和发送方的MAC地址等信息
MAC包头:发送方MAC地址、接收方目标MAC地址、协议类型
在TCP/IP通信里,MAC包头的协议类型只使用:
- 0800:IP协议
- 0806:ARP协议
确认发送方和接收方的MAC地址
- 发送方:网卡生产时写入到ROM,只要将该值读取即可
- 接收方:只要告诉以太网对方的MAC地址,以太网就会帮我们把包发送过去
- 搞清楚应该把包发给谁,这个只要查一下路由表就知道了。在路由表中找到相匹配的条目,然后把包发给
Gateway
列中的 IP 地址就可以了。
- 搞清楚应该把包发给谁,这个只要查一下路由表就知道了。在路由表中找到相匹配的条目,然后把包发给
已知接收方的IP地址,获取MAC地址
ARP协议: 广播形式
OS会把本次查询结果放到 ARP缓存 的内存空间留着以后用
发包时:先查询ARP缓存,如果其中已经保存了对方的MAC地址,就不需要发送ARP查询;若不存在,则发送ARP广播查询
查看ARP缓存内容
Linux: arp -a
MAC报文 = MAC头部 + IP头部 + TCP头部 + HTTP报文
7. 出口 —— 网卡
网络包只是存放在内存中的一串二进制数字信息,没有办法直接发送给对方
将数字信息转换为电信号 ,才能在网线上传输,这才是真正的数据发送过程
负责执行这一操作的是网卡,要控制网卡需要靠网卡驱动程序
网卡驱动获取网络包后,将其复制到网卡内的缓存区中,接着会在其开头加上报头和起始帧分界符,在末尾加上用于检测错误的帧检验序列
- 起始帧分界符:表示包起始位置的标记
- FCS:检查包传输过程是否有损坏
网卡将包转为电信号,通过网线发送出去
8. 送别者 —— 交换机
交换机:将网络包 原样 转发到目的地。工作在MAC层,也称为二层网络设备
电信号到达网线接口,交换机里的模块进行接收,交换机里的模块将电信号转换为数字信号
通过包末尾的FCS校验错误,若没问题则放到缓冲区。(这部分操作基本和计算机的网卡相同,但工作方式不同)
计算机网卡 vs. 交换机计算机网卡本身具有MAC地址,并通过核对收到的包的接收方MAC地址判断是不是发给自己,如果不是则丢弃交换机端口不具有MAC地址,不会核对接收方MAC地址,直接接收所有包到缓冲区。将包存入缓冲区后,查询这个包的接收方MAC地址是否已经在MAC地址表有记录
交换机的MAC地址表
- 设备的MAC地址
- 该设备连接在交换机的哪个端口
根据MAC地址找到对应端口,将信号发送到相应端口
MAC地址表找不到指定MAC地址?
原因:
- 具有该地址的设备还没有向交换机发送过包
- 这个设备一段时间没有工作导致地址被从地址表删除
解决:
交换机将包发送到除了源端口之外的所有端口。相应的接收者才会接收包,其他设备则忽略这个包。发送包后,目标设备返回响应包,交换机就可以将该MAC地址下入MAC地址表,下次可以直接查询
如果接收方MAC地址是一个广播地址,交换机会将包发送到除源端口之外的所有端口
(MAC:FF:FF:FF:FF:FF:FF IP:255.255.255.255)
数据包通过交换机转发抵达了路由器,准备要离开土生土长的子网了。
9. 出境大门 —— 路由器
网络包经过交换机后,到达路由器,并在此被转发到下一个路由器或目标设备(也是通过查表判断包转发的目标)
路由器与交换机的区别
- 路由器基于IP设计,俗称三层网络设备,路由器的各个端口都有MAC地址和IP地址
- 交换机基于以太网设计,俗称二层网络设备,交换机的端口不具有MAC地址
路由器基本原理
路由器端口具有MAC地址:能成为以太网的发送方和接收方
路由器端口具有IP地址:和计算机网卡一样
当转发包时,首先路由器端口会接收发给自己的以太网包,然后路由表查询转发目标,再由相应的端口作为发送方将以太网包发送出去。
路由器的包接收
电信号到达网线接口部分,路由器的模块将电信号转换为数字信号,通过包末尾的FCS进行错误校验。
如果没问题则检查MAC头部的接收方MAC地址,如果是发送给自己的包则放到接收缓冲区,否则就丢弃这个包
查询路由表确定输出端口
-
完成包接收后,路由器去掉包开头的MAC头部
MAC头部的作用就是将包送达路由器,接收方MAC地址就是路由器端口的MAC地址,包到达路由器后,MAC头部的作用完成,丢弃MAC头部
-
接下来,路由器根据MAC头部后的IP头部进行包转发操作
查询路由表做转发操作(同子网掩码与,看是否与对应条目的目标地址相同),若无匹配条目,则转发给默认路由
路由器的发送
根据 路由表的网关列 判断对方的地址
- 网关是一个IP地址,则这个IP地址就是要转发到的目标地址,还未抵达终点,仍需要路由器转发
- 网关为空,则IP头部的接收方IP地址就是要转发到的目标地址,也就是终于找到IP包头的目标地址了,说明已抵达终点
知道IP地址后,根据ARP协议,查询到接收方MAC地址(路由器中也有ARP缓存)
接下来是发送方 MAC 地址字段,这里填写输出端口的 MAC 地址。还有一个以太类型字段,填写 0800
(十六进制)表示 IP 协议。
网络包完成后,接下来会将其转换成电信号并通过端口发送出去。这一步的工作过程和计算机也是相同的。
发送出去的网络包会通过交换机到达下一个路由器。由于接收方 MAC 地址就是下一个路由器的地址,所以交换机会根据这一地址将包传输到下一个路由器。
接下来,下一个路由器会将包转发给再下一个路由器,经过层层转发之后,网络包就到达了最终的目的地。
不知你发现了没有,在网络包传输的过程中,源 IP 和目标 IP 始终是不会变的,一直变化的是 MAC 地址,因为需要 MAC 地址在以太网内进行两个设备之间的包传输。
数据包通过多个路由器道友的帮助,在网络世界途经了很多路程,最终抵达了目的地的城门!城门值守的路由器,发现了这个小兄弟数据包原来是找城内的人,于是它就将数据包送进了城内,再经由城内的交换机帮助下,最终转发到了目的地了。
10. 互相扒皮 —— 服务器与客户端
数据包抵达服务器后,服务器会先扒开数据包的 MAC 头部,查看是否和服务器自己的 MAC 地址符合,符合就将包收起来。
接着继续扒开数据包的 IP 头,发现 IP 地址符合,根据 IP 头中协议项,知道自己上层是 TCP 协议。
于是,扒开 TCP 的头,里面有序列号,需要看一看这个序列包是不是我想要的,如果是就放入缓存中然后返回一个 ACK,如果不是就丢弃。TCP头部里面还有端口号, HTTP 的服务器正在监听这个端口号。
于是,服务器自然就知道是 HTTP 进程想要这个包,于是就将包发给 HTTP 进程。
服务器的 HTTP 进程看到,原来这个请求是要访问一个页面,于是就把这个网页封装在 HTTP 响应报文里。
HTTP 响应报文也需要穿上 TCP、IP、MAC 头部,不过这次是源地址是服务器 IP 地址,目的地址是客户端 IP 地址。
穿好头部衣服后,从网卡出去,交由交换机转发到出城的路由器,路由器就把响应数据包发到了下一个路由器,就这样跳啊跳。
最后跳到了客户端的城门把守的路由器,路由器扒开 IP 头部发现是要找城内的人,于是又把包发给了城内的交换机,再由交换机转发到客户端。
客户端收到了服务器的响应数据包后,同样也非常的高兴,客户能拆快递了!
于是,客户端开始扒皮,把收到的数据包的皮扒剩 HTTP 响应报文后,交给浏览器去渲染页面,一份特别的数据包快递,就这样显示出来了!
最后,客户端要离开了,向服务器发起了 TCP 四次挥手,至此双方的连接就断开了。