Linux网络——深入理解传入层协议TCP

目录

一、前导知识

1.1 TCP协议段格式

1.2 TCP全双工本质

二、三次握手

2.1 标记位

2.2 三次握手

2.3 捎带应答

2.4 标记位 RST

三、四次挥手

3.1 标记位 FIN

四、确认应答(ACK)机制

五、超时重传机制

六 TCP 流量控制

6.1 16位窗口大小

6.2 标记位 PSH

6.3 标记位 URG

七、滑动窗口

7.1 滑动窗口的概念 

7.2 滑动窗口的相关问题

7.2.1 滑动窗口的大小

7.2.2 滑动窗口策略简单思路

7.2.2 超时重传时的数据如何保存

7.2.3 超时重传 vs 快重传

八、拥塞窗口


一、前导知识

1.1 TCP协议段格式

源/目的端口号:表示数据是从哪个进程来, 到哪个进程去;
32 位序号/32 位确认号:后面详细讲;
4 位 TCP 报头长度:表示该 TCP 头部有多少个 32 位 (有多少个 4 字节);所以TCP 头部最大长度是 15(2^4 - 1) * 4 = 60
6位标志位:后面具体说
16位窗口大小:后面再说
16位校验和:发送端填充,CRC 校验。接收端校验不通过,则认为数据有问题。此处的检验和不光包含 TCP 首部,也包含 TCP 数据部分
16 位紧急指针:后面和标志位中的URG一起说

1.2 TCP全双工本质


在任何一台主机上, TCP 连接既有发送缓冲区, 又有接受缓冲区, 所以, 在内核中, 可以在发消息的同时, 也可以收消息, 即全双工。在这里,收消息和发消息的本质都变成了拷贝,发消息首先把应用层的数据拷贝到发送缓冲区,然后再拷贝到接受方的接受缓冲区,接受方再通过特殊的 API 将接受缓冲区中的数据拷贝到应用层。

二、三次握手

2.1 标记位

为什么要有标记位呢?这里先做一下简单的理解:
作为网络服务器,服务端可以连接多个客户端,但是每个客户端发送的报文分为很多种,以三次握手为例,该报文可能是1)请求连接 2)正文 3)请求关闭 ,所以客户端收到各种各样的报文,这就说明TCP报文是需要类型的,为了区分不同的报文类型,就引入了标记位的概念。

2.2 三次握手

1. TCP建立连接时,发送方先传达一个连接意愿

2. 接收方收到后需要响应这个消息,若不响应,发送方可能会一直重发消息。除此之外,接收方还要表达连接意愿

3.发送方响应接收方的意愿。

首先需要明确的是,上图中的标记位其实是一个个报文,其中SYN指的是报文中SYN标记位被置为1,以此类推:

SYN:请求建立连接,称携带SYN标识的报文为同步报文段。
ACK:确认号是否有效。

其中,当请求方发送连接意愿时,就会发送将SYN标记位置1的报文,接收方相应表示为ACK标记位置1,同时表达连接意愿又会将SYN置1...这种方式即为捎带应答(下面会讲到)。

在这里,配合着上一篇博客中对于TCP网络编程中相关的API来看:
client 通过应用层的 connect 接口发送握手请求,然后阻塞等待三次握手完毕,再继续向后执行
server 通过 listen 接口才会受理接受的 SYN 请求,否则会直接丢弃。

2.3 捎带应答

捎带应答相当于搭顺风车,当不影响网络服务时,ACK 会和服务器的接受意愿一起发送给客户端。但是,在四次握手中并没有出现捎带应答机制,者在下面会讲到。

其实不止是服务器首次回应连接意愿时会有捎带应答,在后面我们要讲到的窗口大小,它们在首次发送时,就会将窗口大小填到报文中传输给发送端,同时,在两次握手后,即发送端确认接受端已经可以接受数据后,发送端相应的ACK就可以开始携带传输数据了!

2.4 标记位 RST

在传输控制协议(TCP)中,RST标记位(Reset flag)用于复位连接。RST标记位通常在以下情况下使用:

  1. 拒绝连接:当一方收到一个连接请求(例如SYN包),但不愿意或者无法建立连接时,它会发送一个带有RST标记位的包来拒绝连接请求。

  2. 中止连接:当一个已经建立的连接出现问题(例如,某一方的应用程序崩溃),一方可能会发送一个带有RST标记位的包来强制终止连接。

  3. 处理错误的数据包:如果一方收到一个无法识别或不符合预期的数据包,它可能会发送一个带有RST标记位的包来通知发送方存在错误并终止连接。

具体来说,当一个TCP数据包的RST标记位被设置时,接收方会立即关闭连接,并不会等待剩余的数据传输完成。这是一种快速且强制性的连接终止方式。

RST标记位的使用通常表示存在某种异常或错误情况,因此在正常的TCP连接管理过程中,RST标记位的出现相对较少。

三、四次挥手

1. 发送方发起断开意愿

2. 接收端响应消息

3. 接收方表达断开意愿

4. 发送方响应断开意愿

3.1 标记位 FIN

这和三次握手的规律大致相同,只是把中间一条拆分成了两条,其中2和3不可以合并为一条,当接收方等待数据数据接收完整后,才可以表达断开意愿。


FIN:通知对方,本端要关闭了,称携带FIN表示的报文为结束报文段

四、确认应答(ACK)机制

在TCP的特点中,有一点叫做:可靠。那么TCP的可靠指的是什么呢?

TCP的可靠指的是,发送方不仅要发送数据,而且还要知道自己发送的数据是否被接收方接收,这就依赖于TCP的确认应答机制。

TCP 将每个字节的数据都进行了编号,即为序列号:

TCP 将应用程序发送的字节流分割成适合传输的段,每个段包含一个序列号,用于在接收端重新组装数据。接收方可以根据这些序列号将数据段正确地拼接成原始的字节流。

下面将发送缓冲区简单想象成线性的数组:

假设主机A发送的数据段是 1-1000 ,那么主机B的应答则需要是 1001 ,此时1001就会写到协议段中的32位确认序号中,表示确认序号以前的报文全部被收到。

五、超时重传机制

若发送方未收到接受方的应答,则统一约定接受方未收到报文,此时有三种可能:
1) 传输数据丢失 2) 应答丢失 3) 被阻塞在路由器中

为了避免第三种情况,发送方会进行等待,如果等待超时,则会进行重传,这就是超时重传机制。超时重传中约定的等待时间在 Linux 系统中会以500ms为基本单位进行动态调整。

六 TCP 流量控制

接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。

因此 TCP 支持根据接收端的处理能力, 来决定发送端的发送速度。这个机制就叫做流量控制。

6.1 16位窗口大小

那么,假设主机A向主机B发送消息,如果要进行流量控制,就需要知道主机B的接受能力,即接受缓冲区中剩余空间的大小。这就要求主机B要将自身的接受能力通告给主机A,这里就用到了TCP协议段格式中的16位窗口大小,用于标明主机B接受缓冲区中剩余空间的大小,同时使用了确认应答机制与捎带应答机制。

6.2 标记位 PSH

当B的接受缓冲区中剩余空间大小为0时,A在此期间会发送一个窗口探测的包,如果B的接受缓冲区一直为0,A就会将报文中的 PSH 标记位置1作为催促标记位,要求主机B尽快将缓冲区中的数据交给上层。

当然不止是这种极端情况,在日常通信中,凡是有这种需求时,都会将标记位 PSH 置1。

6.3 标记位 URG

以上已经介绍了五种标记位,现在剩下最后一种 URG ,URG表示紧急指针是否有效。

在接受缓冲区中,TCP按序为我们排好了很多的数据并按序向应用层进行交付,
紧急指针:仅当URG标记位被设置时才有效。它指示了紧急数据的结束位置。紧急指针的值是一个相对序号,它表示从当前序号开始到紧急数据结束的偏移量。

接受方会优先处理该报文,但是URG的使用并不常见,它传输的紧急数据通常是1字节,表示的是一个状态码,比如在传输2G的数据时,接受方的缓冲区已经接受了1G,此时发送方想要紧急停止传输工作,就会传输一个 URG 被设置的报文,接受方优先处理该报文得知其状态码意味着中断传输,那么之前存放在缓冲区的1G数据也不会再向上进行交付

七、滑动窗口

在前面的讲解中,我们也会意识到,每次先传输数据等待应答后才能再次传输的效率太低了,尤其是数据往返的时间较长的时候:

7.1 滑动窗口的概念 

既然这样一发一收的方式性能较低, 那么我们一次发送多条数据,这些数据暂时不需要被应答,可以直接发送,这样就可以大大的提高性能(其实是将多个段的等待时间重叠在一起了),这种策略在发送方的体现就是以一个滑动窗口的形式:

在不考虑网络的前提下,将暂时不需要应答,可以直接发送的数据的最大值称为发送方的滑动窗口的大小,上图中滑动窗口的大小就是4000字节。

滑动窗口其实就是在发送窗口上的双指针之间的一个数据段:

从上图我们可以把发送缓冲区分为三段:

7.2 滑动窗口的相关问题

重中之重:
确认序号的意义:确认序号以前的报文全部被收到

7.2.1 滑动窗口的大小

在不考虑网络速度的前提下,窗口的大小一般是接受方接收缓冲区中剩余空间的大小。

7.2.2 滑动窗口策略简单思路

7.2.2 超时重传时的数据如何保存

前面提到了确认序号的意义以及滑动窗口的策略,当有数据丢包时,比如1001-2000丢了,那么确认应答的值就为1001,从滑动窗口的策略可以看出:左指针仍是1001,这意味着1001-2000的数据仍在滑动窗口中,那么发送方就可以进行数据的重传。

当某一段报文段丢失之后, 发送端会一直收到 1001 这样的 ACK, 就像是在提醒发送端 "我想要的是 1001" 一样;
如果发送端主机连续三次收到了同样一个 "1001" 这样的应答, 就会将对应的数据 1001 - 2000 重新发送;
这个时候接收端收到了 1001 之后, 再次返回的 ACK 就是 7001 了(因为 2001 -7000)接收端其实之前就已经收到了, 被放到了接收端操作系统内核的接收缓冲区中;
这种机制被称为 "高速重发控制"(也叫 "快重传")

在滑动窗口中,可以分为窗口最左侧数据丢包,窗口中间数据丢包,窗口最右侧数据丢包,但是根据确认序号的意义,每次的确认序号都会保证确认序号前面的数据全部被成功接收,如果最左侧数据被丢包那么就参考以上方案。如果中间和右侧数据被丢包,那么它们最后都会称为滑动窗口中的最左侧,解决方案也同上一样。

7.2.3 超时重传 vs 快重传

从上面可以看出快重传的效率明显高于超时重传,超时重传需要等待一定的时间,而快重传接受到确认应答即可实现重传,那么超时重传的存在还有意义吗?

其实,从7.2.2中的图中可以看出接受方需要发送3次重复的确认应答,发送方也需要收到3个同样的确认应答才会重发,那么总有不足3个的情况,这时候发生生丢包,就需要超时重传进行兜底。

八、拥塞窗口

虽然 TCP 有了滑动窗口这个大杀器, 能够高效可靠的发送大量的数据. 但是如果在刚开始阶段就发送大量的数据, 仍然可能引发问题。因为网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下,贸然发送大量的数据,是很有可能引起雪上加霜的。

TCP 引入 慢启动 机制, 先发少量的数据, 探探路, 摸清当前的网络拥堵状态, 再决定按照多大的速度传输数据

此处引入一个概念称为拥塞窗口:
1.发送开始的时候, 定义拥塞窗口大小为 1;
2.每次收到一个 ACK 应答, 拥塞窗口加 1
3.每次发送数据包的时候, 将拥塞窗口和接收端主机反馈的窗口大小做比较, 取较小的值作为实际发送的窗口。

实际上,拥塞窗口并不是一直呈指数增长的,这里引入了新的概念,即慢启动的阈值,当拥塞窗口超过这个阈值的时候, 不再按照指数方式增长, 而是按照线性方式增长

当 TCP 开始启动的时候,慢启动阈值等于窗口最大值;
•在每次超时重发的时候,慢启动阈值会变成原来的一半,同时拥塞窗口置回 1;
少量的丢包, 我们仅仅是触发超时重传;大量的丢包,就认为网络拥塞;
当 TCP 通信开始后, 网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是 TCP 协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案。

TCP 拥塞控制这样的过程, 就好像热恋的感觉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/51670.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv5改进 | 卷积模块 | 无卷积步长用于低分辨率图像和小物体的新 CNN 模块SPD-Conv

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 专栏目录: 《YOLOv5入门 改…

[ WARN:0@0.014] global loadsave.cpp:248 cv::findDecoder imread_

[ WARN:00.014] global loadsave.cpp:248 cv::findDecoder imread_ 目录 [ WARN:00.014] global loadsave.cpp:248 cv::findDecoder imread_ 【常见模块错误】 【解决方案】 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英杰…

20240729 每日AI必读资讯

Meta科学家最新采访,揭秘Llama 3.1是如何炼成的 - Llama 3.1都使用了哪些数据?其中有多少合成数据?为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的? - 受访者Thomas Scialom现任…

Go语言教程(一看就会)

全篇文章 7000 字左右, 建议阅读时长 1h 以上。 Go语言是一门开源的编程语言,目的在于降低构建简单、可靠、高效软件的门槛。Go平衡了底层系统语言的能力,以及在现代语言中所见到的高级特性。它是快速的、静态类型编译语言。 第一个GO程序…

嵌入式人工智能(32-基于树莓派4B的旋转编码器-EnCoder11)

1、旋转编码器 旋转编码器是一种输入设备,通常用于测量和控制旋转运动。它由一个旋转轴和一系列编码器组成。旋转编码器可以根据旋转轴的位置和方向来测量旋转角度,并将其转化为电子信号输出。 旋转编码器通常分为两种类型:绝对值编码器和增…

嵌入式学习Day13---C语言提升

目录 一、二级指针 1.1.什么是二级指针 2.2.使用情况 2.3.二级指针与数组指针 二、指针函数 2.1.含义 2.2.格式 2.3.注意 2.4.练习 三、函数指针 3.1.含义 3.2.格式 3.3.存储 3.4.练习 ​编辑 四、void*指针 4.1.void缺省类型 4.2.void* 4.3.格式 4.4.注…

H3CNE(OSPF动态路由)

目录 7.1 静态路由的缺点与动态路由分类 7.1.1 静态路由的缺点 7.1.2 动态路由的分类 7.2 OSPF基础 7.2.1 OSPF的区域 ​编辑 7.2.2 Router-id 7.2.3 开销-Cost or Metric 7.2.4 路由转发 7.3 OSPF邻居表建立过程 7.3.1 五种包 7.3.2 建立邻居表的第一步 7.3.3 邻居建立…

模拟实现短信登录功能 (session 和 Redis 两种代码实例) 带前端演示

目录 整体流程 发送验证码 短信验证码登录、注册 校验登录状态 基于 session 实现登录 实现发送短信验证码功能 1. 前端发送请求 2. 后端处理请求 3. 演示 实现登录功能 1. 前端发送请求 2. 后端处理请求 校验登录状态 1. 登录拦截器 2. 注册拦截器 3. 登录完整…

RocketMQ事务消息机制原理

RocketMQ工作流程 在RocketMQ当中,当消息的生产者将消息生产完成之后,并不会直接将生产好的消息直接投递给消费者,而是先将消息投递个中间的服务,通过这个服务来协调RocketMQ中生产者与消费者之间的消费速度。 那么生产者是如何…

昇思25天学习打卡营第19天|DCGAN生成漫画头像

DCGAN生成漫画头像总结 实验概述 本实验旨在利用深度卷积生成对抗网络(DCGAN)生成动漫头像,通过设置网络、优化器以及损失函数,使用MindSpore进行实现。 实验目的 学习和掌握DCGAN的基本原理和应用。熟悉使用MindSpore进行图像…

网络协议一 : 搭建tomacat,intellij IDEA Ultimate 的下载,安装,配置,启动, 访问

需要搭建的环境 1.客户端--服务器开发环境 客户端:浏览器(HTMLCSSJS) 服务器:JAVA 1.安装JDK,配置JAVA_HOME 和 PATH 2.安装Tomcat 3.安装IDE--intellij IDEA Ultimate 是旗舰版的意思。 2.TOMCAT 的下载和解…

文件操作相关的精讲

目录: 思维导图 一. 文件定义 二. 文件的打开和关闭 三. 文件的顺序读写操作 四. 文件的随机读写操作 五. 文本文件和二进制文件 六. 文件读取结束的判断 七.文件缓冲区 思维导图: 一. 文件定义 1.文件定义 C语言中,文件是指一组相…

Java中的二叉搜索树(如果想知道Java中有关二叉搜索树的知识点,那么只看这一篇就足够了!)

前言:Java 提供了丰富的数据结构来处理和管理数据,其中 TreeSet 和 TreeMap 是基于红黑树实现的集合和映射接口。它们有序地存储数据,提供高效的搜索、插入和删除操作。 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨✨✨想要了解更多内容可以访问我的主…

web基础,http协议,apache概念及nginx

一、web相关概念 Web,全称World Wide Web,通常简称为WWW、Web或万维网,是一个基于超文本和HTTP(超文本传输协议)的、全球性的、动态交互的、跨平台的分布式图形信息系统。它起源于1989年,由英国科学家蒂姆…

文本编辑三剑客(grep)

目录 正则表达式 元字符 grep 案例 我在编写脚本的时候发现,三个文本编辑的命令(grep、sed、awk,被称为文本编辑三剑客,我习惯叫它三巨头)用的还挺多的,说实话我一开始学的时候也有些懵,主要…

(史上最全的)Spring6框架学习教程

一、什么是Spring 1.javaWeb框架发展史 1、ServletJSPJavaBean(跳转页面、业务逻辑判断、数据库查询) 2、MVC三层架构(M Model pojo(User)V-view(USP)C-(controller-servlet)) (web-跳转页面service-业务逻辑判断 new UserService0;dao-数据库查询 new UserDao(); ) 3、使用…

二、八、十、十六进制介绍及相互转换

目录 1、引言: 2、进制介绍及区分 2.1 介绍 2.2 区分 2.3 各进制的数字组成 3、2进制与10进制 3.1 十进制的介绍 3.2 二进制的介绍 4、2进制与10进制的转换 4.1 二进制转十进制 4.2 十进制转二进制 5、8进制和16进制 5.1 八进制的介绍 5.2 十六进制的介…

告别抠图烦恼,1秒搞定100张图片背景更换!

想象一下,你手头有几十张甚至上百张证件照需要从白底换成蓝底,而你只能用Photoshop一张张抠图,调整,然后保存。这个过程不仅耗时,还容易出错,特别是当你急需处理大量图片时,简直让人抓狂。 千鹿…

“云+端”体系覆盖590余所学校,张家口如何建设“教育一朵云”?

当将装有小苏打的气球套在装有白醋的塑料瓶瓶口时,一场令人惊叹的化学反应开始上演——瓶内瞬间白雾腾起弥漫,气泡翻滚不息,气球逐渐吹了起来......这是在张家口教育云平台上的由学生及家长上传的关于“小苏打吹气球”的科学实验视频,而学生们与家长参与的便是张家口市中小学云…

昇思MindSpore学习入门-静态图高级编程技巧二

如何优化执行性能 使用jit_class 使用场景:使用jit_class装饰器修饰自定义类,提高执行性能。jit_class应用于静态图模式,在动态图模式下,jit_class会被忽略,不影响动态图模式的执行逻辑。 jit_class的介绍 用户在网…