当我们说TCP是可靠协议时,我们真正表达的是什么

转载出处:https://blog.csdn.net/dog250/article/details/82177299
很明确地说,从通信意义上推敲,TCP一点都不可靠。一个抽象的协议,怎么可能左右介质来保证可靠,不存在的。但凡是经由某种介质的通信行为均不可能是绝对可靠的!

正好比我们现实生活中的保险,其实它什么都不能阻止,什么风险也保证不了它的不发生,它保证不了飞机不会掉下来,也无法阻止人生病…事实上,TCP就是通信中的保险业。

TCP是如何设计出来的?推而广之这类通信协议是如何设计出来的?如果说让你在一个不可靠的介质上运行一个可靠的协议,你该怎么做?本文将介绍内中的些许因果。

可靠的通信协议如何构建

这要从经典的两军问题说起。

首先介绍一下两军问题,来自Wiki的解说是最好的:
Two Generals’ Problem:https://en.wikipedia.org/wiki/Two_Generals%27_Problem
两军问题本质上一个一致性确认问题,也就是说通信双方而不是一方(这对理解TCP非常重要)都要确保信息的一致性。即假设通信双方为A和B,那么A发送一则消息M给B,所谓的可靠性则是要同时满足下面的条件:

  • 信道是不可靠的,任何消息均可能以任何概率丢失
  • 如果AA不能确保消息到达对方时,不能重发消息
    这一点非常重要,在经典的两军问题中,消息是由信使传递的,而信使是人,人是军队作战的最重要资源也是最不可靠的资源,比如会叛变…因此每条消息或者确认相互只能派遣一个信使去递送消息,在通信上讲,就是消息不能重发!
  • 对于A而言,要确保A知道B已经收到了M
  • 对于B而言,要确保自己收到M这件事已经被A知道

数学上很容易用反证法证明上述的两军问题是根本无解,即一致性通信的完全可靠性是一种奢望。下面我来试着推导一下。

假设在时间点TnTn的传输,我们知道,信道是不可靠的,所以它可能会丢失,而它一旦丢失,整个交互过程便失去了一致性,这与假设是矛盾的,所以,一致性是不可能的


这个问题貌似彻底拆了通信技术的根基,那么通信技术还有什么意义呢?

事实上,

  • 首先,通信协议从来都不是为了满足完全的一致性需求

通信的意义是,在时间序列上满足消息传递的单向完成需求即可!通信的本质问题是确保消息传递,而不是维护一致性,一致性应该由业务自身来负责,通信仅仅提供消息传递的基础设施而已。

  • 其次,通信传输的是字节电脉冲,消息可以重发

这便大大削弱了两军问题的强约束。基于上述的假设,我们来一步步地推导出TCP协议为什么要这么设计。

如果仔细推敲的话,你会发现,即便是消息传递,在数学上也是无法确保在不可靠的信道上确保消息传递的,然而,我们换个思路,即自问“信道到底不可靠到什么程度?”

是100%不可靠吗?如果是的话,意味着断路,即双方是不可达的,无论我们发送多少次数据包,均会丢失,这样我们马上可以结束这个没有意义的讨论,因此,所谓的不可靠只是说信道会出现概率性丢包,丢包概率pp之间的!

这个意义十分重大,这意味着,只要我们重试特定消息MnMn的确认!,这是完全确定的一个结论,没人反对吧。

这边自然而然导出了可靠通信的第一个原则:

  • 1.超时重传

该原则可以确保消息一定能有机会到达对端。每当发出一个数据包,在预期的时间内没有确认到达,就重传它。关于超时重传的细节,本文稍后会浅谈一下,但是现在,我们来看另外一个问题。


如何确保消息单向传递的完成?

换句话说,所谓消息单向传递的完成,即需要一种标志性的信号*,该信号揭示了消息已经被对端接收这个事实,很显然,对端发送针对特定消息的确认并且本端收到即可。

一旦AA,不然它也不会发送确认。但是由上文可知,这个确认在不可靠的信道上也可能丢失,不过这不必惊慌,因为我们已经有了推论,即针对任意消息,只要我们重复传输的次数足够多,该消息就一定能到达对端,在该推论下,采用超时重传原则即可。

现在看来,我们导出的下列措施已经解决了几乎所有问题:
1. 针对消息MnMn的超时重传机制

但是这是最优解吗?

非也!这只是一种可行的方案,但不是唯一的方案,更不是最有的方案。导出最优解需要我们深入到通信网络的本质,先看一篇文章:
马太效应/幂律分布的本质以及其数学表述:https://blog.csdn.net/dog250/article/details/79146511
注意,我们的通信网络是一个网状拓扑的连通图,无论是单节点连接数属性还是流量属性均符合幂律规律,从双对数坐标曲线可以看出网络规模和节点的各属性特征之间的对数线性关系,而网络规模来自于某种指数级增长的复制,单节点的属性特征来自于该节点的行为,很显然,在这个双对数坐标下线性的通信网络中,如果想等比例地缩放其规模而不至于崩溃,就必须用指数来控制单节点的行为(把双对数坐标化为笛卡尔坐标即可展现)。

实际上,我们把双对数坐标中的直线(求解微分方程的结果)展开到相应的笛卡尔坐标系,就是一条指数规律的曲线了。

再看另一个抽象,即如果数据包在传输过程中丢失了,这件事跟什么因素相关?诚然,在网络通信中,这件事肯定有可能是和传输介质相关的,但是在节点数量,即网络规模这个因素下,介质的问题可以忽略不计。也就是说,节点越多,传输越容易发生冲突,数据也就越不容易到达对端。即丢包事件和网络规模相关,网络是一个线性系统,所以,丢包的重传必须具备指数级的时间特征。

介质的问题随着网络规模的扩大是线性增长的,而传输冲突的问题随着网络规模的扩大则是指数级的,孰重孰轻,立判!

如果你了解早期的以太网,即总线式的CSMA/CD以太网,你会发现同样的事实。

因此,很明确,超时重传的超时规则在线性系统的平衡通过指数特性的单独节点行为来维持的原则下,则必须是:

  • 2.超时重传-指数退避

有了这个原则,我们再回过头来看如何实现消息以及消息确认的超时重传。直接说结论,即不对确认进行重传,因为确认和消息本身属于同一个行为,针对消息本身的超时重传已经自动包含了一个确认,如果再针对确认进行重传,就会破坏单点行为的指数特征,因此我们导出可靠通信的第三个特征:

  • 3.不对确认进行超时重传

由于我们仅仅想确保消息单向传递的可靠,即确保对端收到了本端发出的消息而无需让对端知道这件事,第四个特征也随即导出:

  • 4.不对确认进行确认

基础设施构建就此完毕,考虑到通信往往是双向的,我们需要在其上构建一个可靠的双向通信协议,怎么办?

简单,在另一端BB重新这么来一遍即可!于是我们观察到,两军问题如果超时重传的前提下将双向的消息传递和确认分解成两个单向的消息传递和确认,事情就会简单得多。

原始的两军问题解法:
这里写图片描述

转换后的解法:
这里写图片描述

嗯,转换后的解法,即我们熟悉的协议,TCP协议的最基本形式。现在进入TCP时间!


TCP握手,挥手,一致性的问题

经常有人问,TCP为什么是3次握手,而不是2次,也不是4次,5次。知乎上经常会有这种问题,但是答案几乎是千篇一律的错误或者答非所问,最常见的答案只是描述一下TCP握手的细节,然后导出这么做是OK的,其实不这么做也是OK的这一点没人提。

最常见的错误答案:
1. 这是一种权衡,因为无数次握手也不可能完全可靠;
2. 描述握手的协议细节;
3. …

看过了我上面的论述,这个问题应该非常好答了,所谓的TCP建立连接的握手,实质上就是建立一个双向的可靠通信连接,一边一个来回,每一边都自带超时重传来确保可靠性(而不是靠握手的次数)。TCP的3次握手是优化的结果,其实它应该是4次握手,由于是从零开始的建立连接,因此将SYN的ACK以及被动打开的SYN合并成了一个SYN-ACK,仅此而已。

握手的作用,旨在确定两个双向的初始序列号,TCP用序列号来编址传输的字节,由于是两个方向的连接,所以需要两个序列号,握手过程不传输任何字节,仅仅确定初始序列号
这里写图片描述

说完了3次握手,那么,其姊妹问题,为什么TCP的断链是4次挥手而不是3次?

换句话说,即是在问为什么针对主动断开方的FIN的ACK以及本端的FIN不能合并?

非常简单,因为TCP是在一个单向可靠通信系统基础上构建而成的双向传输控制协议,握手期间可以合并ACK和SYN,是因为在握手之前两端没有任何连接上的包袱,而在断链挥手时,一端认为可以断开了,另一端却不一定,可能另一端还有数据要传输,所以便不能合并,被动关闭的一方只能单独处理针对FIN的ACK以及自己的FIN,仅此而已。

这里写图片描述

再来一个问题,TCP能确保一致性吗?换句话说,TCP协议是两军问题的一个解吗?

远远不是!TCP并不确保一致性。

任何时间点,TCP都不能完全确认当前时刻连接双方的状态,此处所谓的状态包括两端传输的数据。一致性是基于消息的,而不是基于连接的!也就是说,TCP只有收到下一个数据包时,才知道上一个数据包的接收情况,而无法实现隔空打人!TCP的好处仅在于,它在一个信息流上实现了一个一致性确认的流水线方式

我们在理解这个流水线方式的时候,不应该考虑滑动窗口,那样会比较难以理解,我们应该仅仅考虑单字节停等机制。事实上也确实是这样,滑动窗口机制只是为流量控制而引入的,单字节停等效率又太低,所以说这并无伤大雅,你把字节换成窗口即可,即单窗口停等。

如果我们把一致性推广到连接的层面,在连接层面,一致性就是靠4次挥手保证的。

我们可以看到,4次挥手那里的状态机非常之复杂,这是有原因的,即便是引入了TIMEWAIT状态,也还是没有办法保证彻底的一致性,这是两军问题本质上不可解的一个结论,仅此而已。


1974年的TCP

现在你应该大致知道TCP如何保证可靠性了,进一步,如果你想知道TCP协议的头部为什么是那个样子,这一切是如何安排的,你就不得不去读一下一篇陈年的论文:
《A Protocol for Packet Network Intercommunication》:https://www.cs.princeton.edu/courses/archive/fall08/cos561/papers/cerf74.pdf
我来大致介绍一下这篇划时代的论文。

毫不夸张地说,该论文奠定了以TCP/IP为核心的互联网的基础,我们今天能刷抖音,用微信聊天,能在线看片…这一切要不是这篇论文,不会是现在这个样子。

该论文的重点不是TCP协议,而是TCP/IP作为一个整体如何发挥作用,早在1974年,分层模型还不算太成熟,所以当我们提起TCP/IP的时候,要明白,最初的时候,这两个协议是牢牢切合在一起的,到了后来为了兼容纯IP转发,才加入了UDP,这个时候,人们意识到分层模型的必要性。于是抽象而成的ISO/OSI模型。

该论文主要有两个论题:

  • 网关的概念和意义–最终的IP协议
  • 进程间通信的传输控制–最终的TCP协议

注意,我们看看TCP最初的形式,没错,它是作为一种进程间通信的手段被提出的,当初TCP作为进程间通信手段,侧重于不同主机的进程间通信,因此,我们可以清晰看到它的API和文件IO的API是多么相似,这也是socket可以作为文件描述符的原因。

此外,还有值得注意的是,TCP的ACK号被定义为下一个索要字节的序列号,这在当时实现了一种简易且完备的字节流水线,节省了协议头空间,看到这个设计,简直太帅!虽然它也带来了很多问题,比如无法精确测准RTT,比如无法进行选择确认,进而无法进行良好的拥塞控制,但不得不说,在空间重于时间的1970年代,这绝对是创举,毕竟,拥塞控制在当时是没有意义的,1988年才被引入。


1974年的互联网

在1974年那篇论文之后,同样的作者归纳总结出了RFC675:
《RFC675:SPECIFICATION OF INTERNET TRANSMISSION CONTROL PROGRAM》:https://tools.ietf.org/html/rfc675
这篇划时代的RFC正式提出了互联网这个概念,我们常说的Internet就是Internetworking的缩写。

TCP/IP协议确实不是一个协议栈,最初它们只是一个协议,仅此而已,不多说。


那么,接下来?

接下来,skinshoe wu来了,携带着他的高级皮鞋,还有高级西装。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/382607.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

有一个小白程序员,写了一个只能对5个数字进行排序的函数,现在有25个不重复的数字,

题目:有一个小白程序员,写了一个只能对5个数字进行排序的函数,现在有25个不重复的数字,请问小白同学最少调用几次该函数,可以找出其中最大的三个数? A.5 B.6 C.7 D.8 答案:C 解析&#xf…

初始序列为1 8 6 2 5 4 7 3一组数采用堆排序,当建堆(小根堆)完毕时,堆所对应的二叉树中序遍历序列为

初始序列为1 8 6 2 5 4 7 3一组数采用堆排序,当建堆(小根堆)完毕时,堆所对应的二叉树中序遍历序列为:() 8 3 2 5 1 6 4 7 3 2 8 5 1 4 6 7 3 8 2 5 1 6 7 4 8 2 3 5 1 4 7 6 A

设一组初始记录关键字序列为(25,50,15,35,80,85,20,40,36,70)进行一趟归并后的结果为

设一组初始记录关键字序列为(25,50,15,35,80,85,20,40,36,70),其中含有5个长度为2的有序子表,则用归并排序的方法对该记录关键字序列进行一趟归并…

文字常量区和栈区考点

求以下程序输出结果 #include <stdio.h>char * fun1() {char * str "hello";return str; }char * fun2() {char str[] "world";return str; } int main() {printf("%s\n", fun1()); printf("%s\n", fun2()); return 0; }结…

判断栈的压入和弹出

序列1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c;5是压栈序列。序列 4&#xff0c;3&#xff0c;5&#xff0c;1&#xff0c;2是弹出序列。判断第二个是不是弹出序列 三步走 如果下一个弹出的数字刚好是栈顶数字&#xff0c;直接弹出如果不在栈顶&#xff0c;就一直…

动态规划学习笔记2

题目描述&#xff1a; 在一个mn的棋盘的每一格都放有一个礼物&#xff0c;每个礼物都有一定的价值&#xff08;价值大于0&#xff09;。你可以从棋盘的左上角开始拿格子里的礼物&#xff0c;并每次向右或者向下移动一格直到到达棋盘的右下角。给定一个棋盘及其上面的礼物&…

内存碎片产生原因及解决办法

来源&#xff1a;知乎链接&#xff1a;https://www.zhihu.com/question/51836333/answer/145693402内存碎片通常分为内部碎片和外部碎片&#xff1a; 1. 内部碎片是由于采用固定大小的内存分区&#xff0c;当一个进程不能完全使用分给它的固定内存区域时就产生了内部碎片&…

KMP算法的举例加图解

文章出处&#xff1a;阮一峰&#xff0c;进行重新排版整理 举例来说&#xff0c;有一个字符串"BBC ABCDAB ABCDABCDABDE"&#xff0c;我想知道&#xff0c;里面是否包含另一个字符串"ABCDABD"&#xff1f; 首先&#xff0c;字符串"BBC ABCDAB ABCDAB…

进程间通讯的四种方式

文章目录共享内存信号管道消息队列通信方法 无法介于内核态与用户态的原因 管道&#xff08;不包括命名管道&#xff09; 局限于父子进程间的通信。 消息队列 在硬、软中断中无法无阻塞地接收数据。 信号量 无法介于内核态和用户态使用。 共享内存 需要信号量辅助&#xff0c;而…

TCP/IP四层模型

文章目录TCP/IP协议族体系结构以及主要协议数据链路层网络层传输层应用层TCP/IP协议族体系结构以及主要协议 TCP/IP协议族是一个四层协议系统&#xff0c;自底而上分别是数据链路层、网络层、传输层和应用层。每一层完成不同 的功能&#xff0c;且通过若干协议来实现&#xff…

Manacher算法图解

看了好久的Manacher算法&#xff0c;觉得还是要自己画一遍&#xff0c;自己把代码写一遍才能理解 下面分享一下&#xff0c;如果有错&#xff0c;希望指正 简陋版本的&#xff0c;但是他基本只是做到了求取最长回文字符串&#xff0c;严格来说它并不是Manacher’s Algorithm-…

Flink 客户端操作命令及可视化工具

Flink提供了丰富的客户端操作来提交任务和与任务进行交互。下面主要从Flink命令行、Scala Shell、SQL Client、Restful API和 Web五个方面进行整理。 在Flink安装目录的bin目录下可以看到flink&#xff0c;start-scala-shell.sh和sql-client.sh等文件&#xff0c;这些都是客户…

ySQL挑战搭建一个简易的成绩管理系统的数据库

文章为自己搜索网上资源&#xff0c;再在这里进行整理&#xff0c;所以标注为转载 [实验步骤](https://www.shiyanlou.com/courses/reports/1347700) 总结做实验注意事项&#xff1a; 1.添加主键 2.主键和外键的关系 3.注意自增的书写添加 mysql 如何修改、添加、删除表主键…

网络之DNS协议图解

DNS是计算机域名系统 (Domain Name System) 域名系统采用类似目录树的等级结构。 域名服务器是指保存有该网络中所有主机的域名和对应IP地址&#xff0c;并具有将域名转换为IP地址功能的服务器。 域名服务器为客户机/服务器模式中的服务器方&#xff0c;它主要有两种形式&am…

网络之ICMP协议

ICMP 主要功能&#xff1a; 确认IP包是否成功送达目标地址通知在发送过程当中IP包被废弃的具体原因改善网络设置等 在IP通信中如果某个IP包因为某种原因未到达目标地址&#xff0c;那么这个原因由ICMP通知。 过程&#xff08;图解TCP/IP&#xff09; ICMP类型 常见的&am…

网络之NAT协议

由来&#xff1a; 2011年2月3日中国农历新年&#xff0c; IANA对外宣布&#xff1a;IPv4地址空间最后5个地址块已经被分配给下属的5个地区委员会。2011年4月15日&#xff0c;亚太区委员会APNIC对外宣布&#xff0c;除了个别保留地址外&#xff0c;本区域所有的IPv4地址基本耗尽…

排序稳定性的意义

首先&#xff0c;为什么会有排序算法稳定性的说法&#xff1f;只要能排好不就可以了吗&#xff1f; 看例子 第1行是数字2 记作 1 2 第2行是数字4 记作 2 4 第3行是数字2 记作 3 2 排序后的结果&#xff08;如果看不懂命令的意思&#xff0c;参照这个博客&#xff09; 那么引入…

本能富可敌国,最后却选择拯救世界!Bram的Vim和乌干达儿童

他本能富可敌国&#xff0c;最后却选择拯救世界 在命令行界面输入vim会出现一堆文件&#xff0c;但是一直有这么一句话 Help poor children in Uganda! “帮助可怜的乌干达儿童” 查询了一下这里面相关的历史背景和知识 在Vim许可证文件结束后的部分翻译 &#xff0d;如果…

Linux基础查漏补缺

文章目录第二遍重新回顾Linux基础查看主机名修改主机名查看IP地址Linux的 “--”和“-”根目录文件的意义和作用alias直接在命令行界面输入firefox数组越界发生什么命令行光标移动的几个操作重定向第二遍重新回顾Linux基础 1.查找忽略的知识点 2.再次记忆一些基础知识 3.巩固基…