当我们说TCP是可靠协议时,我们真正表达的是什么

转载出处:https://blog.csdn.net/dog250/article/details/82177299
很明确地说,从通信意义上推敲,TCP一点都不可靠。一个抽象的协议,怎么可能左右介质来保证可靠,不存在的。但凡是经由某种介质的通信行为均不可能是绝对可靠的!

正好比我们现实生活中的保险,其实它什么都不能阻止,什么风险也保证不了它的不发生,它保证不了飞机不会掉下来,也无法阻止人生病…事实上,TCP就是通信中的保险业。

TCP是如何设计出来的?推而广之这类通信协议是如何设计出来的?如果说让你在一个不可靠的介质上运行一个可靠的协议,你该怎么做?本文将介绍内中的些许因果。

可靠的通信协议如何构建

这要从经典的两军问题说起。

首先介绍一下两军问题,来自Wiki的解说是最好的:
Two Generals’ Problem:https://en.wikipedia.org/wiki/Two_Generals%27_Problem
两军问题本质上一个一致性确认问题,也就是说通信双方而不是一方(这对理解TCP非常重要)都要确保信息的一致性。即假设通信双方为A和B,那么A发送一则消息M给B,所谓的可靠性则是要同时满足下面的条件:

  • 信道是不可靠的,任何消息均可能以任何概率丢失
  • 如果AA不能确保消息到达对方时,不能重发消息
    这一点非常重要,在经典的两军问题中,消息是由信使传递的,而信使是人,人是军队作战的最重要资源也是最不可靠的资源,比如会叛变…因此每条消息或者确认相互只能派遣一个信使去递送消息,在通信上讲,就是消息不能重发!
  • 对于A而言,要确保A知道B已经收到了M
  • 对于B而言,要确保自己收到M这件事已经被A知道

数学上很容易用反证法证明上述的两军问题是根本无解,即一致性通信的完全可靠性是一种奢望。下面我来试着推导一下。

假设在时间点TnTn的传输,我们知道,信道是不可靠的,所以它可能会丢失,而它一旦丢失,整个交互过程便失去了一致性,这与假设是矛盾的,所以,一致性是不可能的


这个问题貌似彻底拆了通信技术的根基,那么通信技术还有什么意义呢?

事实上,

  • 首先,通信协议从来都不是为了满足完全的一致性需求

通信的意义是,在时间序列上满足消息传递的单向完成需求即可!通信的本质问题是确保消息传递,而不是维护一致性,一致性应该由业务自身来负责,通信仅仅提供消息传递的基础设施而已。

  • 其次,通信传输的是字节电脉冲,消息可以重发

这便大大削弱了两军问题的强约束。基于上述的假设,我们来一步步地推导出TCP协议为什么要这么设计。

如果仔细推敲的话,你会发现,即便是消息传递,在数学上也是无法确保在不可靠的信道上确保消息传递的,然而,我们换个思路,即自问“信道到底不可靠到什么程度?”

是100%不可靠吗?如果是的话,意味着断路,即双方是不可达的,无论我们发送多少次数据包,均会丢失,这样我们马上可以结束这个没有意义的讨论,因此,所谓的不可靠只是说信道会出现概率性丢包,丢包概率pp之间的!

这个意义十分重大,这意味着,只要我们重试特定消息MnMn的确认!,这是完全确定的一个结论,没人反对吧。

这边自然而然导出了可靠通信的第一个原则:

  • 1.超时重传

该原则可以确保消息一定能有机会到达对端。每当发出一个数据包,在预期的时间内没有确认到达,就重传它。关于超时重传的细节,本文稍后会浅谈一下,但是现在,我们来看另外一个问题。


如何确保消息单向传递的完成?

换句话说,所谓消息单向传递的完成,即需要一种标志性的信号*,该信号揭示了消息已经被对端接收这个事实,很显然,对端发送针对特定消息的确认并且本端收到即可。

一旦AA,不然它也不会发送确认。但是由上文可知,这个确认在不可靠的信道上也可能丢失,不过这不必惊慌,因为我们已经有了推论,即针对任意消息,只要我们重复传输的次数足够多,该消息就一定能到达对端,在该推论下,采用超时重传原则即可。

现在看来,我们导出的下列措施已经解决了几乎所有问题:
1. 针对消息MnMn的超时重传机制

但是这是最优解吗?

非也!这只是一种可行的方案,但不是唯一的方案,更不是最有的方案。导出最优解需要我们深入到通信网络的本质,先看一篇文章:
马太效应/幂律分布的本质以及其数学表述:https://blog.csdn.net/dog250/article/details/79146511
注意,我们的通信网络是一个网状拓扑的连通图,无论是单节点连接数属性还是流量属性均符合幂律规律,从双对数坐标曲线可以看出网络规模和节点的各属性特征之间的对数线性关系,而网络规模来自于某种指数级增长的复制,单节点的属性特征来自于该节点的行为,很显然,在这个双对数坐标下线性的通信网络中,如果想等比例地缩放其规模而不至于崩溃,就必须用指数来控制单节点的行为(把双对数坐标化为笛卡尔坐标即可展现)。

实际上,我们把双对数坐标中的直线(求解微分方程的结果)展开到相应的笛卡尔坐标系,就是一条指数规律的曲线了。

再看另一个抽象,即如果数据包在传输过程中丢失了,这件事跟什么因素相关?诚然,在网络通信中,这件事肯定有可能是和传输介质相关的,但是在节点数量,即网络规模这个因素下,介质的问题可以忽略不计。也就是说,节点越多,传输越容易发生冲突,数据也就越不容易到达对端。即丢包事件和网络规模相关,网络是一个线性系统,所以,丢包的重传必须具备指数级的时间特征。

介质的问题随着网络规模的扩大是线性增长的,而传输冲突的问题随着网络规模的扩大则是指数级的,孰重孰轻,立判!

如果你了解早期的以太网,即总线式的CSMA/CD以太网,你会发现同样的事实。

因此,很明确,超时重传的超时规则在线性系统的平衡通过指数特性的单独节点行为来维持的原则下,则必须是:

  • 2.超时重传-指数退避

有了这个原则,我们再回过头来看如何实现消息以及消息确认的超时重传。直接说结论,即不对确认进行重传,因为确认和消息本身属于同一个行为,针对消息本身的超时重传已经自动包含了一个确认,如果再针对确认进行重传,就会破坏单点行为的指数特征,因此我们导出可靠通信的第三个特征:

  • 3.不对确认进行超时重传

由于我们仅仅想确保消息单向传递的可靠,即确保对端收到了本端发出的消息而无需让对端知道这件事,第四个特征也随即导出:

  • 4.不对确认进行确认

基础设施构建就此完毕,考虑到通信往往是双向的,我们需要在其上构建一个可靠的双向通信协议,怎么办?

简单,在另一端BB重新这么来一遍即可!于是我们观察到,两军问题如果超时重传的前提下将双向的消息传递和确认分解成两个单向的消息传递和确认,事情就会简单得多。

原始的两军问题解法:
这里写图片描述

转换后的解法:
这里写图片描述

嗯,转换后的解法,即我们熟悉的协议,TCP协议的最基本形式。现在进入TCP时间!


TCP握手,挥手,一致性的问题

经常有人问,TCP为什么是3次握手,而不是2次,也不是4次,5次。知乎上经常会有这种问题,但是答案几乎是千篇一律的错误或者答非所问,最常见的答案只是描述一下TCP握手的细节,然后导出这么做是OK的,其实不这么做也是OK的这一点没人提。

最常见的错误答案:
1. 这是一种权衡,因为无数次握手也不可能完全可靠;
2. 描述握手的协议细节;
3. …

看过了我上面的论述,这个问题应该非常好答了,所谓的TCP建立连接的握手,实质上就是建立一个双向的可靠通信连接,一边一个来回,每一边都自带超时重传来确保可靠性(而不是靠握手的次数)。TCP的3次握手是优化的结果,其实它应该是4次握手,由于是从零开始的建立连接,因此将SYN的ACK以及被动打开的SYN合并成了一个SYN-ACK,仅此而已。

握手的作用,旨在确定两个双向的初始序列号,TCP用序列号来编址传输的字节,由于是两个方向的连接,所以需要两个序列号,握手过程不传输任何字节,仅仅确定初始序列号
这里写图片描述

说完了3次握手,那么,其姊妹问题,为什么TCP的断链是4次挥手而不是3次?

换句话说,即是在问为什么针对主动断开方的FIN的ACK以及本端的FIN不能合并?

非常简单,因为TCP是在一个单向可靠通信系统基础上构建而成的双向传输控制协议,握手期间可以合并ACK和SYN,是因为在握手之前两端没有任何连接上的包袱,而在断链挥手时,一端认为可以断开了,另一端却不一定,可能另一端还有数据要传输,所以便不能合并,被动关闭的一方只能单独处理针对FIN的ACK以及自己的FIN,仅此而已。

这里写图片描述

再来一个问题,TCP能确保一致性吗?换句话说,TCP协议是两军问题的一个解吗?

远远不是!TCP并不确保一致性。

任何时间点,TCP都不能完全确认当前时刻连接双方的状态,此处所谓的状态包括两端传输的数据。一致性是基于消息的,而不是基于连接的!也就是说,TCP只有收到下一个数据包时,才知道上一个数据包的接收情况,而无法实现隔空打人!TCP的好处仅在于,它在一个信息流上实现了一个一致性确认的流水线方式

我们在理解这个流水线方式的时候,不应该考虑滑动窗口,那样会比较难以理解,我们应该仅仅考虑单字节停等机制。事实上也确实是这样,滑动窗口机制只是为流量控制而引入的,单字节停等效率又太低,所以说这并无伤大雅,你把字节换成窗口即可,即单窗口停等。

如果我们把一致性推广到连接的层面,在连接层面,一致性就是靠4次挥手保证的。

我们可以看到,4次挥手那里的状态机非常之复杂,这是有原因的,即便是引入了TIMEWAIT状态,也还是没有办法保证彻底的一致性,这是两军问题本质上不可解的一个结论,仅此而已。


1974年的TCP

现在你应该大致知道TCP如何保证可靠性了,进一步,如果你想知道TCP协议的头部为什么是那个样子,这一切是如何安排的,你就不得不去读一下一篇陈年的论文:
《A Protocol for Packet Network Intercommunication》:https://www.cs.princeton.edu/courses/archive/fall08/cos561/papers/cerf74.pdf
我来大致介绍一下这篇划时代的论文。

毫不夸张地说,该论文奠定了以TCP/IP为核心的互联网的基础,我们今天能刷抖音,用微信聊天,能在线看片…这一切要不是这篇论文,不会是现在这个样子。

该论文的重点不是TCP协议,而是TCP/IP作为一个整体如何发挥作用,早在1974年,分层模型还不算太成熟,所以当我们提起TCP/IP的时候,要明白,最初的时候,这两个协议是牢牢切合在一起的,到了后来为了兼容纯IP转发,才加入了UDP,这个时候,人们意识到分层模型的必要性。于是抽象而成的ISO/OSI模型。

该论文主要有两个论题:

  • 网关的概念和意义–最终的IP协议
  • 进程间通信的传输控制–最终的TCP协议

注意,我们看看TCP最初的形式,没错,它是作为一种进程间通信的手段被提出的,当初TCP作为进程间通信手段,侧重于不同主机的进程间通信,因此,我们可以清晰看到它的API和文件IO的API是多么相似,这也是socket可以作为文件描述符的原因。

此外,还有值得注意的是,TCP的ACK号被定义为下一个索要字节的序列号,这在当时实现了一种简易且完备的字节流水线,节省了协议头空间,看到这个设计,简直太帅!虽然它也带来了很多问题,比如无法精确测准RTT,比如无法进行选择确认,进而无法进行良好的拥塞控制,但不得不说,在空间重于时间的1970年代,这绝对是创举,毕竟,拥塞控制在当时是没有意义的,1988年才被引入。


1974年的互联网

在1974年那篇论文之后,同样的作者归纳总结出了RFC675:
《RFC675:SPECIFICATION OF INTERNET TRANSMISSION CONTROL PROGRAM》:https://tools.ietf.org/html/rfc675
这篇划时代的RFC正式提出了互联网这个概念,我们常说的Internet就是Internetworking的缩写。

TCP/IP协议确实不是一个协议栈,最初它们只是一个协议,仅此而已,不多说。


那么,接下来?

接下来,skinshoe wu来了,携带着他的高级皮鞋,还有高级西装。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/382607.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IP地址=192.168.127.101,子网掩码255.255.255.192,计算网络地址,主机号,广播地址和主机最大数

纯手写,如果哪写错了,还希望指正 IP地址192.168.127.101,子网掩码255.255.255.192,计算网络地址,主机号,广播地址和主机最大数 255.255.255.192子网掩码转换成二进制为 11111111.11111111.11111111.11000…

C++ 类模板遇到继承的问题以及解决

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std;template<class T> class Base {T m_A; //子类创建时候 必须要知道T的类型&#xff0c;才能给父类中的m_A分配内存 };template<class T1 , class T2> class Son :public Base<T2…

A B C类IP地址的判断

IP地址131.153.12.71是一个&#xff08;&#xff09;类IP地址。 IP地址分类A类网络的IP地址范围为1.0.0.1&#xff0d;127.255.255.254&#xff1b; B类网络的IP地址范围为&#xff1a;128.1.0.1&#xff0d;191.255.255.254&#xff1b; C类网络的IP地址范围为&#xff1a;1…

linux sshd启动失败 sshd re-exec requires execution with an absolute path

sshd 提示 sshd re-exec requires execution with an absolute path提示 需要绝对路径来执行 sshd&#xff0c; 刚开始学 不知道怎么用绝对路径来启动&#xff1f; 以后明白了&#xff0c; 这里再补充上 google 使用 service sshd restart 输入密码来启动

有一个小白程序员,写了一个只能对5个数字进行排序的函数,现在有25个不重复的数字,

题目&#xff1a;有一个小白程序员&#xff0c;写了一个只能对5个数字进行排序的函数&#xff0c;现在有25个不重复的数字&#xff0c;请问小白同学最少调用几次该函数&#xff0c;可以找出其中最大的三个数&#xff1f; A.5 B.6 C.7 D.8 答案&#xff1a;C 解析&#xf…

ubuntu修改ls显示目录的颜色

ls查看目录&#xff0c; 背景是黑色的&#xff0c;目录颜色是深蓝色&#xff0c;基本看不清楚。 解决办法 因为ubuntu下的/etc/目录里没有DIR_COLORS, 所以费了点劲儿。 2. 利用dircolors命令&#xff0c;查看我们的系统当前的文件名称显示颜色的值&#xff0c;然后利用管道重…

初始序列为1 8 6 2 5 4 7 3一组数采用堆排序,当建堆(小根堆)完毕时,堆所对应的二叉树中序遍历序列为

初始序列为1 8 6 2 5 4 7 3一组数采用堆排序&#xff0c;当建堆&#xff08;小根堆&#xff09;完毕时&#xff0c;堆所对应的二叉树中序遍历序列为&#xff1a;&#xff08;&#xff09; 8 3 2 5 1 6 4 7 3 2 8 5 1 4 6 7 3 8 2 5 1 6 7 4 8 2 3 5 1 4 7 6 A

设一组初始记录关键字序列为(25,50,15,35,80,85,20,40,36,70)进行一趟归并后的结果为

设一组初始记录关键字序列为(25&#xff0c;50&#xff0c;15&#xff0c;35&#xff0c;80&#xff0c;85&#xff0c;20&#xff0c;40&#xff0c;36&#xff0c;70)&#xff0c;其中含有5个长度为2的有序子表&#xff0c;则用归并排序的方法对该记录关键字序列进行一趟归并…

C++ 异常基本语法

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std;class MyException { public:void printError(){cout << "我自己的异常类的错误" << endl;} };class Person { public:Person(){cout << "Person的构造函数&q…

文字常量区和栈区考点

求以下程序输出结果 #include <stdio.h>char * fun1() {char * str "hello";return str; }char * fun2() {char str[] "world";return str; } int main() {printf("%s\n", fun1()); printf("%s\n", fun2()); return 0; }结…

C++ 异常变量的生命周期

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std;class MyException { public:MyException(){cout << "MyException构造函数调用" << endl;}MyException(const MyException & e){cout << "MyException拷贝…

判断栈的压入和弹出

序列1&#xff0c;2&#xff0c;3&#xff0c;4&#xff0c;5是压栈序列。序列 4&#xff0c;3&#xff0c;5&#xff0c;1&#xff0c;2是弹出序列。判断第二个是不是弹出序列 三步走 如果下一个弹出的数字刚好是栈顶数字&#xff0c;直接弹出如果不在栈顶&#xff0c;就一直…

C++ 多态在异常中的使用

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std;//异常 基类 class BaseException { public:virtual void printError() 0; };//空指针 异常 class NULLPointException :public BaseException { public:virtual void printError(){cout <…

一条语句判断数x是否2的n次幂.求取二进制1的个数

一条语句判断数x是否2的n次幂 return &#xff01;(x & (x - 1)); 求取十进制数字元素1的个数 int fun(int x) { int count 0; int i, j, k; /方法2 负数不可计算&#xff0c;需要改进/ while (x ! 0){ if (x & 1 1) count; x x >> 1; } /方法1/ while (x …

C++ 标准输入流01

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std;/* cin.get() //一次只能读取一个字符 cin.get(一个参数) //读一个字符 cin.get(两个参数) //可以读字符串 cin.getline() cin.ignore() cin.peek() cin.putback() */void test01() {//cin.get(…

动态规划学习笔记1

求连续子数组的最大和问题 代码不重要&#xff01;重要的是思想过程(括弧 好难啊&#xff01;&#xff01;&#xff01;) 输入的数组为{1&#xff0c;-2&#xff0c;3&#xff0c;10&#xff0c;-4&#xff0c;7&#xff0c;2&#xff0c;-5}&#xff0c;和最大的子数组为{3&…

C++ 文件读写操作01

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std; //文件读写的头文件 #include <fstream>//1、写文件 void test01() {//参数 1 文件路径 参数2 打开方式//ofstream ofs("./test.txt", ios::out | ios::trunc);ofstream …

动态规划学习笔记2

题目描述&#xff1a; 在一个mn的棋盘的每一格都放有一个礼物&#xff0c;每个礼物都有一定的价值&#xff08;价值大于0&#xff09;。你可以从棋盘的左上角开始拿格子里的礼物&#xff0c;并每次向右或者向下移动一格直到到达棋盘的右下角。给定一个棋盘及其上面的礼物&…

C++ i/o类库中 常用流类

类名 作用 在哪个头文件中声明 ios 抽象基类 iostream ------------------------------------------------------------------- istream 通用输入流和其他输入流的基类 iostream ostream 通用输出流和其他输出流的基类…

动态规划学习笔记3

某工厂预计明年有A、B、C、D四个新建项目&#xff0c;每个项目的投资额Wk及其投资后的收益Vk如下表所示&#xff0c;投资总额为30万元&#xff0c;如何选择项目才能使总收益最大&#xff1f; Project Wk Vk A 15 12 B 10 8 C 12 9 D 8 5 声明一个 二维数组 m[…