单机最大负载_分布式高可靠之负载均衡，今天看了你肯定会

到目前为止，我已经为你介绍了分布式起源、分布式协调与同步、分布式资源管理与负载调度、分布式计算技术、分布式通信技术和分布式数据存储。

可以说，掌握了这些内容，基本上就掌握了分布式的关键技术。然而，只有可靠的分布式系统才能真正应用起来。那么，分布式系统的可靠性又是如何实现的呢？

不要着急，接下来几篇文章，我会和你一起学习分布式可靠性相关的知识，包括负载均衡、流量控制、故障隔离和故障恢复。

在这其中，负载均衡是分布式可靠性中非常关键的一个问题或技术，在一定程度上反映了分布式系统对业务处理的能力。比如，早期的电商抢购活动，当流量过大时，你可能就会发现有些地区可以购买，而有些地区因为服务崩溃而不能抢购。这，其实就是系统的负载均衡出现了问题。

接下来，我们就一起来打卡分布式高可靠之负载均衡。

什么是负载均衡？

先举个例子吧。以超市收银为例，假设现在只有一个窗口、一个收银员：

一般情况下，收银员平均 2 分钟服务一位顾客，10 分钟可以服务 5 位顾客；
到周末高峰期时，收银员加快收银，平均 1 分钟服务一位顾客，10 分钟最多服务 10 位顾客，也就是说一个顾客最多等待 10 分钟；
逢年过节，顾客数量激增，一下增加到 30 位顾客，如果仍然只有一个窗口和一个收银员，那么所有顾客就只能排队等候了，一个顾客最多需要等待 30 分钟。这样购物体验，就非常差了。

那有没有解决办法呢？

当然有。那就是新开一个收银窗口，每个收银窗口服务 15 个顾客，这样最长等待时间从 30 分钟缩短到 15 分钟。但如果，这两个窗口的排队顾客数严重不均衡，比如一个窗口有 5 个顾客排队，另一个窗口却有 25 个顾客排队，就不能最大化地提升顾客的购物体验。

所以，尽可能使得每个收银窗口排队的顾客一样多，才能最大程度地减少顾客的最长排队时间，提高用户体验。

看完这个例子，你是不是想到了一句话“不患寡，而患不均”？这，其实就是负载均衡的基本原理。

通常情况下，负载均衡可以分为两种：

一种是请求负载均衡，即将用户的请求均衡地分发到不同的服务器进行处理；
另一种是数据负载均衡，即将用户更新的数据分发到不同的存储服务器。

我在（数据分布方式之哈希与一致性哈希，我就是个神算子）文章分享数据分布方法时，提到：数据分布算法很重要的一个衡量标准，就是均匀分布。可见，哈希和一致性哈希等，其实就是数据负载均衡的常用方法。那么今天，我就与你着重说说服务请求的负载均衡技术吧。

分布式系统中，服务请求的负载均衡是指，当处理大量用户请求时，请求应尽量均衡地分配到多台服务器进行处理，每台服务器处理其中一部分而不是所有的用户请求，以完成高并发的请求处理，避免因单机处理能力的上限，导致系统崩溃而无法提供服务的问题。

比如，有 N 个请求、M 个节点，负载均衡就是将 N 个请求，均衡地转发到这 M 个节点进行处理。

服务请求的负载均衡方法

通常情况下，计算机领域中，在不同层有不同的负载均衡方法。比如，从网络层的角度，通常有基于 DNS、IP 报文等的负载均衡方法；在中间件层（也就是我们专栏主要讲的分布式系统层），常见的负载均衡策略主要包括轮询策略、随机策略、哈希和一致性哈希等策略。

今天，我着重与你分析的就是，中间件层所涉及的负载均衡策略。接下来，我们就具体看看吧。

轮询策略

轮询策略是一种实现简单，却很常用的负载均衡策略，核心思想是服务器轮流处理用户请求，以尽可能使每个服务器处理的请求数相同。生活中也有很多类似的场景，比如，学校宿舍里，学生每周轮流打扫卫生，就是一个典型的轮询策略。

在负载均衡领域中，轮询策略主要包括顺序轮询和加权轮询两种方式。

首先，我们一起看看顺序轮询。假设有 6 个请求，编号为请求 1~6，有 3 台服务器可以处理请求，编号为服务器 1~3，如果采用顺序轮询策略，则会按照服务器 1、2、3 的顺序轮流进行请求。

如表所示，将 6 个请求当成 6 个步骤：

请求 1 由服务器 1 处理；
请求 2 由服务器 2 进行处理。
以此类推，直到处理完这 6 个请求。

最终的处理结果是，服务器 1 处理请求 1 和请求 4，服务器 2 处理请求 2 和请求 5，服务器 3 处理请求 3 和请求 6。

接下来，我们看一下加权轮询。

加权轮询为每个服务器设置了优先级，每次请求过来时会挑选优先级最高的服务器进行处理。比如服务器 1~3 分配了优先级{4，1，1}，这 6 个请求到来时，还当成 6 个步骤，如表所示。

请求 1 由优先级最高的服务器 1 处理，服务器 1 的优先级相应减 1，此时各服务器优先级为{3，1，1}；
请求 2 由目前优先级最高的服务器 1 进行处理，服务器 1 优先级相应减 1，此时各服务器优先级为{2，1，1}。
以此类推，直到处理完这 6 个请求。每个请求处理完后，相应服务器的优先级会减 1

最终的处理结果是，服务器 1 处理请求 1~4，服务器 2 处理请求 5，服务器 3 会处理请求 6。

以上就是顺序轮询和加权轮询的核心原理了。轮询策略的应用比较广泛，比如 Nginx 默认的负载均衡策略就是一种改进的加权轮询策略。我们具体看看它的核心原理吧。

首先，我来解释下 Nginx 轮询策略需要用到的变量吧。

weight：配置文件中为每个服务节点设置的服务节点权重，固定不变。
effective_weight：服务节点的有效权重，初始值为 weight。在 Nginx 的源码中有一个最大失败数的变量 max_fails，当服务发生异常时，则减少相应服务节点的有效权重，公式为 effective_weight = effective_weight - weight / max_fails；之后再次选取本节点，若服务调用成功，则增加有效权重，effective_weight ++ ，直至恢复到 weight。
current_weight：服务节点当前权重，初始值均为 0，之后会根据系统运行情况动态变化。

假设，各服务器的优先级是{4，1，1}，我还是将 6 个请求分为 6 步来进行讲解，如表所示：

遍历集群中所有服务节点，使用 current_weight = current_weight + effective_weight，计算此时每个服务节点的 current_weight，得到 current_weight 为{4，1，1}，total 为 4+1+1=6。选出 current_weight 值最大的服务节点即服务器 1 来处理请求，随后服务器 1 对应的 current_weight 减去此时的 total 值，即 4 - 6，变为了 -2 。
按照上述步骤执行，首先遍历，按照 current_weight = current_weight + effective_weight 计算每个服务节点 current_weight 的值，结果为{2，2，2}，total 为 6，选出 current_weight 值最大的服务节点。current_weight 最大值有多个服务节点时，直接选择第一个节点即可，在这里选择服务器 1 来处理请求，随后服务器 1 对应的 current_weight 值减去此时的 total，即 2 - 6，结果为 -4。
以此类推，直到处理完这 6 个请求。

最终的处理结果为，服务器 1 处理请求 1、2、4、6，服务器 2 处理请求 3，服务器 3 会处理请求 5。

可以看到，与普通的加权轮询策略相比，这种轮询策略的优势在于，当部分请求到来时，不会集中落在优先级较高的那个服务节点。

还是上面的例子，假设只有 4 个请求，按照普通的加权轮询策略，会全部由服务器 1 进行处理，即{1,1,1,1}；而按照这种平滑的加权轮询策略的话，会由服务器 1 和 2 共同进行处理，即{1,1,2,1}。

轮询策略的优点就是，实现简单，且对于请求所需开销差不多时，负载均衡效果比较明显，同时加权轮询策略还考虑了服务器节点的异构性，即可以让性能更好的服务器具有更高的优先级，从而可以处理更多的请求，使得分布更加均衡。

但轮询策略的缺点是，每次请求到达的目的节点不确定，不适用于有状态请求的场景。并且，轮询策略主要强调请求数的均衡性，所以不适用于处理请求所需开销不同的场景。

但轮询策略的缺点是，每次请求到达的目的节点不确定，不适用于有状态请求的场景。并且，轮询策略主要强调请求数的均衡性，所以不适用于处理请求所需开销不同的场景。比如，有两个服务器（节点 A 和节点 B）性能相同，CPU 个数和内存均相等，有 4 个请求需要处理，其中请求 1 和请求 3 需要 1 个 CPU，请求 2 和请求 4 需要 2 个 CPU。根据轮询策略，请求 1 和请求 3 由节点 A、请求 2 和请求 4 由节点 B 处理。由此可见，节点 A 和节点 B 关于 CPU 的负载分别是 2 和 4，从这个角度来看，两个节点的负载并不均衡。

综上所述，轮询策略适用于用户请求所需资源比较接近的场景。

随机策略

随机策略也比较容易理解，指的就是当用户请求到来时，会随机发到某个服务节点进行处理，可以采用随机函数实现。这里，随机函数的作用就是，让请求尽可能分散到不同节点，防止所有请求放到同一节点或少量几个节点上。

如图所示，假设有 5 台服务器 Server 1~5 可以处理用户请求，每次请求到来时，都会先调用一个随机函数来计算出处理节点。这里，随机函数的结果只能是{1,2,3,4,5}这五个值，然后再根据计算结果分发到相应的服务器进行处理。比如，图中随机函数计算结果为 2，因此该请求会由 Server2 处理。