一、概述
定义
:在多个计算机(计算机集群)、网络连接、CPU、磁盘驱动器或其他资源中分配负载目标
:最佳化资源使用、最大化吞吐率、最小化响应时间、避免过载功能
:使用多台服务器提供单一服务(服务器农场)- ⭐ 工作流程
- 负载均衡器(server)监听 1~n 个外部端口(port)
- 客户端访问端口,向服务器(server)发起请求
- 负载均衡器根据负载均衡策略选择后端内网服务器(upstream)
- 负载均衡器将用户请求发送到选定的后端内网服务器(upstream)
- 内网服务器将请求的响应返回给负载均衡器(server)
- 负载均衡器再将响应发送到客户端
- 优点
- 安全性:向客户端隐藏内网结构,阻止了用户直接访问后台(内网)服务器,可以阻止对核心网络栈和运行在其它端口服务的攻击
- 可用性:当所有后台服务器出现故障时,负载均衡器转发请求到一个备用的负载均衡器、显示一条关于服务中断的消息等,提高容错能力
二、上游服务器组(upstream)
⭐ 调度算法
算法 | 说明 |
---|---|
轮询(默认) | 请求按时间顺序逐一分配到不同的后端服务器,Weight 指定轮询权值,Weight 值越大访问机率越高,用于后端服务器性能不均的情况 |
ip_hash | 按访问 IP 的 hash 结果将请求分配给服务器,来自同一个 IP 的访客固定访问一个后端服务器,解决动态网页的 session 共享问题 |
fair | 根据后端服务器的响应时间来分配请求,响应时间短的优先分配(必须下载 Nginx 的 upstream_fair 模块) |
url_hash | 按访问 url 的 hash 结果将请求分配给服务器,每个 url 定向到同一个后端服务器,进一步提高后端缓存服务器的效率 |
least_conn | 将请求转发给当前连接数最少的后端服务器,能够有效地将请求分配给负载较轻的服务器 |
hash |
状态参数
状态参数 | |
---|---|
down | 当前服务器废了,当前的 server 暂时不参与负载均衡 |
backup | 预留的备份机器,当所有非 backup 机器故障或者繁忙时,才会请求 backup 机器,因此这台机器的压力最轻 |
max_fails | 允许请求失败的次数,默认为 1,当超过最大次数时,返回 proxy_next_upstream 模块定义的错误 |
fail_timeout | 经历 max_fails 次失败后,暂停服务的时间 |
注意:负载调度算法为 ip_hash 时,后端服务器在负载均衡调度中的状态不能有 backup server,因为ip_hash不会基于可用性分配,仍会分给目标服务器
backup 服务器
-
功能:所有服务器都不能提供服务时,避免降低用户体验,配置 backup 服务器显示错误信息
-
backup server 配置
- backup upstream 服务器错误时的备份服务器
- localhost:8080 upstream 服务器错误时访问的 IP 和端口号
- /data/www/errorpage/index.html:错误时显示的页面的地址
-
示例
upstream webservers {server 192.168.18.201 weight=1 max_fails=2 fail_timeout=2;server 192.168.18.202 weight=1 max_fails=2 fail_timeout=2;server 127.0.0.1:8080 backup; }server {listen 8080;server_name localhost;root /data/www/errorpage;index index.html; }server {... }
三、示例
-
功能
- 设置一个 backend 上游服务器组
- 设置一个 backup 备份服务器
-
代码实现
# 定义一个名为 `backend` 的上游服务器组 upstream backend {# 定义负载均衡算法,这里使用 `least_conn` 算法least_conn;# 定义上游服务器,并设置不同的状态参数server backend1.example.com weight=3 max_fails=2 fail_timeout=30s;server backend2.example.com weight=2 max_fails=3 fail_timeout=30s;server backend3.example.com weight=1 max_fails=2 fail_timeout=20s;# 定义一个备份服务器,当所有主服务器都不可用时,流量将转发到备份服务器server backup.example.com backup;}# 定义一个虚拟主机 server {listen 80;server_name www.example.com;# 配置静态文件路径location / {root /data/www;index index.html;}# 配置负载均衡location /api/ {# 将所有 /api/ 开头的请求代理到 `backend` 上游服务器组proxy_pass <http://backend>;# 传递必要的头部信息给上游服务器proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;# 设置超时时间和连接选项proxy_connect_timeout 60s;proxy_send_timeout 60s;proxy_read_timeout 60s;proxy_buffering on;proxy_buffer_size 4k;proxy_buffers 4 32k;proxy_busy_buffers_size 64k;proxy_temp_file_write_size 64k;}# 配置错误页面处理error_page 500 502 503 504 /50x.html;location = /50x.html {root /usr/share/nginx/html;}# 配置日志文件access_log /var/log/nginx/access.log;error_log /var/log/nginx/error.log warn; }
-
配置解析
- upstream backend
- least_conn: 使用最少连接数算法,优先选择连接数最少的服务器来处理请求。
- 服务器配置:
- weight: 指定服务器的权重,权重越高,被选中的概率越大。
- max_fails: 允许的最大失败尝试次数,超过这个次数后,服务器将被标记为不可用。
- fail_timeout: 如果服务器达到 max_fails 限制,将在指定的时间段内被标记为不可用。
- 备份服务器: 当所有主服务器都不可用时,请求将被转发到备份服务器 backup.example.com。
- server:
- 监听端口: 配置监听在 80 端口。
- 静态文件路径: 配置根目录为 /data/www,默认首页为 index.html。
- 负载均衡配置: 将 /api/ 路径下的请求代理到 backend 上游服务器组。
- 头部信息传递: proxy_set_header 指令用于传递客户端请求的头部信息到上游服务器。
- 超时和缓冲设置: 配置请求超时时间和缓冲区大小,以优化代理请求的性能。
- 错误页面处理: 当发生 500、502、503 或 504 错误时,重定向到 /50x.html 错误页面。
- 日志文件: 配置访问日志和错误日志的存储路径及日志级别。
- upstream backend