开源模型应用落地-工具使用篇-SLB(二)

一、前言

    通过学习"开源模型应用落地"系列文章,我们成功地建立了一个完整可实施的AI交付流程。现在,我们要引入负载均衡,以提高我们的AI服务的性能和故障转移能力。本文将详细介绍如何使用腾讯云的负载均衡技术来将我们的AI服务部署为一个集群。


二、术语

2.1、负载均衡

    负载均衡(Load Balancing)是一种技术,旨在在计算机、网络或其他资源上均匀分配工作负载,以提高系统的性能、可靠性和可扩展性。

    在计算机网络中,负载均衡通常用于分配网络流量或请求到多个服务器上,以避免单个服务器过载而导致性能下降或系统故障。通过将工作负载分发到多个服务器上,负载均衡确保每个服务器都能够处理适量的请求,从而提高整个系统的响应能力。

2.2、硬件负载均衡

    是一种使用专门的物理设备(硬件负载均衡器)来实现负载均衡的技术。与软件负载均衡相比,硬件负载均衡器是一种专用硬件设备,具有更高的处理能力和性能。

    硬件负载均衡器通常位于网络中央位置,作为服务器和客户端之间的中间层。其主要功能是在多个服务器之间分发网络流量或请求,以确保负载均衡和高可用性。

硬件负载均衡器具有以下特点和优势:

  • 高性能:硬件负载均衡器通常具有专门的硬件加速器和优化算法,能够处理大量的网络流量和请求,提供快速响应和高吞吐量。
  • 可扩展性:通过添加更多的服务器和负载均衡器,硬件负载均衡器可以轻松扩展以适应不断增长的流量和负载需求。
  • 可靠性:硬件负载均衡器通常具有冗余和故障转移机制,以确保在单个负载均衡器故障时仍然保持系统的可用性。
  • 安全性:硬件负载均衡器可以提供一些安全功能,如防火墙、DDoS(分布式拒绝服务攻击)防护等,以增强系统的安全性。
  • 管理和监控:硬件负载均衡器通常提供简单易用的管理界面和丰富的监控工具,使管理员能够轻松配置和监控负载均衡器的性能和状态。

2.3、软件负载均衡

    是一种使用软件来实现负载均衡的技术。它在计算机系统中通过运行在普通服务器上的负载均衡软件来分发工作负载,以实现请求的均衡分配和系统性能的提升。

软件负载均衡通常采用以下几种方式来实现:

  • 软件负载均衡器:通过在一组服务器上运行负载均衡软件,该软件可以基于特定的算法(如轮询、最小连接等)将请求分发到不同的服务器上。负载均衡软件可以动态地监测服务器的负载情况,并根据负载情况进行动态调整,以实现负载均衡。
  • 反向代理服务器:反向代理服务器是一种位于客户端和服务器之间的服务器,它接收来自客户端的请求,并代表客户端向后端服务器发送请求。反向代理服务器可以使用负载均衡算法将请求分发到多个后端服务器上,以实现负载均衡。
  • 虚拟IP(VIP)或虚拟服务器:通过使用虚拟IP或虚拟服务器,多个服务器可以共享同一个IP地址或域名,客户端的请求将被分发到这些服务器中的一个。这种方式可以通过软件来实现负载均衡,将请求分发到不同的服务器上。

2.4、负载均衡算法

负载均衡可以使用多种算法来决定如何分配工作负载。常见的负载均衡算法包括:

  1. 轮询(Round Robin):按照顺序将请求依次分发到每个服务器,确保每个服务器都有机会处理请求。
  2. 最少连接(Least Connection):将请求分配给当前连接数最少的服务器,以确保负载更均衡。
  3. IP哈希(IP Hash):根据客户端的IP地址将请求分发到特定的服务器,以确保相同IP地址的请求始终被分配到同一台服务器上。
  4. 加权轮询(Weighted Round Robin):给每个服务器分配一个权重值,根据权重值决定分发请求的比例,使处理能力更强的服务器获得更多的请求。
  5. 动态负载均衡:根据服务器的实时负载情况动态地调整请求的分发策略,以适应不同负载情况下的最佳性能。

2.5、SLB

    是负载均衡(Server Load Balancing)的缩写,是一种网络技术和架构,用于将请求或流量分发到多个服务器上,以实现负载均衡和提高系统的性能、可靠性和可扩展性。

    SLB通常由一个负载均衡器(Load Balancer)和多个后端服务器(Backend Servers)组成。负载均衡器是位于客户端和后端服务器之间的中间设备,它接收来自客户端的请求并根据特定的算法将请求分发到后端服务器上。负载均衡器还监视后端服务器的状态和负载情况,并根据配置策略动态调整请求分发,以实现负载均衡。


三、使用方式

3.1、架构示意图

    这里的SLB部署在内网,位于业务服务和AI服务的中间,作为AI服务的入口,为AI服务提供集群化部署的能力

3.2、进入腾讯云控制台入口

访问地址:https://cloud.tencent.com/

点击右上角 -》控制台

3.3、按需选择登录方式

3.4、进入负载均衡管控界面

在搜索框输入“SLB”或者“负载均衡”,点击“负载均衡”入口

3.5、按需选择实例

建议跟云服务器处于一样的实例下面

3.6、新建实例

3.7、选择配置

计费模式:建议选择按量计费,成本会更低

地域:建议跟云服务器实例一致

网络类型:此处部署在内网(PS:App的入口处网络类型是公网)

所属网络:可以复用已有的网络或新建网络

实例规格:选择共享性即可满足(共享型负载均衡实例每分钟并发连接数50,000,每秒新建连接数5,000,每秒查询数5,000)

所属项目:默认项目或者自定义均可

标签和实例名:按需设置

勾选服务协议后点击立即购买

3.8、配置监听器

在实例管理列表中,选择刚刚购买的实例,点击操作中的配置监听器菜单

按需配置“HTTP/HTTPS监听器”或者“TCP/UDP/TCP SSL/QUIC监听器

此处接入AI服务,选择TCP监听器

点击新建 -》填写基本配置(PS:8999是对外服务的端口地址)

配置健康检查(PS:9999是AI服务的端口)

高级选项可以根据实际业务情况进行调整

配置会话保持(PS:AI服务是无状态的,不需要保持会话)

点击“提交”按钮完成监听器配置

3.9、调用

完成监听器配置之后,可以在“实例管理”列表处查看到SLB对应的VIP,并修改测试页面的连接信息,调整为VIP和对应的监听端口

3.10、监控

在“实例管理”列表处 -》选择对应的SLB实例 -》选择“监控”


四、附带说明

4.1、本篇以腾讯云的负责均衡服务作为掏砖引玉的入门介绍,对于其他的云服务商,也是大致的流程

4.2、建议开启删除保护,避免出现误操作的情况

4.3、公网类型的SLB(即网络入口),建议接入Web应用防火墙

4.4、在日志中心可以查询具体的访问日志信息以及仪表盘的大盘信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/689140.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

洛谷 P1150 Peter 的烟

参考代码and代码解读 #include<iostream> using namespace std; int main() { int n,k,nonu; //n烟的数量&#xff0c;k需要多少根烟头换一支烟&#xff0c;nonu记录烟头的个数 cin>>n>>k; int sumn; //一开始就能吸n支烟 nonusum; …

深度学习之pytorch实现线性回归

度学习之pytorch实现线性回归 pytorch用到的函数torch.nn.Linearn()函数torch.nn.MSELoss()函数torch.optim.SGD() 代码实现结果分析 pytorch用到的函数 torch.nn.Linearn()函数 torch.nn.Linear(in_features, # 输入的神经元个数out_features, # 输出神经元个数biasTrue # 是…

Jlink+OpenOCD+STM32 Vscode 下载和调试环境搭建

对于 Mingw 的安装比较困难&#xff0c;国内的网无法正常在线下载组件&#xff0c; 需要手动下载 x86_64-8.1.0-release-posix-seh-rt_v6-rev0.7z 版本的软件包&#xff0c;添加环境变量&#xff0c;并将 mingw32-make.exe 名字改成 make.exe。 对于 OpenOCD&#xff0c;需要…

mysql 2-18

加密与解密函数 其他函数 聚合函数 三者效率 GROUP BY HAVING WHERE和HAVING的区别 子查询 单行子查询和多行子查询 单行比较操作符 多行比较操作符 把平均工资生成的结果当成一个新表 相关子查询 EXISTS 一条数据的存储过程 标识符命名规则 创建数据库 MYSQL的数据类型 创建表…

利用ChatGPT进行数据分析——如何提出一个好的prompt

利用ChatGPT进行数据分析——如何提出一个好的prompt ​ 使用ChatGPT时&#xff0c;能否得到一个好的输出结果&#xff0c;关键在于能否提出好的prompt。 1.1 prompt是什么 ​ 现在大家把向ChatGPT输入的内容称作prompt&#xff08;提示&#xff09;&#xff0c;它的作用是引…

Docker部署Java项目

打包 添加 <!-- 打包插件--> <build><plugins><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId></plugin></plugins> </build> 通过执行以下命令进…

MySQL数据库基础(九):SQL约束

文章目录 SQL约束 一、主键约束 二、非空约束 三、唯一约束 四、默认值约束 五、外键约束&#xff08;了解&#xff09; 六、总结 SQL约束 一、主键约束 PRIMARY KEY 约束唯一标识数据库表中的每条记录。主键必须包含唯一的值。主键列不能包含 NULL 值。每个表都应该有…

String为什么是不可变的?

原因一、String字符串类型的数据结构 字符串在String类的内部是用一个char[]数组表示的,而这个数组使用final关键字修饰的&#xff0c;所以不能修改。 举例说明&#xff1a; String ip"127.0.0.1"; String retip.replace(".","#"); System.out.…

BUGKU-WEB 留言板1

题目描述 题目截图如下&#xff1a; 进入场景看看&#xff1a; 解题思路 之间写过一题类似的&#xff0c;所以这题应该是有什么不同的那就按照之前的思路进行测试试试提示说&#xff1a;需要xss平台接收flag&#xff0c;这个和之前说的提示一样 相关工具 xss平台&#xf…

银河麒麟操作系统自动同步时间更新

1、银河麒麟操作系统基于Centos8的&#xff0c;因centos8取消了ntp服务器&#xff0c;所以导致之前使用ntpdate命令无法同步时间 2、centos默认使用chrony模块来进行同步时间 3、修改chrony配置同步时间服务器 vim /etc/chrony.conf 4、目前使用的是阿里云的时间服务器&…

深入浅出熟悉OpenAI最新大作Sora文生视频大模型

蠢蠢欲动&#xff0c;惴惴不安&#xff0c;朋友们我又来了&#xff0c;这个春节真的过的是像过山车&#xff0c;Gemini1.5 PRO还没过劲&#xff0c;OpenAI又放大招&#xff0c;人类真的要认输了吗&#xff0c;让我忍不住想要再探究竟&#xff0c;到底是什么让文生视频发生了质的…

流星蝴蝶剑之七夜听雪中文版下载

软件介绍&#xff1a; 中文名称: 流星蝴蝶剑七夜听雪 英文名称: Meteor 游戏类型: 3D武侠格斗 发行时间: 2002年08月 制作发行: 流星江湖悠悠客栈 语言 :中文 配置要求: 操作系统&#xff1a;Windows 95 / 98 / Me / 2000 / XP 最低配置 CPU&#xff1a;Pentium II 450MHz 以上…

单向/双向V2G环境下分布式电源与电动汽车充电站联合配置方法(matlab代码)

目录 1 主要内容 目标函数 电动汽车负荷建模 算例系统图 程序亮点 2 部分代码 3 程序结果 4 下载链接 1 主要内容 该程序复现博士文章《互动环境下分布式电源与电动汽车充电站的优化配置方法研究》第五章《单向/双向V2G环境下分布式电源与电动汽车充电站联合配置方法》…

0206-1-网络层

第 4 章 网络层 网络层提供的两种服务 虚电路服务 数据报服务 概要: 虚电路服务与数据报服务的对比 网际协议 IP 网际协议 IP 是 TCP/IP 体系中两个最主要的协议之一。与 IP 协议配套使用的还有四个协议&#xff1a; 地址解析协议 ARP (Address Resolution Protocol)逆地…

【鸿蒙系统学习笔记】TypeScript开发语言

一、背景 HarmonyOS 应用的主要开发语言是 ArkTS&#xff0c;它由 TypeScript&#xff08;简称TS&#xff09;扩展而来&#xff0c;在继承TypeScript语法的基础上进行了一系列优化&#xff0c;使开发者能够以更简洁、更自然的方式开发应用。值得注意的是&#xff0c;TypeScrip…

Spring整合Mybatis之DAO层、Service层开发

3. Spring整合Mybatis编程DAO层开发 1. 项目引入相关依赖spring mybatis mysql mybatis-spring druid2. 编写spring.xml整合&#xff1a;spring 接管 mybatis 中 SqlSessionFactory对象的创建<!--创建DataSource--><bean class"com.alibaba.druid.pool.…

8、内网安全-横向移动RDPKerberos攻击SPN扫描WinRMWinRS

用途&#xff1a;个人学习笔记&#xff0c;有所借鉴&#xff0c;欢迎指正 目录 一、域横向移动-RDP-明文&NTLM 1.探针服务&#xff1a; 2.探针连接&#xff1a; 3.连接执行&#xff1a; 二、域横向移动-WinRM&WinRS-明文&NTLM 1.探针可用&#xff1a; 2.连接…

【PyQt】14-绘图-QPainter

文章目录 前言一、QPainter二、绘制文本-drawTextQt里面的文本对齐方式 运行结果 三、像素点总结 前言 1、学会画图方法 一、QPainter 通常可以绘制文本、各种图形&#xff08;点、线、椭圆、弧、扇形、多边形等等&#xff09;、图像。 必须在painrEvent事件方法中绘制各种元…

Eclipse 分栏显示同一文件

Eclipse 分栏显示同一文件 1. Window -> EditorReferences 1. Window -> Editor Toggle Split Editor (Horizontal) &#xff1a;取消或设置水平分栏显示 Toggle Split Editor (Vertical) &#xff1a;取消或设置垂直分栏显示 References [1] Yongqiang Cheng, https:/…