火山引擎云调度GTM“同城容灾”与“异地多活”实践

随着企业不断推进数字化进程,高并发业务和海量数据的挑战也随之而来。在现实生活中,除了地震、台风、挖光纤这种小概率事件,还有很多人为造成的高概率数据丢失事件,比如人为操作失误、硬件故障、网络攻击等等,故障容灾能力的重要性也因此逐渐凸显出来。根据地理位置的不同,灾备方案往往分为同城和异地,今天重点介绍的就是GTM在互联网服务“同城容灾”和“异地多活”场景下的实践应用。

本文带你了解火山引擎边缘云TrafficRoute DNS套件——云调度GTM,它是火山引擎 TrafficRoute 解析调度套件中的全局流量管理服务,基于 DNS 进行流量管理。如果你的业务需要就近接入、负载均衡、流量调度和故障容灾能力,那么火山引擎云调度GTM可以帮助到你。

云调度GTM

对照以下表格,我们先来理解GTM的基本能力,再看这些能力在实现过程中如何应对不同的调度和故障场景。

图片

互联网服务的“同城容灾”

当用户服务部署在同一个区域的多个机房时,如公有云的XX云在华东某个城市包含两个可用区机房1/机房2,一旦其中某个机房发生故障,将基于预案进行自动或手动故障转移,确保服务不中断或快速恢复。

同城容灾有以下3种参考模式:

  • 冷备:同区域的2个机房采用“主-备”模式,即主机房平时承载流量,备机房不承载流量,当主机房故障时,流量迁移到备机房。该模式部署简单,但有两个缺点:第一是平常状态下的资源浪费;第二是主机房故障时,由于平时没有流量,备机房的后端配置、容量、各系统状态等是否“Ready”是不可知的。

  • 热备:同区域的两个机房采用“主-备”模式,主机房平时承载主要流量,备机房承载少量流量,这部分流量用来验证备机房的功能是否可用。这个模式解决了故障发生时备机房没有准备好的问题,但还是无法解决常态下一半资源的浪费和备用机房有可能出现容量不足的问题。

  • 双活:同区域的两个机房在常态下同时进行工作,当一个机房故障时,流量切换到另一个机房。由于常态下的同时工作,所以不存在是否“Ready”的问题,只需要关注故障时另一个机房能否承载流量即可。这个模式下,同一个区域多个机房也是可行的,冗余会更高,对非故障机房承载故障机房流量时,要保留“剩余容量”的要求就更低了,当然多个机房也可能带来数据/配置一致性等问题。

适用场景

同城容灾适用于距离较近的场景,包括同城多个机房、几个相邻的自建机房通过流量转发组成“同城/区域”等情况,支持通过主备(冷、热备)、双活(多活)等模式实现同城情况下的容灾,典型例子就是公有云同城内部的若干机房之间的容灾。

注:上述“冷备”,“热备”等名词定义并不严谨,文内只为解释不同模式之间的区别。

参考架构

图片

架构图中,将公有云的Region替换成“同城”,AZ换成普通机房也同样适用。这种情况下,机房入口(例如一个Region)使用一个负载均衡的CNAME标记集群是可以的,同时集群内部,如多个AZ之间也支持流量相互转发,负载均衡层面对用户会屏蔽AZ的细节。

优势介绍

  • 低成本:建设成本低、架构入侵小、适配性强;配置和管理简单;确保多IDC环境下服务不中断或者快速恢复;

  • 按需选择:可根据需要实现“冷备”、“热备” 和 “双活(多活)”;

  • 灵活配置:支持健康检查和自动容灾,也支持手动模式和多个预案的配置(结合在多个PoolSet间切换);

  • 方便管理:便于进行流量灰度和AB测试、流量机房间迁移等。

方案实践

图片

互联网服务的“异地多活”

在同城容灾的基础上,流量的调度容灾可以扩展到更大的范围。为了在性能、冗余(数据备份)和容灾上有更多的余地,全国/全球性的互联网服务通常采用多中心场景,包含多云、混合云,这要求我们不仅要做到同城一个机房/单个AZ故障时的容灾,也要做到多个地域部署服务时,地域级别故障下的异地灾备,确保服务的连续工作。当然,这需要解决多个地区、机房之间的流量均衡问题,确保每个机房的水位安全。

这就涉及到了异地灾备方案,由于异地的IDC转发延时较同城大,Region间的流量转发通常存在性能、成本等问题,可以通过做异地多活架构来替代流量转发,多个公有云的Region大体属于此类情况。

由于异地多活是一个相对复杂的话题,例如如何保持数据的一致性等,所以我们更关注从公网流量角度出发,进行容灾“多活”的举措。

适用场景

机房位于全国/全球多个位置,需要实现按地区的流量调度/均衡、跨地区的备份和流量灾备。例如,公有云多个区域之间的“多活”,或者距离较远的几个自建核心机房之间的灾备和服务多活。

参考架构

图片

上图是参考架构示意图,更关注外部流量的容灾方案。机房内部服务有多种选择,VM、容器、微服务等,而DB、MQ、缓存等的异地容灾也应该单独考虑。

优势介绍

  • 部署简单:建设成本低、架构入侵小、适配性强;配置和管理简单;同时具备区域内多个机房(AZ)和跨区域的容灾能力;AZ故障时由LB进行同Region其他AZ转发,可以实现大家常说的“两地三中心”+“同城容灾/异地多活”;

  • 多种模式:支持健康检查、自动容灾和手动模式,手动模式便于配置多个供选择的容灾预案;

  • 多区可用:适用于多机房、多Region流量均衡、灰度和AB测试;

  • 统一管理:可实现多地区、多机房、运营商、IP流量的统一管理和调度。

方案实践

图片

写在最后

完善的灾备方案在保证业务的持续性上不可或缺,火山引擎云调度 GTM基于解析进行流量调度,可以实现流量的就近接入(地理位置/性能)、负载均衡 。GTM借助分布式、多协议健康检查能力来实现故障容灾(Failover),诸如上文说到的“同城容灾”、“异地多活”等场景。此外 GTM 还提供了多云环境下的流量编排、资源粘合能力,可视化的健康检查数据分析、操作日志等功能帮助排查定位问题,便于日常运维。

当前,TrafficRoute DNS套件下的各个产品,包括云调度 GTM、私网解析PrivateZone、移动解析HTTPDNS和公共解析PublicDNS,服务了抖音,头条,飞书和火山引擎ALB、CDN、动态加速、存储等各类APP和云产品,具备重要产品稳定服务的能力,在技术、成本、性能和产品成熟度方面拥有深厚积累。

TrafficRoute DNS套件已正式上线火山引擎官网,欢迎访问【火山引擎官网】,了解更多TrafficRoute DNS套件相关信息。

关于火山引擎边缘云:

火山引擎边缘云,以云原生技术为基础底座,融合异构算力和边缘网络,构建在大规模边缘基础设施之上的云计算服务,形成以边缘位置的计算、网络、存储、安全、智能为核心能力的新一代分布式云计算解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/58113.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue可编辑表格

内容包含:校验。下拉框。输入框。日期控件 效果图 1.代码目录 2.index.js import SjjEditable from ./src/editable.vue // import Vue from vueSjjEditable.install = function (Vue) {Vue.component(SjjEditable.name, SjjEditable) }export default SjjEditable 3.util…

【进阶篇】MySQL 存储引擎详解

文章目录 0.前言1.基础介绍2.1. InnoDB存储引擎底层原理InnoDB记录存储结构和索引页结构InnoDB记录存储结构:InnoDB索引页结构: 3. MVCC 详解3.1. 版本号分配:3.2. 数据读取:3.3. 数据写入:3.4. 事务隔离级别&#xff…

【ubuntu】 20.04 网络连接器图标不显示、有线未托管、设置界面中没有“网络”选项等问题解决方案

问题 在工作中 Ubuntu 20.04 桌面版因挂机或不当操作,意外导致如下问题 1、 Ubuntu 网络连接图标消失 2、 有线未托管 上图中展示的是 有线 已连接 ,故障的显示 有线 未托管 或其他字符 3、 ”设置“ 中缺少”网络“选项 上图是设置界面&#xff0c…

【Cesium创造属于你的地球】实现地球展示、灵活进行坐标转换、视角切换

大家好,我是AIC山鱼!👉这是我的主页 🐋作为CSDN博主和前端优质创作者✍,我致力于为大家带来新颖、脱俗且有趣的内容。 🐱我还创建了山鱼社区,这是一个独特的社区🏠,&…

供水营业收费管理系统:智慧水务的得力助手

随着我国经济的快速发展,城市化进程不断加快,供水行业的需求也不断增长。为满足人们日益增长的用水需求,提高供水企业的管理水平和服务质量,供水营业收费管理系统应运而生,成为智慧水务的得力助手。 一、供水营业收费管…

【Hadoop】HDFS读写流程和客户端命令使用

🍁 博主 "开着拖拉机回家"带您 Go to New World.✨🍁 🦄 个人主页——🎐开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客 🎐✨🍁 🪁🍁 希望本文能够给您带来一定的…

ChromeOS 的 Linux 操作系统和 Chrome 浏览器分离

科技媒体 Ars Technica 报道称,谷歌正在将 ChromeOS 的浏览器从操作系统中分离出来 —— 让它变得更像 Linux。虽然目前还没有任何官方消息,但这项变化可能会在本月的版本更新中推出。 据介绍,谷歌将该项目命名为 "Lacros"—— 代表…

python爬虫12:实战4

python爬虫12:实战4 前言 ​ python实现网络爬虫非常简单,只需要掌握一定的基础知识和一定的库使用技巧即可。本系列目标旨在梳理相关知识点,方便以后复习。 申明 ​ 本系列所涉及的代码仅用于个人研究与讨论,并不会对网站产生不好…

Hadoop Hdfs基本命令

0目录 1.hadoop安装问题处理 2.hdfs基本命令 3.上传/下载文件和文件夹 1.hadoop安装问题处理 如果安装有进程无法启动,如下图 重新检查6个配置文件 Core-site.xml \ hdfs-site.xml \ hadoop-env.sh \ yarn-site.xml \ workers \ yarn-site.xml 来到hadoop313目录…

SpringBoot 跨域问题和解决方法

Spring Boot 是一种用于构建独立的、生产级别的Java应用程序的框架。在开发Web应用程序时,经常会遇到跨域资源共享(CORS)问题。本文将详细介绍Spring Boot中的跨域问题以及相应的解决方法。 目录 什么是跨域?1. 使用Spring Boot…

Matlab论文插图绘制模板第109期—特征渲染的标签气泡散点图

在之前的文章中,分享了Matlab标签散点图的绘制模板: 特征渲染的标签散点图: 进一步,再来分享一下特征渲染的标签气泡散点图的绘制模板,从而可以再添加一个维度的信息。 先来看一下成品效果: 特别提示&…

运用亚马逊云科技Amazon Kendra,快速部署企业智能搜索应用

亚马逊云科技Amazon Kendra是一项由机器学习(ML)提供支持的企业搜索服务。Kendra内置数据源连接器,支持快速访问Amazon S3、AmazonRDS、AmazonFSX以及其他外部数据源,帮助用户自动提取文档并建立索引。Kendra支持超过30多种多国语…

人工智能会成为人类的威胁吗?马斯克、扎克伯格、比尔·盖茨出席

根据消息人士透露,此次人工智能洞察论坛将是一次历史性的聚会,吸引了来自科技界的许多重量级人物。与会者们将共同探讨人工智能在科技行业和社会发展中的巨大潜力以及可能带来的挑战。 埃隆马斯克,特斯拉和SpaceX的首席执行官,一直…

无涯教程-Python机器学习 - Analysis of Silhouette Score函数

剪影得分的范围是[-1,1]。其分析如下- 1分数-接近1 剪影分数表示样本距离其邻近簇很远。 0分数-0 剪影分数表示样本在将两个相邻聚类分隔开的决策边界上或非常接近。 -1分数-1 剪影分数表示样本已分配给错误的聚类。 Silhouette得分的计算可以使用以下公式完成 $$剪影得…

没有 JavaScript 计时器的自动播放轮播 - CSS 动画

先看效果&#xff1a; 再看代码&#xff08;查看更多&#xff09;&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>计时器</title><style>* {padding: 0;margin: 0;box-siz…

JAVA JNA 调用C接口的三种方式

文章目录 1. 准备一个共享库文件2. JNA姿势1—继承Library接口3. JNA姿势2—直接NativeLibrary.getInstance3. JNA姿势3—Native方法 1. 准备一个共享库文件 test.c #include <stdio.h> int test(char *input){printf("input:%s\n",input);return 0; }libtes…

Aidex 移动端快速开发框架# RuoYi-Uniapp项目,uniapp vue app项目跨域问题

参考地址&#xff1a; manifest.json官方配置文档&#xff1a;manifest.json 应用配置 | uni-app官网 Chrome 调试跨域问题解决方案之插件篇&#xff1a; uni-app H5跨域问题解决方案&#xff08;CORS、Cross-Origin&#xff09; - DCloud问答 其实uni-app官方有解决跨域的办…

Yolov8-pose关键点检测:模型轻量化创新 | PConv结合c2f | CVPR2023 FasterNet

💡💡💡本文解决什么问题:新的partial convolution(PConv),通过同时减少冗余计算和内存访问可以更有效地提取空间特征。 PConv| GFLOPs从9.6降低至8.5,参数量从6482kb降低至6134kb, mAP50从0.921提升至0.925 Yolov8-Pose关键点检测专栏介绍:https://blog.csdn.n…

第9章:聚类

聚类任务 性能度量 距离度量 非度量距离 原型聚类 有很好的统计学上的意义&#xff0c;但是只能找到椭球形的聚类。 密度聚类 层次聚类

JVM,JRE和JDK的区别

JVM&#xff0c;JRE和JDK的区别 JVM(Java Virtual Machine&#xff0c;Java虚拟机)JREJRE目录结构 JDK JVM(Java Virtual Machine&#xff0c;Java虚拟机) Java程序的跨平台特性主要是指字节码文件可以在任何具有Java虚拟机的计算机或者电子设备上运行&#xff0c;Java虚拟机中…