阿里云再次突发故障,高可用形同虚设?

作者:IT邦德
中国DBA联盟(ACDU)成员,10余年DBA工作经验,
Oracle、PostgreSQL ACE
CSDN博客专家及B站知名UP主,全网粉丝10万+
擅长主流Oracle、MySQL、PG、高斯及Greenplum备份恢复,
安装迁移,性能优化、故障应急处理
微信:jem_db
QQ交流群:587159446
公众号:IT邦德

文章目录

  • 前言
    • 盘点事故
    • 用户的期待
    • 公共云现状
    • 感想

前言

MySQL9.0创新版本已经正式发布,这次功能确实进化了不少!

盘点事故

北京时间2024年07月02日10:04分,阿里云又挂了!上海可用区N出现网络访问异常,
从发现故障到解决用时31分钟,从发现故障到影响恢复用时38分钟。盘点2024年,已经发生3次故障了,真是让人吐血!

不得不说,阿里云作为国内最大的云服务商,其影响力太大了!这次故障据说是由于光缆断了,这样的故障时长放眼整个互联网也是炸裂般的存在。影响的服务范围看上去”不大“,但要命的核心服务一个都没拉下:对象存储,云服务器,云数据库,K8S,Redis…

这次故障是单可用区故障,所以一些云数据库服务可以进行主备切换,将流量切换到其他可用区。尽管如此,此区受到的影响也很大,有不少网友反映“小红书崩了”,刷新不出推荐内容

同时网友反映,B站App无法使用浏览历史关注等内容,消息界面、更新界面、客服界面均不可用,用户也无法评论和发弹幕,视频评论区和用户(UP主)主页都无法加载…

再次盘点2024年04月08日,腾讯云出现的一场全球性的大故障,用腾讯云官方的说法,崩了74 分钟,波及全球17个区域与数十款服务。

用户的期待

其实用户一直在等待,阿里云给出的事后故障复盘权威报告,可事实是只有恢复之后的报告,这里不得不引入一个知识:服务等级协议Service Level Agreement,简称 “SLA”,一般用来描述服务提供商承诺提供给用户的服务稳定性的指标,如果达不到相应的SLA指标,那么就可能面临相应的违约赔偿。

查阅阿里云服务的SLA文档,目前他们所提供的几十种云服务,大多提供了“4个9”左右的稳定性承诺,即99.99%的稳定性。今天看了下网上大家的第一反应都是这么大的公司怎么还会出这样的问题?又有多少打工人周末加班还碰上公司重大事故责任~

反思这个问题出现其背后的原因是什么?毕竟这么大的公司,应急预案肯定是有的,补救措施肯定也是相对完善,为什么还会造成这么大的后果?而且不久前刚出现过一场全球性的大故障?难道高可用真的形同虚设?

用户为什么这么迫切的期待复盘报告呢?复盘报告详细描述了处理过程、服务影响、问题分析与改进措施,并提供中文简体、繁体、英文三种版本,能让人重新树立阿里工程师可以更好地应对未来故障的信心。对软件系统生产事故复盘报告越保密,开发人员对自己能应对软件系统稳定性故障就越没信心!

其实这份云健康看板是要深刻在用户的心中

解决“IT系统稳定性工作很难被认可”的难题,一个好办法,就是在每次意外事件后,就撰写并公布领导和用户都能看懂的避坑指南。让他们了解稳定性工作所面临的挑战和价值。“ 很多做过稳定性这事的人都知道,做这个事情最麻烦的是很难被认可,做的好,不出问题,不懂的人不知道你做了什么,出了问题的时候觉得你到底做了什么,所以会看到很多公司都是运动式的做稳定性,一阵一阵的。

公共云现状

近几年我国云计算行业的市场规模和渗透率均在持续增长,使得我国公有云市场进入了一个新的发展阶段。除此之外,在5G商用以及AI等技术发展的推动下,我国公有云市场规模始终保持高速增长趋势。在公有云市场规模不断扩大的过程中,用户对其需求也随着发生改变。为满足客户的需求,市场产品形式发生了相应的变化。

公有云将继续与大数据、人工智能、物联网等先进技术进行深度融合,提供更丰富的服务。大数据和人工智能的融合将推动公有云成为处理大数据的关键工具,而边缘计算和混合云的兴起则将进一步推动公有云的发展。随着客户需求的个性化、多样化,公有云服务商将提供更多定制化的服务。他们将根据客户的具体需求,提供针对性的解决方案,以满足不同行业、不同场景下的需求。

预计中国到2025年将达到42%,公共云的比例为36%。

感想

公有云更进一步,不再以机位、服务器为单位,而以“服务”为单位,将多台主机资源整合,对外提供各种服务,其实就是一种革命,这里面会产生非常多革新式技术,用户信任、技术声望以及商誉真的对于云服务商太重要了。云计算现在卷的厉害,只有阿里这样的头部才能卷的动!但是如果真的这么多重大故障频发,赔了这么多钱,可能新的一轮裁员即将拉开序幕,互联网从业者又要开始瑟瑟发抖了!

作为一名13年DBA运维的技术人员,跟之前很多互联网上的热议事件是相呼应的,就是一群兢兢业业在干事情的人,不论他的职位是什么、行业是什么,如果不能更“柔善”一点的处理各种工作上、人际上的事物,最终被优化的都是他们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/39210.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA实现麦克风说话同声传译

一、能力与场景说明 同声传译,又称同步口译或同声翻译,是一种专业的口译形式,指的是在讲话者发言时,口译员几乎同时将讲话内容翻译成目标语言。这种翻译方式通常用于国际会议、高级别政治或商业会谈、研讨会和其他需要即时多语言…

HarmonyOS Next 原生应用开发-从TS到ArkTS的适配规则(一)

一、强制使用静态类型 静态类型是ArkTS最重要的特性之一。如果程序采用静态类型,即所有类型在编译时都是已知的,那么开发者就能够容易理解代码中使用了哪些数据结构。同时,由于所有类型在程序实际运行前都是已知的,编译器可以提前…

【UE 网络】多人游戏开发时应该如何区分客户端逻辑和服务端逻辑 入门篇

目录 0 引言1 服务器和客户端逻辑1.1 服务器职责1.2 客户端职责 2 函数会在客户端执行还是服务端?2.1 只在客户端执行的函数RepNotifyClient RPCMulticast RPC 2.2 只在服务端执行的函数GameModeServer RPC 2.3 在两端都可以执行的函数GetNetMode() 和 HasAuthority…

LangGraph 和 AutoGen 的对比

LangGraph 和 AutoGen 都是用于构建大型语言模型 (LLM) 应用程序的框架。它们都旨在使开发人员更容易地控制 LLM 并使其适应特定任务。但是,这两种框架之间存在一些关键差异。 代理架构 LangGraph 和 AutoGen 之间最大的区别在于代理的构建方式。LangGraph 使用更…

用C#的MediaDevices程序集打开MTP设备(用usb线连接的手机)的文件夹

一、任务描述 1、可以访问MTP设备的桌面程序。 MTP设备:支持媒体传输协议(MTP)的设备,MTP简单来说就是一种PC与其他设备相连的一种协议,智能手机、平板电脑、数码相机等可以通过 USB 连接到电脑,并通过 MTP 协议传输媒体文件。点…

PLC_博图系列☞F_TRIG:检测信号下降沿

PLC_博图系列☞F_TRIG:检测信号下降沿 文章目录 PLC_博图系列☞F_TRIG:检测信号下降沿背景介绍F_TRIG: 检测信号下降沿说明参数示例 关键字: PLC、 西门子、 博图、 Siemens 、 F_TRIG 背景介绍 这是一篇关于PLC编程的文章&a…

httpx.HTTPStatusError: Client error ‘429 Too Many Requests‘ for url ‘

httpx.HTTPStatusError: Client error ‘429 Too Many Requests’ for url ‘https://open.bigmodel.cn/api/paas/v4/chat/completions’ For more information check: https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/429 错误解释: httpx.HTTPStatusE…

LeetCode:3115. 质数的最大距离(Java 筛质数)

目录 3115. 质数的最大距离 题目描述: 实现代码与解析: 筛质数 原理思路: 3115. 质数的最大距离 题目描述: 给你一个整数数组 nums。 返回两个(不一定不同的)质数在 nums 中 下标 的 最大距离。 示…

Swift中的二分查找:全面指南

Swift中的二分查找:全面指南 简介 二分查找是计算机科学中的经典算法,被广泛用于在已排序的数组中高效地搜索目标值。与线性查找逐个检查每个元素不同,二分查找不断将搜索区间减半,因此在处理大数据集时要快得多。 在这篇博客中…

从零到百万用户的扩展之路

写在前面: 此博客内容已经同步到我的博客网站,如需要获得更优的阅读体验请前往https://mainjaylai.github.io/Blog/blog/system/design-system 设计一个支持数百万用户的系统是极具挑战性的,它是一段需要持续优化和不断改进的旅程。在这篇博客中,我们将构建一个支持单个用…

NC13611 树(dfs序+区间dp)

链接 思路&#xff1a; 容易知道对于同一种颜色的子图一定是仅由该颜色的点连通的。设我们要划分的个数为x&#xff08;x<k&#xff09;&#xff0c;也就是说我们要选出x-1条边&#xff0c;这里有种情况。那么我们需要选出x种颜色&#xff0c;这里有种情况。然后我们需要将…

英国Assignment写作怎么积累经验?

最近很多留学生每天都要熬夜&#xff0c;吓死宝宝了。关键是最后还是会fall了啊&#xff01;其实英国Assignment写作是要靠日积月累的写作经验的&#xff0c;虽然阅读量和写作水平无法一日千里&#xff0c;但是写作技巧却是可以速成的&#xff0c;我们一起来看看吧。 选题定方…

单线服务器有什么作用?

什么是单线服务器&#xff1f;单线服务器是指只有一条物理线路可以接入的服务器&#xff0c;这表明所有的数据信息与用户的访问请求都只能通过这一条线路来进行传输&#xff0c;因此单线服务器在服务器的性能与可扩展性方面有着一定的限制。 单线服务器与双线服务器相比&#x…

双端队列广搜——AcWing 175. 电路维修

双端队列广搜 定义 双端队列广搜&#xff08;Breadth-First Search with a Deque&#xff09;是一种图或树的遍历算法变体&#xff0c;它利用了双端队列&#xff08;Deque&#xff0c;全称Double Ended Queue&#xff0c;允许在其两端进行插入和删除操作&#xff09;作为数据…

1996-2023年各省财政收支数据(无缺失)(地方财政一般预算收入、地方财政一般预算支出)

1996-2023年各省财政收支数据&#xff08;无缺失&#xff09;&#xff08;地方财政一般预算收入、地方财政一般预算支出&#xff09; 1、时间&#xff1a;1996-2023年 2、来源&#xff1a;国家统计局、统计年鉴、 3、指标&#xff1a;地方财政一般预算收入、地方财政一般预算…

跨境业务经验推荐:三大优秀的IP代理服务商

作为一名多年从事跨境业务的老手&#xff0c;今天我要给大家介绍几款绝对靠谱的IP代理服务商&#xff0c;保证让你的全球业务更加顺畅&#xff01; 1. 711Proxy 711Proxy以其优秀的性能和覆盖范围广而著称。对于跨境电商和国际业务来说&#xff0c;快速稳定的网络连接至关重要…

d3dx9_43.dll丢失怎么解决?d3dx9_43.dll怎么安装详细教程

在使用计算机中&#xff0c;如果遇到d3dx9_43.dll丢失或许找不到d3dx9_43.dll无法运行打开软件怎么办&#xff1f;这个是非常常见问题&#xff0c;下面我详细介绍一下d3dx9_43.dll是什么文件与d3dx9_43.dll的各种问题以及d3dx9_43.dll丢失的多个解决方法&#xff01; 一、d3dx9…

Zynq—按键控制LED灯闪烁

一、GPIO简介 ZYNQ 的 IO包括对外连接的 GPIO 和内部 PS 与 PL 通信的 AXIO。其中对外的 GPIO 又分为 两种&#xff1a; MIO 和 EMIO。 MIO 和 EMIO 只是 GPIO 信号的两种接口&#xff0c; MIO 直连到PS(数量有限)&#xff0c; EMIO 则是 PS 扩展到 PL&#xff0c;从 PL 接出的…

UTONMOS:探索未来区块链与元宇宙的游戏奇妙融合

在科技的飞速发展浪潮中&#xff0c;区块链技术正以前所未有的力量重塑着各个领域&#xff0c;而游戏行业也迎来了一场前所未有的变革——元宇宙游戏的崛起。 元宇宙&#xff0c;这个充满无限想象的虚拟世界&#xff0c;让玩家能够沉浸其中&#xff0c;体验超越现实的奇幻之旅。…

springboot评选投票系统-计算机毕业设计源码15837

摘 要 本文介绍的是基于Spring Boot开发的评选投票系统小程序。该系统旨在为用户提供一个便捷、高效的平台&#xff0c;以实现评选活动的投票功能。随着社交媒体和互联网的普及&#xff0c;评选活动已成为各行业中常见的形式&#xff0c;如最佳歌曲、最佳演员等。然而&#xf…