从运维到运维大神,只需要一个正确的选择

马上就是7月24日了,听群里的朋友说,7和24这两个数字是运维工作的最佳体现——7X24小时待命,所以咱们IT人将这一天自定义为“运维日”

对于运维工作来说,想要在黑天鹅横飞,灰犀牛直撞的当下,既能独善其身,又能兼济天下,那么选择一款靠谱的存储产品,是至关重要的。

今天,我们就来聊一聊“选择”这个话题。

↓↓↓

一、那个男人和他的定律

时间是1949年,地点是美国爱德华兹空军基地。一名工程师半开玩笑的提出了一个后来以自己的名字命名的定律——墨菲定律,这个定律指出:

翻译翻译!

就是如果事情有变坏的可能,不管可能性有多小,它总会发生。就是这个定律,让很多IT人从此过上了提心吊胆的日子。

你说我全防出去了!但不好意思,很多时候,甚至都不知道发生了啥,问题就来了。

在咱们IT宇宙,Bug超多样,坑你没商量。比如,硬件系统中,数据翻转(包括内存/网络/磁盘的位翻转)不仅时有发生,而且反手就是一个数据丢失。再比如,CPU的静默数据错误,由于它不可被检测,堪比无色无味的十香软筋散,处理起来更是棘手。

除了硬件错误,软件Bug也会导致数据丢失,特别是元数据一旦受到影响,则可能从一台机器扩散到一个集群,甚至被数据复制功能扩展到全球整个服务。防不胜防啊!

那么,倔犟的对象存储是如何应对的呢?

二、OSS的应对之道

1、深淘滩,低作堰:打造“数据护盾体系”

如果把数据比作孙悟空,那么既不能让它逃出五指山,丢了,也不能让它变为六耳猕猴,错了。

一种数据保护思路就是使用冗余技术,那效果简直不要太好!

副本和纠删码(Erasure Coding,EC)是分布式存储系统中常用的两种数据冗余保护策略。

很多小朋友要问了:这两种策略要如何选择呢?

  • 对性能要求高的业务(比如数据库)用副本
  • 对预算成本敏感的业务(比如视频、影像等海量数据存储)用纠删码

小朋友才做选择题,咱们IT人,当然全都要!

对于盘古这样excellent的分布式存储系统来说,已经实现了副本和纠删码二者的兼得。做到:副本和EC起飞,安全共成本一色!

基于盘古的阿里云对象存储OSS采用的纠删码配比是N+M(将原始数据分为N份,计算M份冗余,N和M均可调整),将数据存储在不同的存储介质,实现数据分层存储,已写入的数据还可以通过改变N和M的比例,转储为指定存储类型,完成数据的生命周期管理。

当然,一味地节省成本并不是万全之策!

狡兔三窟的成语告诉我们一个道理:别把鸡蛋放在同一个篮子里。听人劝,吃饱饭的OSS将数据分散存放在同一地域(Region)的3个可用区,在某个可用区不可用时,依然可以保证数据可以正常访问。

依靠纠删码和多可用区冗余,OSS的可用性SLA提升到99.995%,也就是每5分钟内10万请求最多只错5个。理论上的出错的概率,差不多等于双色球三等奖的中奖概率。

但这世上,又有几人中过三等奖呢?

2、背靠大树好乘凉,打造“分层容错体系”

表面上看,市面上的对象存储没差啊,都带个object,但其实能力千差万别。

数十万的客户共享海量资源池,做好租户之间的资源隔离,让马奔大道、虎奔山就显得尤为重要。OSS的方式是通过采取不同租户的带宽和QPS流控、异常流量全网秒级告警等手段,避免过大的访问压力造成用户互相挤占,保证系统正常运行。横向对比一下,这技术天花板,那高得真的不是一星半点!

针对误操作,OSS还提供了一剂后悔药——OSS版本控制功能,开启这个功能之后,针对数据的覆盖和删除操作将会以历史版本的形式保存下来,可以轻松将Bucket中存储的Object恢复至任意时刻的历史版本。失而复得的快乐,你值得拥有!

除了内因,外因也不得不防。

IT世界光怪陆离,黑客们早已升级,他们不杀人放火,他们敲诈勒索。平时遭遇点DDoS攻击,那是老板的大度,但要是被病毒勒索了,宕机了,那就等着老板的超度吧。

但,别怕!所谓魔高一尺,道高一尺一,OSS引入了防篡改能力,不仅清热解“毒”,而且还能强身健体。此外,OSS还与阿里云安全产品联手推出高防能力,构建金刚伏魔圈,同时使用移形换影大法,将攻击流量牵引至高防集群进行清洗。无惧DDoS冷箭。

OSS还有多个技术细节,轻松应对网络灰产,比如堪比“芙蓉金针”的的探针系统,可准确检测灰产,并快速实现IP隔离。什么叫专业,其实就是细节!

超长待机的IT人贼拉多,每位都有故事,而每个故事的背后,其实都是一次历练,不白折腾!

多少次午夜梦回,IT人或许会梦到那个拯救了公司业务系统的运维大神,那是公司的至暗时刻,却是他的高光时刻,几个简单操作,就让老板的目光变得如流水般温柔,笑容变得如夏花般绚烂。

其实,从运维到运维大神的距离,说短不短,说长也不长,只需要在一开始就做出那个最正确的选择。现在,聪明的你,知道怎么选了吗?

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/510606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

主流定时任务解决方案全横评

定时任务作为一种按照约定时间执行预期逻辑的通用模式,在企业级开发中承载着丰富的业务场景,诸如后台定时同步数据生成报表,定时清理磁盘日志文件,定时扫描超时订单进行补偿回调等。 程序开发人员在定时任务领域有着诸多框架和方…

基于阿里云 Serverless 函数计算开发的疫情数据统计推送机器人

一、Serverless函数计算 什么是Serverless? 在《Serverless Architectures》中对 Serverless 是这样子定义的: Serverless was first used to describe applications that significantly or fully incorporate third-party, cloud-hosted applications…

看 Serverless Task 如何解决任务调度可观测性中的问题

在上篇文章《解密函数计算异步任务能力之「任务的状态及生命周期管理」》中,我们介绍了任务系统的状态管理,并介绍了用户应如何根据需求,对任务状态信息进行实时的查询等操作。在本篇中我们将会进一步走进函数计算异步任务,介绍异…

B站每日自动签到传统单节点网站的 Serverless 上云

什么是函数?刚刚考完数学没多久的我,脑力里立马想到的是自变量、因变量、函数值,也就是yf(x)。当然,在计算机里,函数function往往指的是一段被定义好的代码程序,我们可以通过传参调用这个定义好的函数&…

通过部署流行 Web 框架掌握 Serverless 技术

大家好,我是霍大侠,这个系列课程我们通过部署流行web框架,来学习掌握serverless的技术和架构。课程主要从实践介绍,实践演示,分析详解三个大的章节来一步一步学习。 前言 进入实验室-动手实践 点击下面链接进入阿里云…

一首歌的时间,手把手搭建基于FC的网站

部署网站 说好不哭 在接触serverless架构之前,我们如果想实现上线一个Web网站,就要在开发前期经过操作很多冗杂但又必须的步骤,不少小白可谓是快速的从入门到退坑。 编写代码,部署应用,部署数据库,申请域…

PolarDB-X 源码解读:事务的一生

概述 本文将主要解读 PolarDB-X 中事务部分的相关代码,着重解读事务的一生在计算节点(CN)中的关键代码:从开始、执行、到最后提交这一整个生命周期。 在阅读本文前,强烈推荐先阅读与 PolarDB-X 事务系统相关的文章&a…

阿里云云原生一体化数仓 — 湖仓一体新能力解读

一、基于 MaxCompute 的湖仓一体架构更新 基于MaxCompute 云数据仓库的湖仓一体架构近期进行架构升级。了解 MaxCompute 的同学可能比较清楚,MaxCompute 有两层结构,需要先创建 Project ,在 Project 里面创建表、资源等。传统数据库&#xf…

DM8168 DVRRDK软件框架研究

DM8168 DVRRDK软件框架研究 2016-07-26 11:39 72人阅读 评论(0) 收藏 举报分类:DM8168(18) Netra(DM8168)处理器是个多核处理器,每个核之间相互独立却又相互关联,如何高效简洁地利用每个核完成一…

基于函数计算自定义运行时快速部署一个 Springboot 项目

什么是函数计算? 函数计算是事件驱动的全托管计算服务。使用函数计算,您无需采购与管理服务器等基础设施,只需编写并上传代码。函数计算为您准备好计算资源,弹性地可靠地运行任务,并提供日志查询、性能监控和报警等功…

FFmpeg源代码简单分析:avformat_open_input()

登录 | 注册 收藏成功 确定收藏失败,请重新收藏 确定标题 标题不能为空网址 标签 摘要 公开 取消收藏 查看所有私信查看所有通知 暂没有新通知返回通知列表 下一条 上一条 分享资讯传PPT/文档提问题写博客传资源创建项目创建代码片baidu_34732018编辑自我介绍&…

硬之城携手阿里云 Serverless 应用引擎(SAE)打造低代码平台

硬之城成立于 2015 年,是一家以电子元器件 BOM 整体供应为核心,为中小科技型硬件企业提供 BOM 标准化、BOM 报价、BOM 采购、BOM 交付和 SMT 一站式 PCBA 服务的电子产业数字供应链与智能制造平台。 电子产业互联网的需求是离散和复杂多变的&#xff0c…

阿里云 Serverless 异步任务处理系统在数据分析领域的应用

异步任务处理系统中的数据分析 数据处理、机器学习训练、数据统计分析是最为常见的一类离线任务。这类任务往往都是经过了一系列的预处理后,由上游统一发送到任务平台进行批量训练及分析。在处理语言方面,Python 由于其所提供的丰富的数据处理库&#x…

代码重构:面向单元测试

重构代码时,我们常常纠结于这样的问题: 需要进一步抽象吗?会不会导致过度设计?如果需要进一步抽象的话,如何进行抽象呢?有什么通用的步骤或者法则吗? 单元测试是我们常用的验证代码正确性的工具…

如何把 thinkphp5 的项目迁移到阿里云函数计算来应对流量洪峰?

1. 为什么要迁移到阿里云函数? 我的项目是一个节日礼品领取项目,过节的时候会有短时间的流量洪峰。平时访问量很低。之前的架构是购买的阿里云alb多台ecs云msyql云redis。最大的问题就是成本问题。平时流量低的时候ecs成本也无法缩减。 阿里云函数计算…

[总结]视音频编解码技术零基础学习方法

0. 生活中的视音频技术 平时我们打开电脑中自己存电影的目录的话,一般都会如下图所示,一大堆五花八门的电影。(其实专业的影视爱好者一概会把影视文件分门别类的,但我比较懒,一股脑把电影放在了一起) 因…

Helm Chart 多环境、多集群交付实践,透视资源拓扑和差异

Helm Charts[1] 如今已是一种非常流行的软件打包方式,在其应用市场中你可以找到接近一万款适用于云原生环境的软件。然后在如今的混合云多集群环境中,业务越来越依赖部署到不同的集群、不同的环境、同时指定不同的配置。再这样的环境下,单纯依…

跨全端 SDK 技术演进

关于为什么要选择跨平台的实现方式 Write Once, Run AnyWhere. 越来越多的业务需求都有统一的业务诉求,按照传统的方式,在开发、测试、维护上的成本都是乘以N的,体验也很难做到一致性,特别是复杂的业务,实…

SKG 渠道中台借助 SAE + 大禹打造云原生 DevOPS,提效 60%

项目背景 未来穿戴健康科技股份有限公司(SKG)是一家专注为个人与家庭提供智能可穿戴健康产品的高新技术企业,专业从事 SKG 品牌可穿戴健康产品和便携式健康产品的研发、设计、生产及销售。 随着市场需求的迅速变化,SKG 的 IT 系…

资源预测数字模型搭建思路分享

业务背景 资源预测是项目管理过程中的一个环节,即通过搭建合适的数据模型,对未来的项目人力资源投入情况进行有效预测,可以更加精准的完成项目资源规划并能及时发现问题进行相关调整。 难题和痛点 PM排期时没有有效数据支撑资源使用情况&a…