在上篇文章里,我提到了如何通过对价值流进行分析、拆解关键要素指标,并通过缩减处理时间PT、降低前置时间LT、提高完成&准确的百分比(C&A%),实现企业研发效能10倍速提升。大家点击回看这篇文章《以埃隆马斯克“第一性原理”实现企业研发效能10倍速提升》。
今天,我们继续聊一聊如何通过单点突破,轻松撬动企业DevOps转型。
端到端的DevOps包括4个阶段16个步骤
我们现在讲DevOps,都是指端到端的DevOps,也就是类似下图所指的从客户idea出发,经过协作开发、持续测试、持续部署,一直发布给客户使用的全过程。
这意味着我们需要覆盖企业如下价值流持续交付流程:
注:这种拆解来自 规模化敏捷SAFe DevOps专业人士认证(SDP)
当然这16个维度,每一个都可以再进行细化拆解,譬如【开发】可以拆解成 设计—>编码—>自测—>评审—>提交 等细化阶段。我们先从宏观来看,不看那么细,这16个维度都可以定义若干个细化问题,分别进行评估,那就可以生成一个雷达图。
注:此健康雷达 来自 规模化敏捷SAFe DevOps专业人士认证(SDP)
如果每个维度都可以按照1-5分来评估健康度,假设得到这样的一张雷达图。
请问你接下来会如何计划进行改进?
这里不要着急往下看!!!关上手机屏幕,问下自己,努力思考2分钟!
或许,你会得出这样的答案:
1、针对那些评分低的维度,针对性提升;
2、对于少于2分的维度,全部要提升到4分以上。
找到“阈值”,单点突破
不知道诸位有没有参与过一个组织、一个团队的变革或转型,如果你这样均等发力、各点突破,那么你的变革或者转型可能会面临灭顶之灾!毕竟企业的资源都是有限的,均等发力就相当于没有发力,可能哪个层面都击不破、打不穿,始终停留在改进无进展的状况。
格鲁夫有一本书,叫《只有偏执狂才能生存》,书中提出了一个战略转折点的概念。
什么叫战略转折点呢?在数学上,当曲线斜率变化比率开始改变符号时,就意味着遇到拐点,而拐点也是转折点,如下图所示。
在这个点,如果拐上去,就是上升;如果拐下来,就是下降。
所以针对这个拐点而言,必须“击穿”,才能上升,而“击穿”的概念其实就是突破“阈值”。
举个栗子:比如我们想要让水沸腾,就必须要达到100摄氏度,即便是只差1度,水也不会沸腾。这里的100摄氏度就是“阈值”。突破,就可以得到开水,否则就只能算是温水。
这也就是说击穿了就是1,击不穿就是0。
很多人经常说,“我很努力,为什么就不能成功?”没错,你是很努力,但是因为你还没有击破“阈值”,没有全力以赴地把事情做到极致,所以你不能成功。
我们再来回顾一下二战时的马奇诺防线。
整个防线共构筑各种用途的永备工事约5800个,密度达到每公里正面15个。最坚固的钢筋混凝土工事的顶盖和墙壁厚度达3.5米,装甲塔堡的装甲厚度达300毫米,均能抗两发420毫米臼炮炮弹的直接命中;防线内的防坦克障碍物主要有防坦克壕、崖壁、断崖及金属和混凝土桩砦,并用地雷场加强;防步兵障碍物一般为金属桩或木桩铁丝网,有的地段还设置了通电铁丝网。这就是二战历史中最出名的法国马奇诺防线,为修建这一要塞,法国投入了大量的资金,但是在二战中却没有起到任何作用,很快就被德国人突破了。
为什么马奇诺防线没有起到作用呢?原因就在于马奇诺防线有一个防御漏洞,这个漏洞就是阿登森林,这是法国的战略要地,自古以来都是欧洲的兵家必争之地,但是法国的马奇诺防线的坚固却没有涉及到这一地区。原因是什么呢?当时的法国军部认为这一地区军队是不可能穿过的,于是不仅没有在这一地区修建防线,甚至在这一地区没有什么防御,于是这一地区成为了德军的突破口。
作为“单点突破,击破阈值”的经典应用,德军很快就灭亡了法国。
所以,对于任何组织变革或者组织转型而言,必须将足够的资源(力出一孔)投入到一个单点上,将“阈值”一举击穿,从而带动其他要素,形成正向循环。
众所周知,支持京东成功的最强大的东西主要有两点:一点是商品质量,另一种就是服务到家的物流体系。我们也知道,京东的模仿者有很多,但成功的似乎只有一个京东。
很多人无缘无故的就死在自建物流上。要知道自从京东自建物流取得显著的行业服务优势之后,自建物流,一直以来是很多电子商务公司的重点投资项目。而最终的结果就是这些人都死在了这一条路上。自建物流其实最大的问题,马云已经提到过,京东售出的商品,远远不及阿里巴巴,但是京东的员工数却远远超过阿里巴巴,这里最大的原因就是因为京东有太多的送货员。
这些送货员带来了巨大的人工成本和管理成本。对于那些刚刚成立没有几年的公司来说,这么大的资产压力和管理压力,足以压垮年轻公司的生产模式和管理团队。而且自建物流需要不断的有资金进入,对于那些盈利能力弱的电商公司,一旦融不到资金,那么等待他的就只有死亡。
那为什么京东能成功呢?其实答案也很简单,首先京东的物流体系不是一年两年建立起来的,而是京东集团十几年的结果,这些管理问题和融资问题是京东一步步克服过来的,所以才会有今天的成功。
正是在物流领域的“单点突破”,形成了京东的核心竞争力,不仅让京东在2003年的非典之后,快速发展;在今年这次新肺炎疫情下,能够及时大面积全国送货的电商又是非京东莫属;而且还在疫情最严重的武汉地区,将储备已久的无人车、无人机送货方式,送上了战场,实现了无接触送货新模式,为避免疫情传播做出了巨大贡献。
再回到DevOps转型上来,前面我们已经拆解到了16个子维度,我们同样需要在这16个子维度选择一个关键实践作为单点,进行重点突破。
京东:找到阻挡研发效能的突破点
我们再来看京东在敏捷DevOps转型过程中,是如何通过突破“部署”这个单点,击破阈值,带动整体转型的。
京东2013 年之前是”HumanOps“,通过脚本手工上线,无法做到自动化;原有的部署方式比较偏向于传统,从申请虚机、准备环境再到部署,在准备阶段占用了大部分时间,尤其是在业务扩张太快,资源却十分紧张的情况下,无形中拉长了全公司研发部署上线的战线。
2014 年到 2016 年是 Jone(京东持续交付平台) 时期,在 Jone1.0 交付采用Rsysnc的方式进行,但上线过程经常会线上排队。这个点还是没打透!
于是,在2016 年启动了2.0的迭代,Jone采用了ansible作为发布的工具,重点期望做到:
1、扩展架构,解决Deploy系统在上线日排队情况的发生,提升发布效率。
2、将Jone和deploy合二为一,消除用户上线跳转的时间。
3、简化并规范部署流程,优化部署方式。
经过大家的不懈努力,新J-ONE提供了以下新功能特性:
编译、上线发布、部署在一个系统搞定
界面更简洁、操作更方便
线上环境的规范验证,降低COE发生概率
灵活的实例设置,多层分级化配置
多应用批量DB授权,邮件通知授权结果
非0,1级应用可自行选择测试类型
安全测试接入代码漏洞扫描,上线更放心、更安全
上线零排队
上线不再区分类型(紧急和正常)
重启、停止、启动无需预约,即时操作
秒级回滚
免开通拥有线上“堡垒机”功能
如今的J-one平台不仅提供公有云资源的申请入口,还在流程上简化了申请资源的过程。另外,容器能在部署时快速扩容,也能按需缩容,实现资源利用率最大化。
再结合业界最先进的理念和技术潮流,J-one提供镜像部署的功能。先构建出一个可以部署的镜像,然后再发布到生产环境中,在镜像部署中线下测试验证,保证测试环境和生产环境的环境一致性,同时日志和监控自动同步对接,省去研发不少麻烦。
如果说原有传统部署平均时效是3个小时,那么现在通过镜像部署,可以分分钟之内搞定部署任务。
小结:自从将“部署”这个单点突破之后,京东的研发效能明显提升,反过来又促进了对其他实践的应用,譬如敏捷迭代开发、新业务功能快速闭环验证、创新业务高效试错、代码质量扫描、安全左移等等。
总结
本篇文章,我们讲到京东案例里重点突破的是部署环节。因为每家公司的业务不同、基础设施能力不一样,在实施DevOps转型的时候,需要因地制宜地选择适合的一个单点,可以是敏捷迭代,也可能就是可视化看板,也可能是持续集成,也可能是快速业务探索,无论如何,只要先把某个单点击破,就可以引发整体转型。
注:本文借鉴引用了李善友老师的《第二曲线创新》理念,感谢善友老师及混沌大学曾经提供的15天“摆渡人”学习历程。