科技云报道:是时候全员FinOps了吗?

科技云报道原创。

在论坛上,国外某企业的真实案例引发了热议。一开始该企业只顾技术创新,积极上云,不顾成本。

直到有一天,高层介入喊停:“这个云不能再上了,成本已经远大于收益了”。该企业因为成本失控导致上云进度延迟两年,严重影响企业技术创新。

随着企业上云越来越普及,企业会发现用云成本也水涨船高,似乎与当初云计算诞生时宣称的“降低IT成本”理念背道而驰。

正因如此,云时代如何有效控制成本、质量和效率,成为企业用云管云的新课题。与之对应的云成本优化(FinOps)一词,也变得越来越流行。

在Google Trends上,“FinOps”关键字的搜索量在2019年到2023年的四年间增长了410倍。在国外,有18000多人把FinOps技能列在了自己的LinkedIn简历里。

CNCF发布的云原生2023年趋势预测报告中,10个热点趋势中有4个与FinOps相关,分别是FinOps、GreenOps、GitOps和削减成本。
在这里插入图片描述
今天就来聊聊,什么是FinOps,以及企业该如何实践FinOps?

FinOps:用最低成本创造最大价值

FinOps的历史并不悠久,公有云早期用户Adobe和Intuit在2012年首次描绘出了FinOps的雏形。FinOps本质上是一个理论框架,没有特定的技术栈,其方法论来自各个云厂商最佳实践的整合和抽象,从组织流程、识别浪费、优化措施等方面给出建议。

FinOps定义了一系列云财务管理规则和最佳实践,通过助力工程和财务团队、技术和业务团队彼此合作,进行数据驱动的成本决策,使组织能够获得最大收益。

FinOps基金会的这张图被引用了很多次,图里简单列出了FinOps理论的原则、目标和参与方等。
在这里插入图片描述
图片来源:FinOps基金会(中译版)

FinOps理论的最终目的是要最低的成本来创造最大的价值,并指出了成本优化的三个阶段:

●成本感知节点关注成本可视化、成本分摊等;

●成本优化阶段可聚焦目标制定,然后通过费率优化和用量优化来节省成本;

●运维阶段通过持续优化流程、规范和资源运营手段等实现持续成本优化。

同时,FinOps理论还有一些成熟度评估模型,来评估企业做得好不好。

这三个方面牵扯广、执行难,是一个需要拉动企业全员参与的系统工程,因此成功的前提是组织目标的高度对齐,全员经营意识的建立,组织坚定的执行力和不断提升的执行效率,实践的本身就是对组织效率的大练兵。

FinOps如何实施?

知名IT软件企业Flexera对云计算决策者进行年度调研已经持续12年,在3月8日发布的《Flexera 2023年云计算现状报告》中显示,82%的受访者表示,他们面临的最大挑战是管理云支出。

近一半(45%)受访者表示,由于经济不确定性,他们预计的云使用量和支出要比原计划中的略高或大幅度提高。

因此,云成本管理的关注度也许并不令人意外。如今的经济波动意味着,尽管云的使用和支出依然保持强劲增长,但企业对与之相关的费用越来越敏感。

那么,涉及到云成本优化时,到底该如何降本增效呢?

企业要做到降本增效,无非是两个途径:一是减量,减少浪费。国外有调查报告显示,现在至少有35%的云资源是被浪费掉的。二是减价,从计费模式切入优化。

确立了路径之后,企业具体该如何实施呢?有业内专业给出了以下步骤:

第一,全体动员。让该参与的这种角色或者组织或者团队加入进来。

第二,构建精确的IT资源全景地图。通过CMDB的方式构建一个企业全局的资源图谱,便于各个团队之间的沟通,或者在谈某个项目或某一个环境的降本增效时,确保大家的信息是对齐的。

第三,合理的标签。成本的分摊,是通过在IT资源全景地图上,基于系统的层次架构、技术架构、业务架构等来分摊,在这其中有一套标签体系是非常重要的,需要把它当成日常重要的工作来做。

第四,有效的IT资源利用率监控。很多时候,企业做IT资源的可观测性,大家比较关注系统可用性监控,或是性能监控,不太重视资源利用率的监控。如果连利用率监控都监控不准的话,那么就没法判断哪些资源是浪费的。

值得注意的是,面向FinOps的利用率监控和传统的运维监控不太一样。传统的运维监控比较关注平均利用率,而FinOps更加关注峰值。如果不按照峰值去算容量的话,那么降本增效之后,系统大概率就崩溃了。

除了减量减价的优化方式,还有一些被忽视的“省钱之道”也需要受到企业关注,例如:

选择适合自己的多云架构。并非所有的业务都适合上云,有的业务上了云之后可能更贵。同时,需关注多云的最大公约数,保证既能跨云,又不会被某一个云厂商锁定。

善用托管服务。比如有的企业数据中心上云后,将原有数据中心的机器托管给服务商,基于原有的机器去上云,可以节省一大笔成本。

知名互联网企业的FinOps实践

尽管FinOps在国内提及不多,但早在2020年12月,中国信通院就牵头成立FinOps产业推进方阵,推进规模化实践。

在那些率先拥抱云原生的互联网大厂内部,云成本优化的种子其实早就生根萌芽,形成了最佳实践的方法论。FinOps的出现,让大厂们的优化经验得到了更体系化的表达。

以字节跳动为例,他们内部已有相关实践,例如云账单分析,多云架构下对不同厂商定价策略的审视,推荐、广告、搜索的在离线任务混合部署等。目前,字节跳动在云成本优化上的最佳实践,将通过火山引擎对外提供服务。

阿里集团也搭建了自己的混合云资源管理平台(HCRM),推进自身成本数字化从无到有的建设,重新疏通集团内部的云资源计费和结算链路。

在腾讯内部,云业务成本中心承担着FinOps团队的职责,需要背上资源优化的考核指标,从平台侧、业务侧着手,甚至可以向上汇报,通过GM的层级去推动。

以腾讯为例,其内部构建了丰富的成本和利用率绩效看板,每天晾晒绩效,做得好或不好都会及时披露。

腾讯内部的成本看板主要包括两个维度:第一个是哪个帐号买了哪些资源,第二个是哪些业务使用了这些资源,包括一些分摊细节。

此外,还有面向平台和业务的利用率、成熟度等成熟度指标看板,主要了解资源大盘的整体情况,看投入使用部分用得好不好,同时盘活闲置资源、减少浪费。

平台侧提供的FinOps能力从以下几个角度助力业务和平台达成目标:

业务优化:在云控制台上提供了资源优化专项页面,基于业务的资源用量历史进行预测,构建业务资源画像,并给出资源优化建议。

规格建议:通过对比业务资源的申请量和使用量,可以告诉业务可以节省的成本数据,然后业务可以通过系统的控制台直接做优化。

弹性建议:比如某个工作日资源使用非常高,但周末基本没有流量,这时候周末就要缩容,这些业务也可以通过控制台自己优化。

平台优化:云平台在进行业务调度时,提供了众多基于资源画像的调度能力。

调度优化:提出了面向真实利用率的动态调度能力,管理员设定节点目标利用率,只要利用率还未达标,调度器就可以调度更多业务进来。

混部能力:引入差异化 SLA,允许高优在线业务和低优近离线业务混部,压榨每一分算力,同时离线服务可以在发生资源竞争时立即让渡资源需求,实现对在线业务零干扰。

据悉,腾讯内部的在线业务通过调度优化手段把资源利用率拉到48%,再加上离线混部,部分集群资源利用率可以达到65%以上。

整体来看,腾讯CPU规模达到了5000万核,而云成本优化总节省30亿元。

企业何时下场FinOps?

尽管互联网大厂们已做出表率,在FinOps实践中取得了可观的成绩,这是否意味着眼下所有的企业都应该进入到FinOps的实践中?

事实上,企业对上云的关注点是循序渐进的:第一阶段企业关注的更多是隐私、稳定,以及行业监管政策;第二阶段则是云与业务、研发、管理等体系的适配,关注效率的提升;第三阶段,才会来到成本优化的层次。

目前大多数国内企业还处在业务迁上云原生的时期,当企业面对业务压力时,成本管控的优先级自然会先“放一放”;当业务趋于稳定,应用的容器化、架构的现代化接近完成,也就是时候将关注点转到成本优化上来。

但现状如此,并不代表这就是理想的状态。

有业内专家直言,云成本优化应该从上云的第一天就开始规划,并且不断优化。

“很多企业在上云的过程中,只是把过去的经验简单粗暴的套用在新技术栈上。也有众多团队武断地认为成本优化和业务稳定性是相背离的,二者只能取其一”,该专家表示。

结语

FinOps是大势所趋,而且正处于快速发展的早期阶段。对于企业来说,早期的实践和转变总会带来阵痛,实践者需要做好这样的心理准备。而 FinOps未来如何帮助企业把云“用好”,还需要全行业的不懈努力和探索。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/11324.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java-day01

一:基础常识 软件:按照特定顺序的计算机数据与指令的集合。可分为系统软件(如操作系统)和应用软件(如QQ) 人机交互方式:图形化界面(GUI)与命令行(CLI&#…

性能优化 - 前端性能监控和性能指标计算方式

性能优化 - 前端性能监控和性能指标计算方式 前言一. 性能指标介绍1.1 单一指标介绍1.2 指标计算① Redirect(重定向耗时)② AppCache(应用程序缓存的DNS解析)③ DNS(DNS解析耗时)④ TCP(TCP连接耗时)⑤ TTFB(请求响应耗时)⑥ Trans(内容传输耗时)⑦ DOM(DOM解析耗时) 1.3 FP(f…

代码随想录算法训练营第二天| 977

977. 有序数组的平方y 思路,原数组是有序的,但是因为负数平方后可能变无序了,因此利用双指针遍历原数组,比较 nums[left]*nums[left]和nums[right]*nums[right]谁更大,然后对新数组赋值 class Solution {public int…

MFC第二十四天 使用GDI对象画笔和画刷来开发控件(分页控件选择态的算法分析、使用CToolTipCtrl开发动静态提示)

文章目录 GDI对象画笔和画刷来开发控件梯形边框的按钮控件CMainDlg.hCMainDlg.cppCLadderCtrl.hCLadderCtrl.cpp 矩形边框的三态按钮控件 CToolTipCtrl开发动静态提示CMainDlg.hCMainDlg.cppCLadderCtrl.hCLadderCtrl.cpp: 实现文件 矩形边框的三态按钮控件 CToolTipCtrl开发动…

欢乐暑假,华为儿童手表5系列为孩子位置安全保驾护航!

暑假带娃,就像爸妈的练兵场。幸好有 5 系列,离线定位、位置提醒、行为记录等安全守护功能面面俱到、样样精通,陪伴孩子度过悠长假期,也让爸妈长辈更安心更省力~ 暑期到了,小朋友们都想出去玩,但…

修改密码和再次确认密码的js和element-ui的使用

<template><div><!-- plan的插槽 --><plan title"修改密码"><!-- 插槽的名字 --><span slot"header">修改密码</span><el-form:model"ruleForm2"status-icon:rules"rules2"ref"rul…

【数据结构】实验七:字符串

实验七 字符串实验报告 一、实验目的与要求 1&#xff09;巩固对串的理解&#xff1b; 2&#xff09;掌握串的基本操作实现&#xff1b; 3&#xff09;掌握 BF 和 KMP 算法思想。 二、实验内容 1. 给定一个字符串ababcabcdabcde和一个子串abcd,查找字串是否在主串中出现。…

【数据结构】实验一:绪论

实验一 绪论 一、实验目的与要求 1&#xff09;熟悉C/C语言&#xff08;或其他编程语言&#xff09;的集成开发环境&#xff1b; 2&#xff09;通过本实验加深对算法时间复杂度的理解&#xff1b; 3&#xff09;结合具体的问题分析算法时间复杂度。 二、实验内容 设计程…

深入学习 redis - Stream、Geospatial、HyperLogLog、Bitmap、Bitfields 类型扩展

目录 前言 Stream geospatial HyperLogLog Bitmaps Bitfields 前言 redis 中最关键的五个数据类型 String、List、Hash、Set、Zset 应用最广泛&#xff0c;同时 redis 也推出了额外的 5 个数据类型&#xff0c;他们分别是针对特殊场景才进行的应用的. Ps&#xff1a;这几种…

odoo16-domain

odoo16-domain 参考:https://blog.csdn.net/u013250491/article/details/86699928 domain的使用注意以下几点: 是在py文件中使用还是在xml中使用,py文件是在后端使用可以利用orm, 而xml是在前端渲染,使用的是js,没有办法使用orm如果在xml中使用,domain的格式建议为[[]], 二维…

Paragon NTFS2023最新版Mac读写NTFS磁盘工具

Paragon NTFS for Mac是Mac平台上一款非常优秀的读写工具&#xff0c;可以在Mac OS X中完全读写、修改、访问NTFS硬盘、U盘等外接设备的文件。这款软件最大的亮点简书可以让我们读写 NTFS 分区&#xff0c;因为在Mac OS X 系统上&#xff0c;默认状态下我们只能读取NTFS 分区&a…

速成版-带您一天学完python自动化测试(selenium)

Selenium是一套web网站的程序自动化操作解决方案。我们通过编写自动化程序&#xff0c;使得自动完成浏览器界面的相关操作&#xff0c;除了能够自动化的完成相关操作&#xff0c;还能从web页面获取相关信息&#xff0c;然后通过程序进行分析处理&#xff0c;本质上就是提升从网…

25.5 matlab里面的10中优化方法介绍——牛顿法(matlab程序)

1.简述 1 牛顿法简介 牛顿迭代法&#xff08;Newton’s method&#xff09;又称为牛顿-拉夫逊&#xff08;拉弗森&#xff09;方法&#xff08;Newton-Raphson method&#xff09;&#xff0c;它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。 多数方程不存…

【spring】spring bean的生命周期

spring bean的生命周期 文章目录 spring bean的生命周期简介一、bean的创建阶段二、bean的初始化阶段三、bean的销毁阶段四、spring bean的生命周期总述 简介 本文测试并且介绍了spring中bean的生命周期&#xff0c;如果只想知道结果可以跳到最后一部分直接查看。 一、bean的…

图像滤波器

图像噪声 • 图像噪声是图像在获取或是传输过程中受到随机信号干扰&#xff0c;妨碍人们对图像理解及分析处理 的信号。 • 图像噪声的产生来自图像获取中的环境条件和传感元器件自身的质量&#xff0c;图像在传输过程中产 生图像噪声的主要因素是所用的传输信道受到了噪声…

【技术架构】技术架构的演进

文章目录 前言1.名词解释(常见概念)1.1 应用&#xff08;Application&#xff09; / 系统&#xff08;System&#xff09;1.2 模块&#xff08;Module&#xff09; / 组件&#xff08;Component&#xff09;1.3 分布式&#xff08;Distributed&#xff09;1.4 集群&#xff08;…

机器学习 day30(正则化参数λ对模型的影响)

λ对Jcv和Jtrain的影响 假设该模型为四阶多项式当λ很大时&#xff0c;在最小化J的过程中&#xff0c;w会很小且接近0&#xff0c;此时模型f(x)近似于一个常数&#xff0c;所以此时模型欠拟合&#xff0c;Jtrain和Jcv都很大当λ很小时&#xff0c;表示模型几乎没有正则化&…

5.2.tensorRT基础(2)-使用onnx解析器来读取onnx文件(源码编译)

目录 前言1. ONNX解析器2. libnvonnxparser.so3. 源代码编译4. 补充知识总结 前言 杜老师推出的 tensorRT从零起步高性能部署 课程&#xff0c;之前有看过一遍&#xff0c;但是没有做笔记&#xff0c;很多东西也忘了。这次重新撸一遍&#xff0c;顺便记记笔记。 本次课程学习 t…

Rocky Linux 8.4在Tesla P100服务器里的部署及显卡cudnn安装-极度精简

安装Rocky linux教程 https://developer.aliyun.com/article/1074889 注意事项 Tesla P100服务器&#xff0c;按Delete进入bios,设置Daul模式&#xff0c;第一选项选UEFI hard disk(用驱动盘选这个)&#xff0c;usb的就选UEFI usb 安装rocky linux时&#xff0c;这两项默认&…

css中flex后文本溢出的问题

原因&#xff1a; 为了给flex item提供一个合理的默认最小尺寸&#xff0c;flex将flex item的min-width 和 min-height属性设置为了auto flex item的默认设置为&#xff1a; min-width&#xff1a; auto 水平flex布局 min-height&#xff1a;auto 垂直flex布局 解决办法&…