作者:来自 Elastic Observability Team
监控和可观察性经常互换使用,但它们并不完全相同。监控是可观察性的重要组成部分,但可观察性远远超出了传统监控实践的范围。
关键区别:监控从各个组件收集数据 —— 何时和什么(when and what);可观察性提供对分布式系统整体行为的洞察 —— 为什么和如何(why and how)。
云格局正以惊人的速度从混合云计算架构发展到无服务器技术和分布式环境。因此,虽然监控对于较小的环境仍然有效(本质上数据和应用程序蔓延较少),但使用云原生技术的大型组织需要发展到更复杂的工具。这就是可观察性的作用所在。(告别 FOMO,继续阅读以了解事实。)
什么是监控?
监控是收集、提取和分析应用程序、基础设施和/或云遥测数据以评估系统运行状况的过程。监控依赖于指标,例如 CPU 或内存使用率和网络流量、日志和跟踪。这些数据使 IT 团队能够实时跟踪其基础设施和应用程序的性能和可用性。监控工具和平台可以提供仪表板和警报,并具有报告功能,以帮助 IT 团队监控组件、识别预测问题并解决给定环境中出现的问题。
但是,监控工具传统上是孤立的,因此并不总是适合现代云架构和更大的环境。
什么是可观察性?
可观察性是一套实践和工具,使 IT 用户能够通过其生成的遥测和运营数据获得整个环境的整体视图。在分布式系统中,可观察性使团队能够关联数据(日志、指标、跟踪和分析),以提供统一的可见性。反过来,企业可以获得可操作的见解,以增强服务性能和客户体验。可观察性工具提供可自定义的仪表板、自动化功能、分析和警报,帮助团队更快、更有效地执行根本原因分析。
换句话说,可观察性是一种不断发展的工具,用于提高现代 IT 运营及其管理的服务的性能和弹性。毕竟,更好的弹性意味着更好的生产力 —— 这对投资回报率来说怎么样?
为了更好地理解现代可观察性及其价值,让我们来看看它与监控的三大不同之处。
1. 洞察深度
检测异常和低效是一回事,理解它们又是另一回事。
监控检测:监控依靠预定义的指标和日志集来跟踪错误和使用模式 —— 已知的已知(known knowns)。按照这种衡量标准,IT 团队只能发现他们已经预料到的问题。简而言之,监控是一个必要的 IT 流程,使团队能够确保一切正常运转。然而,尽管它是一种不可或缺的检测工具,但监控本身并不提供检测到的异常的背景信息。
可观察性理解:可观察性通过收集各种数据源、存储数据并将其全部统一起来进行映射和分析,提供了统一的可见性。这种深入的关联能力使团队能够更好地了解他们的整体系统。他们可以查看和分析系统行为、性能和交互。改进的可见性和历史性能数据还允许采用更具探索性的运营管理方法来发现未知的未知数(unknown unknows)。IT 团队获得的深度洞察还使他们能够采取主动的方式来提高绩效。
2. 灵活性和适应性
云计算和无服务器、容器化应用程序意味着开发灵活性的提高。因此,你的监控解决方案需要跟上。
监控可能很死板:由于监控依赖于 IT 团队确定的数据集,因此它无法 “看到” 未为其编程的内容。换句话说,监控的范围有限:它跟踪已知问题,但单独使用无法满足通常依赖 Kubernetes 和微服务的动态云原生或混合环境的需求。
可观察性是灵活的:可观察性能够映射云环境、本地软件和第三方应用程序之间的交互,因此本质上具有适应性和灵活性。它是一种专门为满足现代 IT 基础设施的需求而设计的实践。通过自动化和 AIOps 功能,可观察性也可以像生态系统一样扩展,使团队能够更有效地扩展其基础设施。
3. 根本原因分析
无论使用何种工具和实践,技术生态系统中都会出现问题 — 有些事情不会改变。当这些问题出现时,IT 团队可以通过两种方式做出响应:
- 修补问题 — 症状
- 深入挖掘以解决问题 — 问题
正确的根本原因分析可确保更快的响应和恢复时间。
监控是被动的:监控警报配置为在异常和问题发生时通知团队。虽然监控告诉 IT 专家 “是什么”,但它本身并不能解释 “为什么”。事实上,在分布式架构中,跨数据流的可见性是一个常见的挑战。孤立的监控工具存在局限性:工程师花费额外的资源手动执行根本原因分析,同时采取被动的系统管理方法。结果呢?检测、响应和解决时间变慢,这可能意味着严重的中断。
可观察性是主动的:可观察性通过历史数据提供更丰富的背景和对内部系统操作的可见性,促进更深入的根本原因分析。通过关联不同的数据源并跟踪系统中请求或事件的流动,工程师可以全面了解其环境,从而更准确地找出问题的根本原因。这种分析可以在停机期间实时进行,也可以在停机后进行,以便主动了解问题所在。最终,更好的根本原因分析能力意味着整体运营效率更高。
当今对现代可观察性的需求
从孤立的日志监控工具转向统一的数据平台和可观察性是对你组织的未来以及你作为企业开发人员、SRE 或 IT 运营专业人员的一项投资。在当今的云原生世界中,从传统监控工具向现代可观察性的转变是必需的。它为团队做好了通过 AIOps 和 GAI 增强的未来运营的准备。现代可观察性使组织走上了提高效率、更具弹性的应用程序和卓越客户体验的道路。
原文:3 reasons why monitoring is different from observability | Elastic Blog