Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,并于 2015 年正式发布。2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。
7月3日,阿里云Promtheus云托管实例正式开始免费公测。针对容器集群监控场景,提供了完整的采集、存储、监控、告警、图表展现的数据监控服务。通过与 Kubernetes 平台运维解耦合,使得 Prometheus 监控服务不受被监控平台的性能、稳定性、可靠性等诸多因素的影响。通过提供全托管服务,用户无需部署运维 Prometheus 监控实例,使整个容器平台 DevOps 流程更专业、更可靠、更安全。公测期间我们提供了4Core+16G+100G云盘的版本供客户免费试用!
Prometheus 适用场景
Prometheus 适用于记录任何纯数字取值的时间序列。 它适用于以机器为中心的监控以及高度动态的面向服务架构的监控。 在微服务的世界中,它对多维数据收集和查询的支持是一种特殊的优势。Prometheus 专为提高可靠性而设计,每个 Prometheus 服务器都是独立的,不依赖于网络存储或其他远程服务。
阿里云 Prometheus 服务独特优势
Prometheus 功能优势
- 灵活的数据模型:在 Prometheus 里,监控数据是由值、时间戳和标签表组成的,其中监控数据的源信息是完全记录在标签表里的;同时 Prometheus 支持在监控数据采集阶段对监控数据的标签表进行修改,这使其具备强大的扩展能力;
- 强大的查询能力:Prometheus 提供有数据查询语言 PromQL。从表现上来看,PromQL 提供了大量的数据计算函数,大部分情况下用户都可以直接通过 PromQL 从 Prometheus 里查询到需要的聚合数据;
- 健全的生态: Prometheus 能够直接对常见操作系统、中间件、数据库、硬件及编程语言进行监控;同时社区提供有 Java/Golang/Ruby 语言客户端 SDK,用户能够快速实现自定义监控项及监控逻辑;
- 良好的性能:在硬件资源满足的情况下,Prometheus 单实例在每秒采集 10w 条监控数据的情况下,在数据处理和查询方面依然有着不错的性能表现;
- 优秀的架构:采用推模型的监控系统,客户端需要负责在服务端上进行注册及监控数据推送;而在 Prometheus 采用的拉模型架构里,具体的数据拉取行为是完全由服务端来决定的。服务端是可以基于某种服务发现机制来自动发现监控对象,多个服务端之间能够通过集群机制来实现数据分片。推模型想要实现相同的功能,通常需要客户端进行配合,这在微服务架构里是比较困难的;
总结
欢迎大家进行公测免费试用,并提出宝贵反馈,我们会持续优化功能并丰富周边生态,打造PB级Kubernetes云原生监控解决方案。
- Prometheus 属于一站式监控告警平台,依赖少,功能齐全。
- Prometheus 支持对云或容器的监控,其他系统主要对主机监控。
- Prometheus 数据查询语句表现力更强大,内置更强大的统计函数。
- Prometheus 在数据存储扩展性以及持久性上支持各类时序数据库。
原文链接
本文为云栖社区原创内容,未经允许不得转载。