阿里云 APM 解决方案地图

摘要: PM是近5年来伴随着云技术、微服务架构发展起来的一个新兴监控领域。在国内外,无论是云厂商(如AWS, Azure,等)还是独立的公司(Dynatrace, Appdynamics,等),都有着非常优秀的APM产品。

APM 概述

APM 全称是 Application Performance Management, 是指对应用程序的性能和可用性的监控管理。狭义上的APM单指应用程序的监控,如应用的各接口性能和错误监控,分布式调用链路跟踪,以及其他各类用于诊断(内存,线程等)的监控信息,等;广义上的APM, 除了应用层的监控意外,还包括手机App端监控,页面端监控,容器、服务器监控,以及其他平台组件如中间件容器,数据库等层面的监控。

APM是近5年来伴随着云技术、微服务架构发展起来的一个新兴监控领域。在国内外,无论是云厂商(如AWS, Azure,等)还是独立的公司(Dynatrace, Appdynamics,等),都有着非常优秀的APM产品。

阿里云作为国内最大,世界排名前三的云厂商,其在APM领域也有很多优秀的产品提供,整个产品家族也比较全面。本文就以APM领域为例,给大家介绍一下阿里云在该领域的各个产品。

云时代应用架构简介

云时代典型的应用,如运行在阿里云的应用,其架构如下图所示。


其中:

  • 应用一般对外提供两种客户端访问模式:移动端App访问,或基于浏览器的页面访问。客户端的监控在APM领域又被成为UEM(User Experience Management),即用户体验管理。
  • 除了客户端访问意外,用户一般还会部署相应的业务探针,通过API来直接诶测试服务性能或进行健康检测。
  • 对客户端直接提供服务的为后端应用服务程序。基于微服务的应用一般多个应用,分别运行在多个节点之上,应用和应用之间会有比较复杂的调用依赖关系。
  • 后端应用一般运行在容器里,或者直接运行在(虚拟)操作系统之上,取决于用户是否进一步使用容器技术来优化开发和运维。
  • 应用还会直接依赖各类的PaaS/SaaS云服务,如OSS,OTS, MQ, RDS等,对应用提供响应平台服务,简化应用的运维成本。

阿里云上APM领域各个产品最终目标是为了对以上各个组件进行有效监控。以下介绍对于各个组件,阿里云提供的相应的APM产品。

阿里云的APM解决方案地图

基于今天的云上的应用架构,阿里云的APM解决方案地图如下所示。


其中:

  • PC/移动端页面监控:该部分组件由业务实时监控的前端监控子产品来完成监控。前端监控原理是通过页面的JS埋点,从页面的调用次数和响应时间,API的调用时间和错误返回,以及页面的JS错误监控三个方面来监控页面的健康状态。不仅如此,前端监控亦支持按维度来监控页面状态,包括地域维度,网络运营商维度,浏览器种类和版本维度,等。
  • 移动端APP监控:由移动数据分析来完成监控。移动数据分析为开发者提供一站式数据化运营服务,包括通用的多维度用户行为分析、数据开放并支持自定义分析、数据无缝对接其他数据应用产品,可帮助移动开发者实现基于大数据技术的精细化运营、提升产品质量和体验、增强用户黏性。
  • 关于探针/压测部分:一般分为两个部分。

    • 探针:通过外部的探针来拨测页面的监控状态。该部分可由云监控的站点监控来实现。站点监控定位于互联网网络探测的监控产品,用于通过遍布全国的互联网终端节点,发送模拟真实用户访问的探测请求,监控全国各省市运营商网络终端用户到业务服务站点的访问情况。
    • 压测:通过模拟外部真实网络环境下的用户访问,来对线上系统进行压力测试。该部分功能可用性能测试来实现。该产品脱胎于基于服务阿里全生态多达4年以上的单链路/全链路压测平台,通过在边缘计算节点部署压测流量来模拟用户真实流量。
  • 应用服务程序:由业务实时监控的应用监控来完成监控。应用监控前身是阿里的分布式跟踪系统-鹰眼。其原理是通过应用程序的探针埋点,对应用程序进行接口性能,链路追踪,以及错误诊断三个方面监控。其中,应用监控通过探针,亦可捕获容器和操作系统的性能和状态,因此也可用于容器和操作系统的性能监控。
  • 操作系统:主要由云监控的主机监控来实现。云监控主机监控服务通过在服务器上安装插件,为用户提供服务器的系统监控服务。用户可以使用主机监控服务进行服务器资源使用情况的查询和排查故障时的监控数据查询。服务器无论是阿里云服务器 ECS,还是其他云厂商的服务器或物理机,都可以使用主机监控服务。
  • 其他阿里云PaaS、SaaS服务:包括RDS, OSS, MQ, 缓存,等。该类产品本身都会自带监控,但是用户亦可从业务实时监控和云监控两个产品作为监控入口进行监控。两个产品的侧重点各有不同,其中:

    • 业务实时监控主要从应用侧的客户端埋点着手来获取外部服务数据,其获取的性能数据为应用测真实状态,服务调用时间不仅包含外部服务的服务端响应时间,还包括中间的网络延迟等。
    • 云监控主要从阿里云服务侧的性能数据打通来获取外部服务数据,其获取的性能数据为外部服务的服务端响应时间,其中并不包括中间的网络延时,虽不能真实反应应用侧的状态,但可用于有效排除服务端的潜在问题。

关于业务监控

关于APM领域的一些场景,还有一件事情,就是业务层面的监控,简称业务监控。为什么需要业务监控?

  1. 很多时候局部应用故障并不能直接反应对业务的影响,如某个重要级别的某些接口宕机,由于应用的一些熔断或者缓存机制,可能并不会对业务收入(交易,下单,等)造成直接大的影响。因此,IT系统监控和故障定级往往并不依赖于单个系统故障,而需要以业务指标为准。
  2. 业务层面的监控更能辅助IT系统反过来进行优化业务。如针对某个IT电商的运行分析,通过业务监控分析卖家的地域、运营商分布,以及卖家的动态库存,畅销类目实时统计,更能反过来帮助业务进行实时数据决策。

针对以上,阿里云的几款APM产品其实都不同程度支持业务层面的监控。其中:

  • 业务实时监控的自定义监控功能可通过用户的应用日志数据,页面数据推送,甚至消息队列等不同的数据源,通过实时计算预聚合将不同维度的数据存放在时序数据库中,并为用户提供交互大盘动态可视化和报警策略,已知的用户场景包括航旅,电商,车联网的各类业务。
  • 云监控的日志监控功能可通过对用户的日志服务中的日志内容做统计,为用户绘制出各类业务大盘。
  • 移动数据分析的业务数据分析可根据移动端的上报日志统计移动端业务使用情况。

阿里云APM解决方案地图

以下表格对阿里云APM解决方案进行总结。


原文链接

本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521527.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云栖大会 | 释放计算弹性,阿里云做了很多

戳蓝字“CSDN云计算”关注我们哦!时至今日,已经没有人怀疑云计算是最主流的企业IT基础设施之一。围绕云计算最基础最核心的话题计算力,探讨在新硬件、新技术和新场景带来的机遇和挑战下,计算产品如何演进,使其价格更加…

支持Dubbo生态发展,阿里巴巴启动新的开源项目 Nacos

摘要: 上周六的Aliware技术行上海站Dubbo开发者沙龙上,阿里巴巴高级技术专家郭平(坤宇)宣布了阿里巴巴的一个新开源计划,阿里巴巴计划在7月份开启一个名叫Nacos的新开源项目, 在活动演讲中,坤宇介绍了这个开源项目的初衷&#xff…

地磅称重软件源码_电脑设备器件+塔吊主吊臂+撇渣管、丝杆+地磅称重传感器+极柱触头盒弯板+批式循环谷物干燥机+升降机标准节...

电脑设备器件 [1批]位置:广东省深圳市宝安区是否含税:不含税标的规格:批出险时间:2020-07-30 13:48:00受损原因:水湿深圳市益华市场受损程度:80%塔吊主吊臂 [1节]位置:广东省广州市番禺区是否含…

! [rejected]

git push -u origin master解决 git push -u -f origin master

laravel8找不到控制器_找一个“靠谱儿”的烟雾探测器方案,难不难?

安全,应该说是人们生活中最“硬核”的刚需。很多安全设备平日里几乎是“透明”的,大家感觉不到它们的存在,而一旦遇到事儿,它们却必须能够派上用场,颇有些“养兵千日,用兵一时”的味道。因此,如…

世界杯迄今最火的一场比赛 一文看懂世界杯背后的阿里云黑科技

摘要: 世界杯“法阿之战”中帕瓦尔世界波以及姆巴佩梅开二度一定让你印象深刻,而梅西的饮恨离开也让不少球迷碎了心。但你知道,比赛当天的阿里云藏着什么秘密吗?世界杯“法阿之战”中帕瓦尔世界波以及姆巴佩梅开二度一定让你印象深…

你在北边的西二旗被水淹没,我在东边的八通线不知所措

戳蓝字“CSDN云计算”关注我们哦!作者 | 朱小五and王小九责编 | 刘丹当代大城市年轻人,生活扇来的第一个巴掌就是——租房。而大部分年轻人在租房的第一年,要么付了大公司的服务费,要么交了黑中介的智商税。在积累了一定被坑的经验…

【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics

摘要: 近日,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics,Data Lake Analytics,帮助更多不具备分析能力的存储服务,赋予其分析的能力。近日,阿里云重磅推出Serverless数据分析引擎-Data Lake…

jq获取当前完整html,jquery怎样获取html的内容?

jquery怎样获取html的内容?下面本篇文章给大家介绍一下使用jquery获取html内容的方法。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。jquery获取html元素内容的方法方法1:使用html()方法html()可以设置或返回所…

内部矩阵维度必须一致simulink_深度学习/目标检测之numpy——向量和矩阵乘法相关...

numpy中表示向量和矩阵乘法的有四种"*"、outer、dot、multiply。1、关于 "*" 的用法"*" 也为对于元素的乘积,但是 "*" 作为乘法运算时,必须满足 numpy 的 broadcasting(广播) 的原则 ,当两个矩阵相乘…

阿里云企业IPv6部署方案

摘要: 一、什么是IPv6。 IP version 6 (IPv6)是IP协议(Internet Protocol)的最新版本,设计作为IP version 4 (IPv4) [RFC791]的继任版本。一、什么是IPv6。IP version 6 (IPv6)是IP协议(Internet Protocol)…

区块链应用@纸贵科技:基于阿里云容器服务护航内容版权

摘要: 区块链如何护航内容版权?区块链已经成为业界内外家喻户晓的一门技术,很多企业已经开始尝试将区块链应用于不同场景。目前,开源的Hyperledger Fabric区块链技术与容器技术的应用组合已成为一种经典的区块链方案,纸…

xbox one s驱动_续航800公里 体验6座SUV理想ONE

在新能源汽车产品日益完善的今天,越来越多的优质车型走进了我们的生活。续航能力一直是消费者们最关注的一个问题,为了缓解里程焦虑问题,高续航产品逐渐成为纯电动汽车的新消费主力。今天我们要聊的,就是一款新能源汽车大军中的生…

html添加子节点方法,HTML DOM appendChild() 方法

HTML DOM appendChild() 方法appendChild()方法的作用是:在指定父节点的子节点列表的末尾添加一个节点。如果给定的子节点是文档中现有节点的引用,appendChild()将它从当前位置移动到新位置(参见下面的“更多示例”)。使用insertBefore()方法可在指定的现…

靓仔落泪,性能问题定位难倒我了

戳蓝字“CSDN云计算”关注我们哦!作者 | popsuper1982责编 | 刘丹今天我的主题是在微服务场景下的一个性能问题的定位优化,那么今天会讲一个我们其实出现的一个真实的一个场景,然后其实还是花了蛮长时间,然后把这个东西才定位到一…

LC3视角:Kubernetes下日志采集、存储与处理技术实践

摘要: 在Kubernetes服务化、日志处理实时化以及日志集中式存储趋势下,Kubernetes日志处理上也遇到的新挑战,包括:容器动态采集、大流量性能瓶颈、日志路由管理等问题。本文介绍了“Logtail 日志服务 生态”架构,介绍…

RabbitMQ 添加用户(入门试炼_第2篇)

文章目录一、登录二、添加用户和角色2.1. 用户角色介绍2.2. 用户和角色分配2.3. 创建Virtual Hosts一、登录 二、添加用户和角色 2.1. 用户角色介绍 1、超级管理员(administrator) 可登陆管理控制台,可查看所有的信息,并且可以对用户,策略(…

如何查看一个组件的 classid是多少_如何查看iphone电池使用次数?6s电池容量多少需要更换?...

手机用久了之后,总感觉电池特别不耐用,特别是到了冬天,我相信很多人都会有种感觉,就是手机电池也越来越不耐用,待机时间变短,一天甚至需要三充。手机的电池确实和温度有关,但在使用一段时间后&a…

SLB访问日志分析:基于客户端来源和HTTP状态码的实践

摘要: 阿里云负载均衡SLB可以对多台云服务器(ECS)进行流量分发,支持TCP的四层负载均衡和基于HTTP/HTTPS的七层负载均衡。使用SLB可以降低单台ECS异常时对业务的冲击,提升系统可用性。同时,结合弹性伸缩服务…