五个问题,三大策略,手把手教你定制App性能监控方案

作者:友盟+U-APM团队

Why? 为什么要做应用性能监控?

首先,我们要知道应用性能监控具体指什么?以及目的:

监控是一套完整的“监视+报警”的系统。对于像我们这样的App开发者来说,应用性能监控是衡量App的第一道关卡,如果应用的质量不好,会给用户带来最直接的体验伤害。App上线后,开发者是无法7*24实时获取到用户使用及体验情况的,这时就需要一套优质的监控工具。

那么,我们到底需要监控哪些指标?

安卓和iOS的客户端监控指标就有很多不同,比如说安卓需要的是Java、Native、ANR错误等等,iOS需要的是Objective-C、Swift、C++层的错误等等。

在定义错误指标上,最基础的是不同类型的错误数,如果考虑到错误数与整体应用使用量的对比,可以考虑用比值的方式,比如可以定义错误率:

1.png

总结下来,我们可以统计不同类型错误在某一个时间范围内的错误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,我们还可以用不同的维度定义监控,比如版本号。

如果要关注错误的发生次数,及错误的影响用户数,则可以在错误数的基础上,根据用户排重计算得来影响用户数。

如何定义独立用户呢?我们可以考虑用设备ID辨别,比如imei、idfa、AndroidID等等,如果这些信息很难获取,也可以使用业务上的用户ID,比如登录账号,会员名等。除此之外,使用第三方SDK提供的设备识别定义ID也是个不错的选择。在使用这类ID排重后,就可以得到错误的影响用户数。

如果我们已知错误的影响用户数,但无法确定它的影响范围占比,则可以看以下这个指标:

2.png

总结下来,我们可以统计不同类型错误在某一个时间范围内的错误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,我们还可以用不同的维度定义监控,比如版本号。

How? 如何灵活地制定属于你的告警计划?

我们先请您做个小测验来判断下您的监控告警类型(一共5道题,仅需1.5分钟)

规则如下:A选项记5分,B选项记10分,C选项记15分,D选项记20分

Q1: 请问您的产品目前处于什么阶段?

A: 已经上线,处于比较稳定的状态,对监控告警的需求较低

B: 还在开发阶段,需要捕捉一些测试中的错误,对监控告警的需求一般

C: 刚刚上线,整体来说比较稳定,对监控告警的需求较高

D: 刚刚上线,效果未知,非常需要7*24小时实时关注,对监控告警的需求非常高

Q2: 请问您在您的公司/部门的职务是什么?

A:领导者,关注应用的质量做得如何

B:运维人员,负责监控整体应用性能的线上问题监督官

C:测试人员,负责应用发版前的质量把控

D:安卓/iOS端的客户端开发人员

Q3: 请问您所属团队有多少人在关注应用性能质量,并参与其中呢?

A: 1,光杆司令干活靠自己

B:2~5人,小型开发团队

C:6~25人,相互打配合,一起优化应用质量

D:25+,超大型的开发团队,不谦虚的说算是行业龙头

Q4: 您日常关注哪些应用性能监控指标:

A: 最基本的错误数就可以

B:考虑到客户端影响的用户使用范围,在上述的基础上需要监控影响的用户数以及占比

C:在上述的错误数以及影响用户的基础上,还要考虑各个版本的分布

D:需要制定组合型的告警规则:比如:错误数>100且错误率>1%或者影响用户数比1天前多1%时触发告警,也要考虑版本分布

Q5: 请问您对告警的通知方式有精细化设置的要求么?

A:没什么要求,只要能收到就行

B:在时间上有一些要求,半夜不想被打扰

C:在通道上有一些要求,需要邮件或者特定的办公聊天软件

D:对时间和触达通道都有要求

What?那么如何设置告警计划呢?

以上的分加总,请先判定下您的测验总分(A选项记5分,B选项记10分,C选项记15分,D选项记20分),来看您的App在下面哪个监控告警需求等级范围内:(数据在哪个范围?还是监控告警在哪个层级?)

热血青铜(25~50分):您属于监控告警的初级阶段使用者,您在日常工作中无需非常精细地查看各种错误的发生状态。可能是由于您的应用还在初始阶段,或者您位高权重,无需亲自修复告警信息,只需要整体监控就好。请查看下文中的方案1

英勇黄金(50~75分):您属于监控告警的中级阶段使用者,您或者您的团队已经有了监控告警的意识,并且在日常工作中会关注到实时的应用质量情况。您已经可以用一定精细化的规则设置告警了,请跳转至方案2

荣耀王者(75~100分):您已经属于监控告警的高能玩家了,只需要一点点引导,就可以成为监控告警界的“超级王牌”了

根据上述测验的分值高低,您可以判别您所需要的告警设置的难易,整体分为下面几个方案,实现程度由易到难。如果您想学习最全面的告警设置功能,请直接跳转到方案3哦

方案1:简易型--整体应用质量监控

作为最初级的告警设置,您只需要考虑两个问题:

a. 我应该在什么情况下收到告警?

b.我如何能收到应用告警消息呢?

解决第一个问题,您可以考虑最简单的状态,只要有错误我就要收到预警,那么只要设置错误数>0的条件就可以解决。如果您觉得这样被打扰的非常多,可以根据自身的应用情况,设置错误数>xx个这类的告警规则

3.png

解决第二个问题,您需要有一个可以接收消息的媒介,最简单的就是邮箱:

4.png

一个简单的监控告警计划就这样设置好了

方案2:进阶型--精细化应用质量监控

您已经可以对单一应用设置不同的告警消息了,可以按照监控的指标类型或者版本进行区分。比如说,我们对新上线的版本要求是,影响用户数>10则触发告警,对老版本的要求是整体错误率相比于上周增幅不超过5%就可以,那么我们就可以按照如下的方式设置:

a.新版本的告警规则:

5.png

b.老版本的告警规则:

6.png

在这个方案中,我们分别应用了阈值型和对比型的告警触发条件,这两种规则的定义如下;

阈值型规则

您可以选择一种指标(错误数、错误率、影响用户数、影响用户占比),并且选择「大于」某值或者某百分比

对比型规则

您可以选择一种指标(错误数、错误率、影响用户数、影响用户占比),并且选择「比」历史的时间段,增加多少比例,计算方式为:(过去1小时数值-历史1小时数值)/ 历史1小时数值,大于或等于所选值即发送告警

方案3: 王者型--组合式指标监控

您已经可以非常熟练的设置监控告警了,那么通过下面的hints,相信您可以根据您的日常工作需求,灵活制定属于您的告警计划

a. 灵活设置告警生效时间:

7.png

您可以添加告警生效的时间段,比如每周一至周五的9点至19点,周末的一12点至20点,灵活设置您的工作时间,不被无效信息干扰

b.重点错误类型/单条错误告警

您可以选择需要您重点关注的错误类型
8.png

或者直接针对某一条修复中的错误进行持续关注告警

9.png

c. 组合形式的告警触发条件

10.png

您可以通过多种指标以及阈值型或者对比型的规则,以交集/并集的组合方式,灵活设置您想要的告警触发条件

d.多种告警触达渠道

11.png

如果您还对监控告警的触达渠道有所要求,可以考虑使用公司的办公软件进行群触达,与您同组的其他同事一起关注并修复应用问题。

在此方案中提到的所有监控告警设置功能,可以通过U-APM体验,2分钟制定告警计划。

原文链接

本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/514033.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++ 打印条码_金蝶盘点机PDA仓库条码管理之——外购入库扫码开单操作

优势点:收到供应商送货后,仓管员手持盘点机PDA现场将需要入库的商品按顺序扫描一遍,即可自动生成电脑软件金蝶里的【外购入库单】,避免仓管员往返电脑费时费事,和人工手工电脑录单效率低容易出错的问题,从而…

我在架构设计和代码开发中的一些常用原则

简介: 在日常的开发和设计过程中,大家对技术设计上的一些问题往往会面临很多的选择,不同的人会有不同的选择。本文介绍的就是我在工作中遇到的一些问题而总结和使用到的一些常用原则。 不管我一生中取得了多大的成功,其主要原因都…

坚持自主创新,凌波微步完成数千万A轮融资,加速半导体产业

随着5G、互联网、大数据、人工智能以及汽车电子等新技术、新产品的广泛应用,半导体产业已成为国民经济的基础性支撑产业。它是支撑经济社会发展,保障国家安全的战略性、基础性和先导性产业,其发展程度是衡量一个国家科技发展水平的核心指标之…

当程序员具备了抽象思维

简介: 若想捉大鱼,就得潜入深渊。深渊里的鱼更有力,也更纯净。硕大而抽象,且非常美丽。 作者:张建飞 若想捉大鱼,就得潜入深渊。深渊里的鱼更有力,也更纯净。硕大而抽象,且非常美丽…

平板电脑连接投影仪_交互式触控幼教白板如何与平板进行连接-微幼科技

现代智慧教学中离不开智能产品的辅助,电脑、平板就是其中之一。然而这两种电子产品的显示屏尺寸太小,并不能用于多人教学中。而55寸甚至上百寸幼教白板的出现,则可以解决多人互动教学的问题。那么,交互式触控幼教白板如何与平板进…

搭载了HarmonyOS 2的华为nova9,有哪些眼前一亮的功能?

9月23日,华为正式发布了nova9系列手机。作为年轻人的鸿蒙影像旗舰,nova9系列搭载了面向万物互联时代的HarmonyOS 2,沿袭nova品牌的年轻潮美基因,聚焦年轻人群的影像社交需求,在外观、影像、快充等多方面带来了创新突破…

谈AK管理之进阶篇 - 如何有效控制云上[最后一把密钥]的风险?

简介: 上一期“谈AK管理之基础篇”,我们讲了如何规范的进行访问密钥生命周期管理。通过分出不同权限的阿里云RAM子账号,将不同的权限分给不同的用户,这样一旦子账号泄露也不会造成全局的信息泄露。但是,由于子账号在一…

备案域名绑定服务器后 提示需要备案_小程序开发需要多少钱?

现在越来越多的企业想通过微信小程序来宣传产品,为什么小程序那么火爆呢?奥晶科技为您解答,其优点不言而喻:1. 小程序建设的成本比APP建设成本低;2. 小程序能紧跟市场发展潮流,随时更新功能;3. …

Nacos配置安全最佳实践

简介: 本文讨论了自建Nacos和阿里云MSE的配置安全原理。并提出配置安全最佳实践。 作者:鲁严波 前言 配置管理作为软件开发中重要的一环,肩负着连接代码和环境的职责,能很好的分离开发人员和维护人员的关注点。 Nacos的配置管理…

云原生之上,亚马逊云科技发布多项容器与Serverless服务,持续发力现代化应用

亚马逊云科技持续发力现代化应用领域,在中国区域新推多项容器与Serverless服务及功能 在中国区域推出Amazon ECS Anywhere、Amazon Lambda容器镜像功能以及Amazon EMR on EKS等 2021年至今已发布近50个现代化应用领域全新服务与功能 编辑 | 宋 慧 出品 | CSDN云计…

2B 领域下低代码的探索之路

简介: 低代码将成为B端服务领域的基础设施,必将颠覆传统开发方式,未来可期。 作者:天晟 前言 大家好,我是钉钉宜搭前端一个小团队的负责人天晟,在阿里做了五年的低代码。今天的分享我们不讲技术细节&…

启动延时缩短 50%-80%,函数计算发布镜像加速功能

简介: 容器镜像因其颠覆式创新成为云原生时代应用部署格式的事实标准。头部云厂商 FaaS (Function-as-a-Service) 服务如阿里云函数计算、AWS Lambda 也相继在 2020 年支持使用容器镜像部署函数,全面拥抱容器生态。 作者 | Shuai Chang 阿里云云原生 Se…

易点云在京发布璇玑调度系统 中小企业办公IT升级步伐加快

中小企业是中国经济的基本细胞。数据显示,中小企业数量占我国企业总数的90%以上,对全国GDP的贡献达65%、税收贡献超过50%、解决了75%以上的城镇就业。 这些规模庞大的中小微企业的IT基础设施水平远远低于大型企业,“得过且过”是中国中小企业…

MaxCompute作业日常监控与运维实践

简介: MaxCompute作业日常监控与运维实践 监控项目作业超时运行 案例一 专用于业务团队取数的project_A ,基本都是手动跑SQL查询,每个作业执行基本不会很长时间,由于目前使用的是包年包月计算资源,为了防止单个作业…

resttemplate post提交json_SEO工具脚本,Python百度普通收录API提交工具

百度收录问题一直是不少渣渣头痛的问题,而官方其实提供了普通收录和快速收录这样的接口,直接调用官方api接口,大力出奇迹,你需要相信,你尽管seo,有排名算我输,不收录,怎么会呢&#…

OpenKruise 如何实现 K8s 社区首个规模化镜像预热能力

简介: OpenKruise 是阿里云开源的云原生应用自动化管理套件,也是当前托管在 Cloud Native Computing Foundation (CNCF) 下的 Sandbox 项目。它来自阿里巴巴多年来容器化、云原生的技术沉淀,是阿里内部生产环境大规模应用的基于 Kubernetes 之…

云原生时代,底层性能如何调优?

作者 | 宋慧出品 | CSDN云计算(ID:CSDNcloud)现在,当企业提及数字化转型,上云用云的话题时,言必谈及云原生。在云原生吞噬一切的口号下,云原生被频繁、高热度的讨论之后,其真正的价值…

4米乘以12米CAD图_孙吴镀锌钢管大棚骨架图片4-12米可定尺

孙吴镀锌钢管大棚骨架图片4-12米可定尺泽沃温室大棚管厂家是集生产销售为一体,生产经销大棚管、大棚钢管、热镀锌大棚管、大棚镀锌管、热镀锌带管。温室大棚产品广泛用于温室工程建设、大棚蔬菜基地建设、水果、水稻育秧、药材、种植、畜牧养殖等温室大棚骨架等行业…

Raft成员变更的工程实践

简介: 成员变更是一致性系统实现绕不开的难题,对于提升运维能力以及服务可用性都有很大的帮助。 本文从Raft成员变更理论出发,介绍了Raft成员变更和单步成员变更的问题,其中包括Raft著名的Bug。 对于Raft成员变更的工程实现上需要…

No.1-Apache IoTDB 随笔 - Time Series DBMS 综述

简介: 这是一篇无法一口气读完的、文字过万[正文字数14390]的长文,这是一个无法中途不上厕所就看完的、关于时序数据库的视频[时长111分钟]分享的文字整理.. 大家好,很开心能够和大家一起交流时序数据库的相关的内容 首先还是简单自我介绍一…