优维产品最佳实践第17期：善用控制台

优维产品最佳实践第17期：善用控制台

news/2025/4/4 15:58:30/文章来源:https://blog.csdn.net/EasyOps_DevOps/article/details/134790520

「背景」

遇到页面报错时，是不是感到困扰，不知如何解决？

页面响应缓慢时，是否感到迷茫，不清楚从何入手排查？

面对主机高负载时，是不是觉得确认异常根因很有挑战？

本期最佳实践为您讲解如何通过控制台排查定位：

页面报错时，获取traceId确认报错组件；通过全局监控确认组件状态，查看组件日志分析原因。
页面响应缓慢时，查看集群主机状态并通过链路跟踪发现耗时最长的节点，进一步查看组件状态、日志，优化解决。
主机高负载时，通过主机上的CPU使用、内存使用Top10进程来定位，找到占用资源最高的进程，抓取堆栈信息进行分析。

「全局监控」

平台监控包括四个模块: 全局监控、存储组件监控、逻辑组件监控、监控流监控

「 主机监控 」

默认首页为主机监控，在这个界面我们可以看到这个集群的整体情况，集群中各主机的状态。集群状态的判断为各主机心跳状态+ 时间偏移+磁盘使用率低于90，这3个指标都正常的时候集群状态才为正常。图一跟图二的对比可以看出来，当磁盘使用率降到90以下后集群状态才回归正常。

接下来的部分是常用指标的折线图，最长保留60天的数据，可以通过调整右上角的时间范围来看长时间的趋势。

主机资源不足的情况下，我们常常会去找占用资源最多的进程。控制台同样集成这样的能力，我们可以按主机、CPU、内存、进程名来过滤，定位进程的资源使用情况。这里记录的是某个时刻的Top10进程，如果进程没有进到前10，则会搜索不到。

「组件状态 」

组件状态主要展示集群组件的运行状态，按组件类型分tab展示：后台组件、资源包（以-M、-db、-R结尾的组件）、前端插件（以NA、NB结尾的组件）

该页面提供过滤、查询等功能，当我们已知组件部分信息时，这个功能能帮助我们确认组件部署所在的主机、组件监听的端口、名字服务以及状态。如果组件状态为异常，点击组件名可以查看详细信息。如果为下线组件，可以标记忽略，避免误报。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/196237.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

pycharm中requirements

pycharm中requirements

pycharm中requirements 生成requirements.txt文件安装requirements.txt中的包快速记录所有的包信息，方法在新环境中安装生成requirements.txt文件 pip freeze > requirements.txt安装requirements.txt中的包 pip install -r requirements.txt

阅读更多...

主动学习入门Week1

主动学习入门Week1

主动学习（Active Learning） 介绍实例详解模型分类基本查询策略经典方法应用方向引用介绍主动学习是一种通过主动选择最有价值的样本进行标注的机器学习或人工智能方法。其目的是使用尽可能少的、高质量的样本标注使模型达到尽可能好的性能。也就是说&…

阅读更多...

华为云购买参考：到底选购ECS还是CCE？

华为云购买参考：到底选购ECS还是CCE？

这两天给开发组的小朋友讲cce，有人碰到不知道在ECS和CCE之间怎么选择，在这里说说我的建议，希望能对大家有所帮助。当然，太多的理由会引起大家混乱，还不如不说，说起来也啰嗦，还是按照我们的经验来主要说说原则吧。在这里我建议按照下面几个原则选择： 1、你的项目结…

阅读更多...

Ant Design Pro初始化报错

Ant Design Pro初始化报错

今天按照官网步骤初始化项目，第一次报错 fatal: unable to access https://github.com/ant-design/ant-design-pro/: SSL certificate problem: unable to get local issuer certificate 致命：无法访问https://github.com/ant-design/ant-design-pro/&…

阅读更多...

19：kotlin 类和对象 -- 密封类和接口（Sealed classes and interfaces ）

19：kotlin 类和对象 -- 密封类和接口（Sealed classes and interfaces ）

使用sealed关键字声明一个密封类或者接口 sealed interface Errorsealed class IOError(): Error密封类和接口能够很好的控制继承，在密封类和接口定义的模块和包外无法被继承在编译期我们就已知了所有的密封类和接口的实现类。在某种意义上，密封类类似…

阅读更多...

qt 安装

qt 安装

目录前言一、QT在线安装包下载 1.官方网站： 2.镜像（清华大学） 二、QT安装 1.更换安装源 2.安装界面 3.组件选择（重点） 参考 Qt2023新版保姆级安装教程前言本文主要介绍2023新版QT安装过程，…

阅读更多...

12.4_黑马MybatisPlus笔记（下）

12.4_黑马MybatisPlus笔记（下）

目录 11 12 thinking：关于Mybatis Plus中BaseMapper和IService？ 13 编辑 thinking：CollUtil.isNotEmpty? 14 thinking：Collection、Collections、Collector、Collectors？ thinking：groupBy&#…

阅读更多...

回顾Django的第五天

回顾Django的第五天

1.多表操作 1.1基于对象的跨表查询正向查询（按字段：publish） # 查询主键为1的书籍的出版社所在的城市 book_objBook.objects.filter(pk1).first() # book_obj.publish 是主键为1的书籍对象关联的出版社对象 print(book_obj.publish.city)…

阅读更多...

浅谈对SSH的理解

浅谈对SSH的理解

ssh框架指的是Spring Struts2 and Hibernate,Spring可以理解为绿草丛，负责通过配置文件或注解管理组件之间的依赖关系，并提供了高效的事务管理功能，其出色的ioc和aop面向切面编程可以织入增强，并且具有很多spring注解可以减轻配置…

阅读更多...

【Virtual Box】显示界面后无反应

【Virtual Box】显示界面后无反应

本文记录本人在使用Virtual Box中遇到的问题 1.Virtual Box启动后无反应点击菜单栏是可用的，但界面里的无法操作【解决方法】：以管理员身份启动virtual Box

阅读更多...

数据结构第5 6 章作业图哈希表西安石油大学

数据结构第5 6 章作业图哈希表西安石油大学

第6章图 1．选择题 （1）在一个图中，所有顶点的度数之和等于图的边数的（ ）倍。 A．1/2 B．1 C．2 D．4 答案&#xff1a…

阅读更多...

算法通关村第十六关|白银|滑动窗口经典

算法通关村第十六关|白银|滑动窗口经典

1.最长子串 1.1 无重复字符的最长子串原题：力扣3. 使用 HashMap ，将字符和最后一次出现的索引存储起来。 public int lengthOfLongestSubstring(String s) {if (s.length() 0) {return 0;}HashMap<Character, Integer> map new HashMap<…

阅读更多...

js数组合并的方法,以及各方法的区别

js数组合并的方法,以及各方法的区别

需求 array1 [1,2,3] array2 [4,5,6] 合并俩数组打印结果为 [1,2,3,4,5,6] 思路方法一使用concat()方法 concat()方法可以将多个数组合并成一个新数组，不会修改原始数组。优点它可以合并任意数量的数组，并且可以在合并时添加新的元…

阅读更多...

【云备份】客户端模块

【云备份】客户端模块

33. 客户端数据管理模块实现-数据信息设计客户端要实现的功能是对指定文件夹中的文件自动进行备份上传。但是并不是所有的文件每次都需要上传，我们需要能够判断，哪些文件需要上传，哪些不需要，因此需要将备份的文件信息给管理起来…

阅读更多...

linux 命令 tmux 用法详解

linux 命令 tmux 用法详解

一、tmux 解决的痛点（screen命令一样可以解决，但是tmux功能更强大） 痛点一：大数据传输的漫长一夜相信做过 Linux 服务运维的同学，都用 scp 进行过服务器间的大文件网络传输。一般这需要很长的时间，这期间…

阅读更多...

自动化集成有哪些典型应用场景？

自动化集成有哪些典型应用场景？

为什么要做自动化场景集成？ 主要分为以下几点： 提高效率/减少错误：减少人工操作、人为错误、人力成本，提高生产效率、生产质量和稳定性。提高可靠性：提高系统的可靠性和稳定性，减少系统故障和停机时间。…

阅读更多...

【云备份】项目介绍

【云备份】项目介绍

1. 云备份认识自动将本地计算机上指定文件夹中需要备份的文件上传备份到服务器中。并且能够随时通过浏览器进行查看并且下载，其中下载过程支持断点续传功能，而服务器也会对上传文件进行热点管理，将非热点文件进行压缩存储，节省磁…

阅读更多...

golang使用es,报错Elasticsearch health check failed

golang使用es,报错Elasticsearch health check failed

今天golang代码里调用es，结果一直报错。报错内容 ElasticsearchRestHealthIndicator : Elasticsearch health check failed然后又去es管理端看，明明节点是绿色的，估计是golang的这个有问题，时间紧迫，我就直接关掉了健…

阅读更多...

【网络安全】-《网络安全法》制定背景和核心内容

【网络安全】-《网络安全法》制定背景和核心内容

文章目录 1. 背景介绍1.1 数字时代的崛起1.2 中国网络安全形势 2. 《网络安全法》核心内容2.1 法律适用范围2.2 个人信息保护2.3 关键信息基础设施保护2.4 网络安全监管和应急响应2.5 网络产品和服务安全管理2.6 法律责任和处罚 3. 法律的意义和影响3.1 维护国家安全3.2 保护个…

阅读更多...

易石无代码开发：电商平台连接CRM与客服系统，实现营销自动化

易石无代码开发：电商平台连接CRM与客服系统，实现营销自动化

易石无代码开发的优势易石软件以其强大的无代码开发平台，为电商企业提供了一种全新的业务集成手段。在激烈的市场竞争中，电商平台必须不断优化其运营效率和客户服务质量。易石无需复杂的API开发，通过简单的配置就能实现电商平台与CRM、客服…

阅读更多...

最新文章