过去当数据库出现了问题,我们只能通过日志去查看问题,可能是数据库有了重启、主节点发生了漂移或查询语句太复杂,这一整套逻辑走下来只能@winsen, @karel。
我们经常说数据库负载过高,请求很多,但我们却不能直接告诉哪个模型哪个接口请求多?
现在控制台内置了对EasyCore的监控,如上问题可以轻松的观测到!
「 存 储 监 控 」
存储监控提供集群数据组件的监控,包括easy_core、easy_tsdb、redis和mongodb,这里主要说明easy_core。
子菜单分为集群信息、Raft状态、请求指标、数据库表、慢查询日志等功能。
集群信息:展示easy_core集群的基本信息:节点列表、节点状态、节点负载,easy_core的CPU、内存使用情况、重启次数,当判断到是具体的某个业务上报数据导致easy_core高负载,进而影响到平台的正常运行时,我们可以根据服务熔断的指引添加配置拦截对应的请求,不处理该业务的请求保证平台的稳定。
Raft状态:展示easy_core集群Raft选举的情况,其中如果发现集群leader经常切换、raft常态落后于leader,这就表明集群是有异常的,可以通过日志进一步定位。
请求指标:用于跟踪easy_core请求定位,按ORG、模型、接口、节点展示模型的请求次数、慢查询平均延时。当页面请求cmdb返回较慢时,可以检查该指标情况。
数据库表: 可以查看各ORG中各模型的实例数,配合分析工具箱中的工具可以定位模型的缓存命中情况、请求指标。
工具执行完成后会展示模型索引、缓存情况并返回一些优化建议。
慢查询日志、日志查询、Exception分别提供页面查询easy_core的slowlog、log、err日志 ,选中日志中高亮的traceId时会弹出trace追踪工具,可以跳转到链路追踪查看请求路径。
配置文件:展示各个节点的easy_core配置