全局指标
- all_p99:所有服务响应时间的第99百分位数(p99),即99%的请求响应时间都小于这个值。
- all_p95:所有服务响应时间的第95百分位数(p95),即95%的请求响应时间都小于这个值。
- all_p90:所有服务响应时间的第90百分位数(p90),即90%的请求响应时间都小于这个值。
- all_p75:所有服务响应时间的第75百分位数(p75),即75%的请求响应时间都小于这个值。
- all_p70:所有服务响应时间的第70百分位数(p70),即70%的请求响应时间都小于这个值。
- all_heatmap:所有服务响应时间的热点图,用于可视化不同时间段内的服务响应时间分布。
服务指标
- service_resp_time:服务的平均响应时间,即所有请求的平均处理时间。
- service_sla:服务的成功率,通常定义为成功请求数除以总请求数。
- service_cpm:服务每分钟调用次数,即每分钟对服务的调用次数。
- service_p99:服务响应时间的第99百分位数(p99)。
- service_p95:服务响应时间的第95百分位数(p95)。
- service_p90:服务响应时间的第90百分位数(p90)。
- service_p75:服务响应时间的第75百分位数(p75)。
- service_p50:服务响应时间的第50百分位数(p50),即中位数。
服务实例指标
- service_instance_sla:服务实例的成功率。
- service_instance_resp_time:服务实例的平均响应时间。
- service_instance_cpm:服务实例每分钟调用次数。
端点指标
- endpoint_cpm:端点每分钟调用次数。
- endpoint_avg:端点平均响应时间。
- endpoint_sla:端点成功率。
- endpoint_p99:端点响应时间的第99百分位数(p99)。
- endpoint_p95:端点响应时间的第95百分位数(p95)。
- endpoint_p90:端点响应时间的第90百分位数(p90)。
- endpoint_p75:端点响应时间的第75百分位数(p75)。
- endpoint_p50:端点响应时间的第50百分位数(p50)。
JVM指标
- instance_jvm_cpu:JVM实例的CPU使用率。
- instance_jvm_memory_heap:JVM堆内存使用量。
- instance_jvm_memory_noheap:JVM非堆内存使用量。
- instance_jvm_memory_heap_max:JVM堆内存最大可用量。
- instance_jvm_memory_noheap_max:JVM非堆内存最大可用量。
- instance_jvm_young_gc_time:JVM年轻代垃圾回收时间。
- instance_jvm_old_gc_time:JVM老年代垃圾回收时间。
- instance_jvm_young_gc_count:JVM年轻代垃圾回收次数。
- instance_jvm_old_gc_count:JVM老年代垃圾回收次数。
服务关系指标
- service_relation_client_cpm:在客户端每分钟检测到的调用次数。
- service_relation_server_cpm:在服务端每分钟检测到的调用次数。
- service_relation_client_call_sla:在客户端检测到的成功率。
- service_relation_server_call_sla:在服务端检测到的成功率。
- service_relation_client_resp_time:在客户端检测到的平均响应时间。
- service_relation_server_resp_time:在服务端检测到的平均响应时间。
端点关系指标
- endpoint_relation_cpm:端点关系每分钟调用次数。
- endpoint_relation_resp_time:端点关系的平均响应时间。
其他关键指标
CPM:每分钟请求调用的次数
SLA:网站服务可用性(主要是通过请求成功与失败次数来计算),9越多代表全年服务可用时间越长服务更可靠,停机时间越短
1年 = 365天 = 8760小时
99.9 = 8760 * 0.1% = 8760 * 0.001 = 8.76小时
99.99 = 8760 * 0.0001 = 0.876小时 = 0.876 * 60 = 52.6分钟
99.999 = 8760 * 0.00001 = 0.0876小时 = 0.0876 * 60 = 5.26分钟
从以上看来,全年停机5.26分钟才能做到99.999%,即5个9
CLR:(公共语言运行库)在运行期管理程序的执行:主要包含:内存管理、代码安全验证、代码执行、垃圾收集。CLR有一项服务称为GC(Garbage Collector,垃圾收集),它能为你自动管理内存。GC自动从内存中删除程序不再访问的对象,GC是程序员不再操心许多以前必须执行的任务,比如释放内存和检查内存泄漏。
百分位数:skywalking中有P50,P90,P95这种统计口径,就是百分位数的概念。