使用Dropwizard度量标准监视和测量无功应用

在上一篇文章中,我们创建了一个简单的索引代码,该代码可以对ElasticSearch进行数千个并发请求。 监视系统性能的唯一方法是老式的日志记录语句:

.window(Duration.ofSeconds(1))
.flatMap(Flux::count)
.subscribe(winSize -> log.debug("Got {} responses in last second", winSize));

很好,但是在生产系统上,我们宁愿有一些集中的监视和图表解决方案来收集各种指标。 一旦在数千个实例中拥有数百个不同的应用程序,这一点就变得尤为重要。 具有单个图形仪表板,汇总​​所有重要信息变得至关重要。 我们需要两个组件来收集一些指标:

  • 发布指标
  • 收集并可视化它们

使用Dropwizard指标发布指标

在Spring Boot 2中, Dropwizard指标被千分尺取代。 本文使用前者,下一个将在实践中显示后者的解决方案。 为了利用Dropwizard指标,我们必须将MetricRegistry或特定指标注入我们的业务类别。

import com.codahale.metrics.Counter;
import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.Timer;
import lombok.RequiredArgsConstructor;
import lombok.extern.slf4j.Slf4j;@Component
@RequiredArgsConstructor
class Indexer {private final PersonGenerator personGenerator;private final RestHighLevelClient client;private final Timer indexTimer;private final Counter indexConcurrent;private final Counter successes;private final Counter failures;public Indexer(PersonGenerator personGenerator, RestHighLevelClient client, MetricRegistry metricRegistry) {this.personGenerator = personGenerator;this.client = client;this.indexTimer = metricRegistry.timer(name("es", "index"));this.indexConcurrent = metricRegistry.counter(name("es", "concurrent"));this.successes = metricRegistry.counter(name("es", "successes"));this.failures = metricRegistry.counter(name("es", "failures"));}private Flux<IndexResponse> index(int count, int concurrency) {//....}}

这么多样板,以添加一些指标!

  • indexTimer测量索引请求的时间分布(平均值,中位数和各种百分位数)
  • indexConcurrent度量当前有多少个待处理的请求(已发送请求,尚未收到响应); 指标随时间上升和下降
  • successfailures计算相应的成功索引请求和失败索引请求的总数

我们将在一秒钟内删除样板,但首先,让我们看一下它在我们的业务代码中的作用:

private Mono<IndexResponse> indexDocSwallowErrors(Doc doc) {return indexDoc(doc).doOnSuccess(response -> successes.inc()).doOnError(e -> log.error("Unable to index {}", doc, e)).doOnError(e -> failures.inc()).onErrorResume(e -> Mono.empty());
}

每次请求完成时,上述此辅助方法都会增加成功和失败的次数。 而且,它记录并吞下错误,因此单个错误或超时不会中断整个导入过程。

private <T> Mono<T> countConcurrent(Mono<T> input) {return input.doOnSubscribe(s -> indexConcurrent.inc()).doOnTerminate(indexConcurrent::dec);
}

上面的另一种方法是在发送新请求时增加indexConcurrent指标,并在结果或错误到达时将其递减。 此指标不断上升和下降,显示进行中的请求数。

private <T> Mono<T> measure(Mono<T> input) {return Mono.fromCallable(indexTimer::time).flatMap(time ->input.doOnSuccess(x -> time.stop()));
}

最终的助手方法是最复杂的。 它测量编制索引的总时间,即发送请求和接收响应之间的时间。 实际上,它非常通用,它只是计算订阅任意Mono<T>到完成之间的总时间。 为什么看起来这么奇怪? 好吧,基本的Timer API非常简单

indexTimer.time(() -> someSlowCode())

它只需要一个lambda表达式并测量调用它花费了多长时间。 另外,您可以创建一个小的Timer.Context对象,该对象可以记住创建时间。 当您调用Context.stop()它将报告此度量:

final Timer.Context time = indexTimer.time();
someSlowCode();
time.stop();

使用异步流,要困难得多。 任务的开始(由预订表示)和完成通常发生在代码不同位置的线程边界上。 我们可以做的是(懒惰地)创建一个新的Context对象(请参阅: fromCallable(indexTimer::time) ),并在包装​​的流完成时,完成Context (请参阅: input.doOnSuccess(x -> time.stop() ))。这是您构成所有这些方法的方式:

personGenerator.infinite().take(count).flatMap(doc -> countConcurrent(measure(indexDocSwallowErrors(doc))), concurrency);

就是这样,但是用这么多低级的度量收集细节污染业务代码似乎很奇怪。 让我们用专门的组件包装这些指标:

@RequiredArgsConstructor
class EsMetrics {private final Timer indexTimer;private final Counter indexConcurrent;private final Counter successes;private final Counter failures;void success() {successes.inc();}void failure() {failures.inc();}void concurrentStart() {indexConcurrent.inc();}void concurrentStop() {indexConcurrent.dec();}Timer.Context startTimer() {return indexTimer.time();}}

现在,我们可以使用一些更高级的抽象:

class Indexer {private final EsMetrics esMetrics;private <T> Mono<T> countConcurrent(Mono<T> input) {return input.doOnSubscribe(s -> esMetrics.concurrentStart()).doOnTerminate(esMetrics::concurrentStop);}//...private Mono<IndexResponse> indexDocSwallowErrors(Doc doc) {return indexDoc(doc).doOnSuccess(response -> esMetrics.success()).doOnError(e -> log.error("Unable to index {}", doc, e)).doOnError(e -> esMetrics.failure()).onErrorResume(e -> Mono.empty());}
}

在下一篇文章中,我们将学习如何更好地组合所有这些方法。 并避免一些样板。

发布和可视化指标

仅仅收集指标是不够的。 我们必须定期发布汇总指标,以便其他系统可以使用,处理和可视化它们。 一种这样的工具是Graphite和Grafana 。 但是,在开始配置它们之前,让我们首先将指标发布到控制台。 我发现在对度量进行故障排除或开发时特别有用。

import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.Slf4jReporter;@Bean
Slf4jReporter slf4jReporter(MetricRegistry metricRegistry) {final Slf4jReporter slf4jReporter = Slf4jReporter.forRegistry(metricRegistry.build();slf4jReporter.start(1, TimeUnit.SECONDS);return slf4jReporter;
}

这个简单的代码片段采用现有的MetricRegistry并注册Slf4jReporter 。 每秒您将看到所有度量标准被打印到日志中(Logback等):

type=COUNTER, name=es.concurrent, count=1
type=COUNTER, name=es.failures, count=0
type=COUNTER, name=es.successes, count=1653
type=TIMER, name=es.index, count=1653, min=1.104664, max=345.139385, mean=2.2166538118720576,stddev=11.208345077801448, median=1.455504, p75=1.660252, p95=2.7456, p98=5.625456, p99=9.69689, p999=85.062713,mean_rate=408.56403102372764, m1=0.0, m5=0.0, m15=0.0, rate_unit=events/second, duration_unit=milliseconds

但这仅仅是为了解决问题,为了将指标发布到外部Graphite实例,我们需要一个GraphiteReporter

import com.codahale.metrics.MetricRegistry;
import com.codahale.metrics.graphite.Graphite;
import com.codahale.metrics.graphite.GraphiteReporter;@Bean
GraphiteReporter graphiteReporter(MetricRegistry metricRegistry) {final Graphite graphite = new Graphite(new InetSocketAddress("localhost", 2003));final GraphiteReporter reporter = GraphiteReporter.forRegistry(metricRegistry).prefixedWith("elastic-flux").convertRatesTo(TimeUnit.SECONDS).convertDurationsTo(TimeUnit.MILLISECONDS).build(graphite);reporter.start(1, TimeUnit.SECONDS);return reporter;
}

在这里,我向localhost:2003报告,其中带有Graphite + Grafana的Docker镜像恰好在其中。 每秒将所有度量标准发送到该地址。 我们稍后可以在Grafana上可视化所有这些指标:


上图显示了索引时间分布(从第50个百分位数到第99.9个百分位数)。 使用此图,您可以快速发现典型性能(P50)和(几乎)最坏情况的性能(P99.9)。 对数标度是不寻常的,但是在这种情况下,我们可以看到上下百分位。 底部图更加有趣。 它结合了三个指标:

  • 成功执行索引操作的速率(每秒请求数)
  • 操作失败率(红色条,堆叠在绿色条上)
  • 当前并发级别(右轴):进行中的请求数

此图显示了系统吞吐量(RPS),故障和并发性。 故障太多或并发级别异常高(许多操作正在等待响应)可能表明您的系统存在某些问题。 仪表板定义在GitHub存储库中可用。

在下一篇文章中,我们将学习如何从Dropwizard指标迁移到微米。 一个非常愉快的经历!

翻译自: https://www.javacodegeeks.com/2018/01/monitoring-measuring-reactive-application-dropwizard-metrics.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/348662.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

移动通信-多径效应,多普勒效应,菲涅尔区,阴影效应,快衰落,慢衰落

多径效应 信号从发射端到接收端常有许多时延不同、损耗各异的传输路径&#xff0c;可以是直射、反射或是绕射。无线电波的多径效应是指不同路径的相同信号在按收端叠加会增大或减小接收信号能量的现象。 时间色散 在无线通信中&#xff0c;无线电波从发射端到接收端会经过直射、…

拆分为流

我正在为我工​​作的公司准备正则表达式教程更新。 原始教程创建于2012年&#xff0c;从那时起Java发生了一点变化。 有新的Java语言版本&#xff0c;尽管Java中的正则表达式处理仍不完善&#xff08;nb。它仍使用非确定性FSA&#xff09;&#xff0c;但仍有一些新功能。 我在…

四旋翼

更新2018/11 1系统设计 硬件总体框架&#xff08;认识四旋翼的基本组成&#xff09; 机架主要的两种&#xff08;x型控制更难&#xff0c;动作灵活&#xff09; 十字型,X字型 桨 7040,8045&#xff08;常用&#xff09;&#xff0c;前四位直径&#xff0c;后四位角度 正反螺旋…

hotspot线程模型_Linux上的HotSpot GC线程CPU占用空间

hotspot线程模型以下问题将测试您对Linux操作系统上运行的Java应用程序的垃圾收集和高CPU故障排除的知识。 当调查过多的GC和/或CPU利用率时&#xff0c;此故障排除技术尤其重要。 它将假定您无权使用高级监控工具&#xff0c;例如Compuware dynaTrace甚至JVisualVM。 将来将介…

数字信号处理实验一

补充2019/10/26 (1)序列的加、减、乘、除和乘方运算。输入A[1 2 3 4]&#xff0c;B[3 4 5 6]&#xff0c;起点n0&#xff0c;求CAB&#xff0c;DA-B&#xff0c;EA.*B&#xff0c;FA./B&#xff0c;GA.^B&#xff0c;并用stem语句画出A&#xff0c;B&#xff0c;C&#xff0c;D…

SRP是骗局

根据罗伯特马丁 &#xff08; Robert Martin&#xff09;的 《 清洁法 》&#xff08; Clean Code&#xff09; &#xff0c;“ 单一责任原则 ”意味着“一个阶级应该只有一个改变的理由”。 让我们尝试解密这个模糊的语句&#xff0c;看看它如何帮助我们设计更好的面向对象软件…

数字信号处理实验二

补2019/11/2 &#xff08;1&#xff09;编写函数如xsiAdd(x1,n1,x2,n2),实现两个序列x1和x2的相加&#xff0c;其中x1的下标为n1n1s:nlf&#xff0c;x2的下标为n2n2s:n2f。绘制出该函数的图形。设x1&#xff08;n&#xff09;n,0≦n1≦9,x2(n)n,4≦n2≦15。 &#xff08;2&…

apache camel_使用Apache Camel发布/订阅模式

apache camel发布/订阅是一种简单的消息传递模式&#xff0c;其中&#xff0c;发布者将消息发送到某个频道&#xff0c;而无需知道谁将接收消息。 然后&#xff0c;通道负责将消息的副本传递给每个订户。 此消息传递模型可以创建松耦合和可伸缩的系统。 这是一种非常常见的消息…

Java 9:JShell

JShell是Java 9中引入的新工具&#xff0c;用于评估在命令行上输入的Java语句。 它是Java平台上第一个正式的REPL&#xff08;读取-评估-打印循环&#xff09;实现&#xff0c;非常适合尝试Java代码而无需启动IDE或编写完整的程序&#xff01; 要运行JShell&#xff0c;只需在…

java 权威指南_Java 8:CompletableFuture权威指南

java 权威指南Java 8即将到来&#xff0c;因此该学习新功能了。 尽管Java 7和Java 6只是次要的发行版&#xff0c;但版本8将向前迈出一大步。 也许太大了&#xff1f; 今天&#xff0c;我将为您详细介绍JDK 8中的新抽象– CompletableFuture<T> 。 众所周知&#xff0c;J…

网络层常见知识点剖析

网络层 HOL阻塞 队首阻塞是一种常出现在缓存式通信网络交换中的一种现象 交换结构 缓存输入输出端口一个交换结构缓存式先进先出输出端口 产生原因 由于FIFO队列机制首先处理的是队列中最靠前的数据&#xff0c;这是队列后面的数据对应的出口缓存可能会关闭 路由器根据数…

选择Java加密算法第2部分–单密钥对称加密

抽象 这是涵盖Java加密算法的三部分博客系列的第2部分。 本系列介绍如何实现以下目标&#xff1a; 使用SHA–512散列 AES–256 RSA–4096 这第二篇文章详细介绍了如何实现单密钥对称AES-256加密。 让我们开始吧。 免责声明 这篇文章仅供参考。 在使用所提供的任何信息之前…

三句话介绍清楚滑动窗口协议/GBN/SR

滑动窗口协议、GBN、SR之间不得不说的故事 首先我们来介绍什么是滑动窗口协议 滑动窗口协议&#xff08;Sliding Window Protocol&#xff09;&#xff0c;属于TCP协议的一种应用&#xff0c;用于网络数据传输时的流量控制&#xff0c;以避免拥塞的发生。该协议允许发送方在停…

《计算机网络自顶向下》之重头戏迪杰斯特拉算法

迪杰斯特拉算法(Dijkstra)是由荷兰计算机科学家狄克斯特拉于1959 年提出的&#xff0c;因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法&#xff0c;解决的是有权图中最短路径问题。迪杰斯特拉算法主要特点是从起始点开始&#xff0c;采用贪心算法的策略&…

新闻发布系统java ee_Java EE 7发布–反馈和新闻报道

新闻发布系统java eeJava EE 7已经存在了几天。 我们所有人都有机会观看直播活动或可用的重播 。 最后的MR版本完成了将其工作推向JCP的工作&#xff0c;基本上是一个总结。 是时候反思发生的事情和我对此的想法了。 启动活动中的社区参与 它不是一个大秘密。 即使Oracle的Jav…

还不会子网划分?看这篇文章还远远不够!

子网划分的概念 Internet组织机构定义了五种IP地址&#xff0c;有A、B、C三类地址。A类网络有126个&#xff0c;每个A类网络可能有16777214台主机&#xff0c;它们处于同一广播域。而在同一广播域中有这么多节点是不可能的&#xff0c;网络会因为广播通信而饱和&#xff0c;结…

在即将发布的Camel 2.21版本中改进了使用Apache Camel和ActiveMQ Artemis处理大型消息的功能...

从历史上看&#xff0c; Apache ActiveMQ消息代理最初是在大型消息以MB为单位而不是GB的情况下创建的&#xff0c;就像您今天所做的那样。 下一代代理Apache ActiveMQ Artemis&#xff08;或仅是Artemis&#xff09;则不是这种情况&#xff0c;后者对大消息有更好的支持。 因…

《计算机网络自顶向下》知识体系完全梳理

计算机网络复习 第一章 OSI 7层协议参考模型及各层功能 应用层 网络服务与最终用户的一个接口 表示层 数据的安全、表示、压缩 会话层 建立、管理、终止会话 传输层 定义传输数据的协议端口号&#xff0c;以及流控和差错校验 网络层 进行逻辑地址寻址&#xff0c;实现不同网…

java 迁移数据_从迁移到Java 7的小技巧

java 迁移数据经过几年的努力&#xff0c;我们终于开始在软件级别方面将应用程序从黑暗时代中拉出来&#xff0c;其中一个步骤是将我们的Java版本升级到Java7。在大多数情况下&#xff0c;这很轻松&#xff0c;但是有一些惊喜&#xff1a; 当我们切换到Java 7时&#xff0c;已…

模拟电路概念知识体系梳理(基础部分)

半导体 P、N型半导体 N型半导体 掺入少量杂质磷元素&#xff08;或锑元素&#xff09;的硅晶体&#xff08;或锗晶体&#xff09;中 电子型半导体其导电性主要是因为自由电子导电 P型半导体 掺入少量杂质硼元素&#xff08;或铟元素&#xff09;的硅晶体&#xff08;或锗…