zipkin 自定义采样率_分组,采样和批处理– Java 8中的自定义收集器

zipkin 自定义采样率

在第一篇文章的后续部分,这一次我们将编写一些更有用的自定义收集器:用于按给定的标准进行分组,采样输入,批量处理以及在固定大小的窗口上滑动。

分组(计数事件,直方图)

假设您有一些项目的集合,并且想要计算每个项目(相对于equals() )出现在此集合中的次数。 这可以使用Apache Commons Collections中的CollectionUtils.getCardinalityMap()来实现。 此方法采用Iterable<T>并返回Map<T, Integer> ,计算每个项目出现在集合中的次数。 但是,有时我们不使用equals()而是按输入T的任意属性分组。 例如,假设我们有一个Person对象列表,我们想计算男性与女性的数量(即Map<Sex, Integer> )或年龄分布。 有一个内置的收集器Collectors.groupingBy(Function<T, K> classifier) –但是,它从键返回一个映射到映射到该键的所有项。 看到:

import static java.util.stream.Collectors.groupingBy;//...final List<Person> people = //...
final Map<Sex, List<Person>> bySex = people.stream().collect(groupingBy(Person::getSex));

这很有价值,但是在我们的例子中,不必要地构建了两个List<Person> 。 我只想知道人数。 没有内置的这种收集器,但是我们可以用一种非常简单的方式来组成它:

import static java.util.stream.Collectors.counting;
import static java.util.stream.Collectors.groupingBy;//...final Map<Sex, Long> bySex = people.stream().collect(groupingBy(Person::getSex, HashMap::new, counting()));

这个重载版本的groupingBy()具有三个参数。 如前所述,第一个是键( 分类器 )功能。 第二个参数创建了一个新地图,我们很快就会看到它为什么有用的原因。 counting()是一个嵌套的收集器,它将所有同性的人带到一起,并将它们组合在一起-在我们的示例中,它们只是在到达时对其进行计数。 能够选择地图实现非常有用,例如在构建年龄直方图时。 我们想知道在给定年龄下有多少人-但年龄值应排序:

final TreeMap<Integer, Long> byAge = people.stream().collect(groupingBy(Person::getAge, TreeMap::new, counting()));byAge.forEach((age, count) ->System.out.println(age + ":\t" + count));

我们最终得到了一个从年龄(已排序)到具有该年龄的人数的TreeMap

采样,批处理和滑动窗口

Scala中的IterableLike.sliding()方法允许通过固定大小的滑动窗口查看集合。 该窗口从开始处开始,在每次迭代中移动给定数量的项目。 Java 8中缺少的这种功能允许使用多种有用的运算符,例如计算移动平均值 ,将大集合分成批处理(与Guava中的Lists.partition()比较)或每第n个元素进行采样。 我们将为Java 8实现具有类似行为的收集器。 让我们从单元测试开始,它应该简要描述我们想要实现的目标:

import static com.nurkiewicz.CustomCollectors.sliding@Unroll
class CustomCollectorsSpec extends Specification {def "Sliding window of #input with size #size and step of 1 is #output"() {expect:input.stream().collect(sliding(size)) == outputwhere:input  | size | output[]     | 5    | [][1]    | 1    | [[1]][1, 2] | 1    | [[1], [2]][1, 2] | 2    | [[1, 2]][1, 2] | 3    | [[1, 2]]1..3   | 3    | [[1, 2, 3]]1..4   | 2    | [[1, 2], [2, 3], [3, 4]]1..4   | 3    | [[1, 2, 3], [2, 3, 4]]1..7   | 3    | [[1, 2, 3], [2, 3, 4], [3, 4, 5], [4, 5, 6], [5, 6, 7]]1..7   | 6    | [1..6, 2..7]}def "Sliding window of #input with size #size and no overlapping is #output"() {expect:input.stream().collect(sliding(size, size)) == outputwhere:input | size | output[]    | 5    | []1..3  | 2    | [[1, 2], [3]]1..4  | 4    | [1..4]1..4  | 5    | [1..4]1..7  | 3    | [1..3, 4..6, [7]]1..6  | 2    | [[1, 2], [3, 4], [5, 6]]}def "Sliding window of #input with size #size and some overlapping is #output"() {expect:input.stream().collect(sliding(size, 2)) == outputwhere:input | size | output[]    | 5    | []1..4  | 5    | [[1, 2, 3, 4]]1..7  | 3    | [1..3, 3..5, 5..7]1..6  | 4    | [1..4, 3..6]1..9  | 4    | [1..4, 3..6, 5..8, 7..9]1..10 | 4    | [1..4, 3..6, 5..8, 7..10]1..11 | 4    | [1..4, 3..6, 5..8, 7..10, 9..11]}def "Sliding window of #input with size #size and gap of #gap is #output"() {expect:input.stream().collect(sliding(size, size + gap)) == outputwhere:input | size | gap | output[]    | 5    | 1   | []1..9  | 4    | 2   | [1..4, 7..9]1..10 | 4    | 2   | [1..4, 7..10]1..11 | 4    | 2   | [1..4, 7..10]1..12 | 4    | 2   | [1..4, 7..10]1..13 | 4    | 2   | [1..4, 7..10, [13]]1..13 | 5    | 1   | [1..5, 7..11, [13]]1..12 | 5    | 3   | [1..5, 9..12]1..13 | 5    | 3   | [1..5, 9..13]}def "Sampling #input taking every #nth th element is #output"() {expect:input.stream().collect(sliding(1, nth)) == outputwhere:input  | nth | output[]     | 1   | [][]     | 5   | []1..3   | 5   | [[1]]1..6   | 2   | [[1], [3], [5]]1..10  | 5   | [[1], [6]]1..100 | 30  | [[1], [31], [61], [91]]}
}

在Spock中使用数据驱动的测试,我成功地立即编写了将近40个测试用例,简洁地描述了所有需求。 我希望这些对您来说都是清楚的,即使您以前从未看过这种语法。 我已经假设存在方便的工厂方法:

public class CustomCollectors {public static <T> Collector<T, ?, List<List<T>>> sliding(int size) {return new SlidingCollector<>(size, 1);}public static <T> Collector<T, ?, List<List<T>>> sliding(int size, int step) {return new SlidingCollector<>(size, step);}}

收藏家接连收到物品的事实使工作更加困难。 当然,首先收集整个列表并在列表上滑动会比较容易,但是却很浪费。 让我们迭代构建结果。 我什至不假装通常可以并行执行此任务,所以我将不实现combiner()

public class SlidingCollector<T> implements Collector<T, List<List<T>>, List<List<T>>> {private final int size;private final int step;private final int window;private final Queue<T> buffer = new ArrayDeque<>();private int totalIn = 0;public SlidingCollector(int size, int step) {this.size = size;this.step = step;this.window = max(size, step);}@Overridepublic Supplier<List<List<T>>> supplier() {return ArrayList::new;}@Overridepublic BiConsumer<List<List<T>>, T> accumulator() {return (lists, t) -> {buffer.offer(t);++totalIn;if (buffer.size() == window) {dumpCurrent(lists);shiftBy(step);}};}@Overridepublic Function<List<List<T>>, List<List<T>>> finisher() {return lists -> {if (!buffer.isEmpty()) {final int totalOut = estimateTotalOut();if (totalOut > lists.size()) {dumpCurrent(lists);}}return lists;};}private int estimateTotalOut() {return max(0, (totalIn + step - size - 1) / step) + 1;}private void dumpCurrent(List<List<T>> lists) {final List<T> batch = buffer.stream().limit(size).collect(toList());lists.add(batch);}private void shiftBy(int by) {for (int i = 0; i < by; i++) {buffer.remove();}}@Overridepublic BinaryOperator<List<List<T>>> combiner() {return (l1, l2) -> {throw new UnsupportedOperationException("Combining not possible");};}@Overridepublic Set<Characteristics> characteristics() {return EnumSet.noneOf(Characteristics.class);}}

我花了很多时间来编写此实现,尤其是正确的finisher()所以请不要害怕。 关键部分是一个buffer ,它可以收集项目,直到可以形成一个滑动窗口为止。 然后丢弃“最旧”的物品,并step向前滑动窗口。 我对这种实现并不特别满意,但是测试正在通过。 sliding(N) (与sliding(N, 1)同义词)将允许计算N项目的移动平均值。 sliding(N, N)将输入分成大小为N批次。 sliding(1, N)获取第N个元素(样本)。 希望您会发现这个收藏家有用,喜欢!

翻译自: https://www.javacodegeeks.com/2014/07/grouping-sampling-and-batching-custom-collectors-in-java-8.html

zipkin 自定义采样率

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/340528.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux python版本升级和系统更新_Linux 下升级python和安装pip

1、 首先确认Linux操作系统中自带的python 版本时候与自己所需要的版本一致3、 解压tar -zxvf Python-2.7.11.tgz进入Python-2.7.11目录 输入./configuremakemake install4、 此时查看python版本还是系统默认的版本执行&#xff1a;mv /usr/bin/python /usr/bin/python2.6ln…

成为Java流大师–第1部分:创建流

在许多情况下&#xff0c;声明性代码&#xff08;例如&#xff0c;具有Streams的功能组合&#xff09;可提供出色的代码指标。 通过本动手实验文章系列进行编码&#xff0c;并成为Java Streams的主教练&#xff0c;从而成为一名更好的Java程序员。 Streams的整个想法是代表一个…

python做一副54扑克牌发牌技巧_德州扑克讲堂:高级技巧 胜率之摊牌胜率的算法...

行动胜率的算法。行动获胜是德州扑克中唯二的获胜方式&#xff0c;掌握了对手的弃牌率的话&#xff0c;就算手里完全没牌也可以轻松获胜。然而具体打出对手稳定的弃牌则是一种高级技巧。对于初学玩家&#xff0c;推荐掌握好摊牌胜率的算法&#xff0c;稳当地用摊牌来获胜。胜率…

java 6 基础教程_Java小白入门教程(6)——循环语句

提纲&#xff1a;1、循环结构2、while循环3、do-while循环4、for循环5、break语句6、continue语句7、循环嵌套8、作业一、循环结构1.1 概念条件满足&#xff0c;某些代码会被反复多次的执行。条件不成立了&#xff0c;循环结束。0-n次。1.2 为什么使用循环开发中可能会把某些代…

事件触发控制_SystemVerilog线程控制与通信

01线程控制1.概述线程&#xff0c;即独立运行的程序&#xff1b;线程需要被触发执行&#xff0c;可以结束或者不结束&#xff1b;在module中的initial和always&#xff0c;都可以看作独立的线程&#xff0c;他们在仿真0时刻开始&#xff0c;而选择结束或者不结束&#xff1b;在…

java writablesheet_jxl加边框,jxl合并单元格,单元格的设置,单元格居中

jxl加边框WritableWorkbook wwb Workbook.createWorkbook(os);WritableSheet ws wwb.createSheet( "TestSheet1 ", 0);WritableFont wf newWritableFont(WritableFont.TIMES, 18, WritableFont.BOLD, true);WritableCellFormat wcf new WritableCellFormat(wf);w…

java必读书籍_最佳5本Java性能调优书籍–精选,必读

java必读书籍为什么Java开发人员应该阅读有关性能调优的书&#xff1f; 当我很久以前第一次面对这个问题时&#xff0c;我以为以后会做&#xff0c;但是我很长一段时间都没有回过头来。 仅当我在用Java编写的任务关键型服务器端财务应用程序中遇到严重的性能和可伸缩性问题时&a…

python为什么装不了pip_python自带pip用不了怎么办

可以通过以下命令来判断是否已安装&#xff1a;pip --version如果你还未安装&#xff0c;则可以使用以下方法来安装&#xff1a;$ curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py # 下载安装脚本$ sudo python get-pip.py # 运行安装脚本注意&#xff1a;用哪个…

成为Java流大师–第4部分:数据库流

SQL一直是一种声明性语言&#xff0c;而Java长期以来势在必行。 Java流改变了游戏规则。 通过本动手文章编写您的方式&#xff0c;并学习如何使用Java流对RDBMS数据库执行声明性查询&#xff0c;而无需编写任何SQL代码。 您会发现&#xff0c;Java流和SQL命令的动词之间有着惊人…

unsafehelper java_Java 9中将移除 Sun.misc.Unsafe

灾难将至&#xff0c;Java 9中将移除 Sun.misc.UnsafeOracle 正在计划在Java 9中去掉 sun.misc.Unsafe API。 这绝对将是一场灾难&#xff0c;有可能会彻底破坏整个 java 生态圈。 几乎每个使用 java开发的工具、软件基础设施、高性能开发库都在底层使用了 sun.misc.Unsafe。 下…

python 代码格式规范脚本_Python编码规范

Python自动化测试代码编码规范一、适用范围&#xff1a;本规则基础为Python标准PEP8&#xff0c;在此基础上加了我司测试部编码规范&#xff0c;适用于测试部所有Python脚本编写是采用的规则.二、编码&#xff1a;所有的 Python 脚本文件都应在文件头标上 # -*- coding:utf-8 -…

java 根据类名示例化类_如何使用示例从Java中的类路径加载资源

java 根据类名示例化类Java中的类路径不仅用于加载.class文件&#xff0c;而且还可以用于加载资源&#xff0c;例如属性文件&#xff0c;图像&#xff0c;图标&#xff0c;缩略图或任何二进制内容。 Java提供了API来将这些资源读取为InputStream或URL。 假设您在项目的config文…

java课程设计进程管理_Java课设总结(个人版)

使用物理引擎JBox2D完成游戏关卡的各个物理状态模拟根据物理引擎设计Bird,Pig,Brick等游戏中出现的可运动刚体类建立JBox2d的工具类以实现###本人对这次课设的看法与吐槽 1.课设内容的脑洞是我在看完17级学长的游戏课设之后想出的 当时还没学java网络编程的内容&#xff0c;误以…

二叉树层次遍历c语言_[LeetCode] 107. 二叉树的层次遍历 II

题目链接 : https://leetcode-cn.com/problems/binary-tree-level-order-traversal-ii/题目描述:给定一个二叉树&#xff0c;返回其节点值自底向上的层次遍历。 &#xff08;即按从叶子节点所在层到根节点所在的层&#xff0c;逐层从左向右遍历&#xff09;例如&#xff1a; 给…

使用测微计收集应用程序指标

什么是千分尺&#xff1f; 千分尺是一个简单的外观&#xff0c;用于以供应商中立的方式收集Java应用程序中的指标。 您可以考虑使用SLF4J作为指标。 Micrometer内置了对许多不同指标后端的支持&#xff0c;包括Atlas&#xff0c;Datadog&#xff0c;Elastic&#xff0c;JMX等。…

java鼠标左键按下后拖动实现多选_鼠标拖拽多选功能

鼠标拖拽多选功能*{box-sizing:border-box;}ul{width:500px;height:auto;margin:0;padding:20px;font-size: 0;/*需设置定位*/position:relative;}li{width:70px;height:70px;margin:10px;padding:0;display:inline-block;vertical-align: top;font-size: 13px;border:1px soli…

python epoll多路复用技术_python IO 多路复用 epoll简单模型

IO多路复用就是我们说的select poll epoll通过一种机制使一个进程能同时等待多个文件描述符&#xff0c;而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态&#xff0c;epoll()函数就可以返回。所以&#xff0c;IO多路复用&#xff0c;本质上不会有并发的功能&#…

python3多线程协程_python3-----多进程、多线程、多协程

目前计算机程序一般会遇到两类I/O&#xff1a;硬盘I/O和网络I/O。我就针对网络I/O的场景分析下python3下进程、线程、协程效率的对比。进程采用multiprocessing.Pool进程池&#xff0c;线程是自己封装的进程池&#xff0c;协程采用gevent的库。用python3自带的urlllib.request和…

Apache CXF 3.0:CDI 1.1支持替代Spring

几周前刚刚发布了Apache CXF 3.0 &#xff0c;该项目又迈出了满足JAX-RS 2.0规范要求的又一个重要步骤&#xff1a;与CDI 1.1集成。 在此博客文章中&#xff0c;我们将看几个有关Apache CXF 3.0和Apache CXF 3.0如何协同工作的示例。 从3.0版开始&#xff0c; Apache CXF包含一…

java varbinary_SQL 中存放 varbinary型数据

使用带有 BULK 选项的 OPENROWSET以下 Transact-SQL 增强功能支持 OPENROWSET(BULK...)函数&#xff1a;与 SELECT 一起使用的 FROM 子句可以调用 OPENROWSET(BULK...)而非表名&#xff0c;同时可以实现完整的 SELECT 功能。带有 BULK 选项的 OPENROWSET 在 FROM 子句中需要有一…