卡夫卡–一次语义学

在分布式环境中,故障是很常见的情况,可以随时发生。 在Kafka环境中,代理可能会崩溃,网络故障,处理故障,发布消息时失败或无法使用消息等。这些不同的场景引入了不同类型的数据丢失和重复。

失败场景

A(确认失败):生产者成功发布了消息,重试> 1,但由于失败而未收到确认。 在这种情况下,生产者将重试相同的消息,可能会引入重复消息。

B(生产者进程在批处理消息中失败):生产者发送了一批失败的消息,但发布的成功很少。 在这种情况下,一旦生产者重新启动,它将再次批量重新发布所有消息,这将在Kafka中引入重复消息。

C(触发并忘记失败)生产者发布的消息,重试= 0(触发并忘记)。 如果失败,发布的消息将不知道并发送下一条消息,这将导致消息丢失。

D(批处理消息中的消费者失败)消费者从Kafka接收到一批消息,并手动提交其偏移量(enable.auto.commit = false)。 如果消费者在提交给Kafka之前失败,则下次消费者将再次使用相同的记录,这些记录将在消费者端复制副本。

精确一次语义

在这种情况下,即使生产者尝试重新发送消息,它也导致消息将被消费者发布和消费一次。

为了在Kafka中实现Exactly-Once语义,它使用以下3个属性

  1. enable.idempotence = true(地址a,b和c)
  2. MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION = 5(生产者每次连接总是有一个飞行中请求)
  3. isolated.level = read_committed(地址d)

启用幂等(enable.idempotence = true)

幂等传递使生产者可以在单个生产者的生命周期内,将消息仅一次写入Kafka到主题的特定分区,而不会造成数据丢失和每个分区的订单。

“请注意,启用幂等性要求MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION小于或等于5,RETRIES_CONFIG大于0且ACKS_CONFIG为'all'。 如果用户未明确设置这些值,则将选择合适的值。 如果设置了不兼容的值,将抛出ConfigException”

为了实现幂等性,Kafka在生成消息时使用唯一的ID(称为产品ID或PID和序列号)。 生产者在发布的每个消息上保持递增的序列号,这些消息具有唯一的PID。 代理始终将当前序列号与前一个序列号进行比较,如果新序列号不比上一个序列号大+1,则它会拒绝,这会避免重复;如果消息中丢失了更大的序列号,则会拒绝同时显示

在失败的情况下,代理将序列号与先前的序列号进行比较,如果序列不增加,+ 1将拒绝该消息。

交易(隔离级别)

事务使我们能够自动更新多个主题分区中的数据。 事务中包含的所有记录都将被成功保存,或者没有保存成功,它允许您将同一个事务中的消费者补偿与已处理的数据一起提交,从而允许端到端的一次精确语义。

生产者不等待将消息写到kafka上,生产者使用beginTransaction,commitTransaction和abortTransaction(如果发生故障)消费者使用isolate.level级别,无论是read_committed还是read_uncommitted

  • read_committed:使用者将始终仅读取已提交的数据。
  • read_uncommitted:以偏移顺序读取所有消息,而无需等待事务提交

如果具有Isolation.level = read_committed的使用者到达尚未完成的事务的控制消息,它将不会再从该分区传递任何消息,直到生产者提交或中止该事务或发生事务超时。 事务超时由生产者使用配置transaction.timeout.ms(默认为1分钟)确定。

生产者和消费者中的确切时间

在正常情况下,生产者和消费者是分开的。 生产者必须具有幂等性并同时管理事务,以便消费者可以使用isolation.level读取read_committed以使整个过程成为原子操作。 这样可以确保生产者将始终与源系统同步。 即使生产者崩溃或事务中止,它也始终是一致的,并且一次将消息或一批消息发布为一个单元。

同一用户一次将收到消息或一批消息。

在Exactly-Once中,语义生产者与消费者一起将作为原子操作出现,它将作为一个单元进行操作。 要么发布一次就被消耗掉,要么中止。

在Kafka Stream中恰好一次

Kafka Stream消耗来自主题A的消息,处理消息并将其发布到主题B,并在发布后使​​用commit(commit主要在后台运行)将所有状态存储数据刷新到磁盘。

Kafka Stream中的“一次”是“读取-处理-写入”模式,可确保将这些操作视为原子操作。 由于Kafka Stream可以满足生产者,消费者和交易的需求,因此Kafka Stream带有特殊的参数processing.guarantee,它可以完全地_once或at_least_once使得不单独处理所有参数变得容易。

Kafka Streams原子地更新使用者偏移量,本地状态存储,状态存储changelog主题和生产以一起输出所有主题。 如果这些步骤中的任何一个失败,则所有更改都将回滚。

processing.guarantee:确切地提供一次以下参数,您无需明确设置

  1. isolated.level = read_committed
  2. enable.idempotence = true
  3. MAX_IN_FLIGHT_REQUESTS_PER_CONNECTION = 5

翻译自: https://www.javacodegeeks.com/2020/05/kafka-exactly-once-semantics.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/339923.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android 打印机蜂鸣器,CANON喷墨打印机 蜂鸣器响5声不打印的问题解决办法

CANON喷墨打印机 蜂鸣器响5声不打印的问题解决办法通常我们如果遇到CANON打印机蜂鸣器响5声即表示废墨仓满,一般都可以通过按键且使用02、03、05墨盒的机型按下面方法操作:同时按住左、右两键,插入电源,然后松开两键;按…

python病毒usb文件自动安装_win7禁USB自动安装驱动功能避免木马病毒入侵

用户在限制USB设备使用方面,首先考虑的就是禁止其自动播放,以避免木马病毒入侵,但很多时候,这样的方法并不是很有效。如果你是Win7用户,那就可以通过它独有的“权限控制”技术,从源头上控制USB设备的自动运…

java错误代码典型案例_Java代码中的典型错误

java错误代码典型案例该页面包含在与我一起工作的人的Java代码中看到的最典型的错误。 静态分析(出于明显的原因,我们使用查询无法捕获所有错误,这就是为什么我决定在此处列出所有错误的原因。 如果您要在此处添加其他内容,请告诉…

tinymce vue 部分工具不显示_tinymce-vue使用问题及解决记录

一、本地图片上传:1.转成base64,转换后的字符粘贴到notpadd中看了下,有近20万个字符,所以直接没考虑2.选择图片后调用后台方法传到服务器,保存后返回一个网络地址,传入success的回调方法,通过网…

清洁单元测试

使用JUnit和一些模拟库编写“单元测试”测试很容易。 即使测试甚至不是单元测试并提供可疑的价值,它们也可能产生使某些涉众满意的代码覆盖范围。 编写单元测试(在理论上是单元测试,但比基础代码更复杂)因此也很容易编写&#xff…

谷歌发布android+8.2,谷歌Pixel 2代三款新机齐曝光:骁龙835+Android 8.0

随着5月份谷歌I/O大会的临近,关于Android O(安卓8.0)和Pixel手机的消息逐渐多了起来。据外媒报道, Android Open Source Project的代码表中确认,三款Pixel新机搭载的都是MSM8998芯片,也就是骁龙835。目前,Pixel 2的代号…

怎么停止skywalking_Skywalking部署常见问题以及注意事项

Skywalking部署常见问题以及注意事项IntroSkyWalking 创建与2015年,提供分布式追踪功能。从5.x开始,项目进化为一个完成功能的Application Performance Management系统。他被用于追踪、监控和诊断分布式系统,特别是使用微服务架构&#xff0c…

akka的介绍_Akka笔记–演员介绍

akka的介绍过去做过多线程的任何人都不会否认管理多线程应用程序有多么艰辛和痛苦。 我说管理是因为它开始很简单,一旦您开始看到性能改进,它就会变得非常有趣。 但是,当您发现没有一种简单的方法可以从子任务中的错误或难以发现的僵尸错误中…

HTML语言name,HTML a 标签的 name 属性

延伸阅读:使用 name 属性还是 id 属性?在 HTML 4.0 之前的版本中,只有使用 标签的 name 属性才能创建片段标识符。随着 HTML 4.0 中 id 属性的出现,所有 HTML 或 XHTML 元素都可以是片段标识符。这是因为 id 标识符几乎可以用在所…

使用模拟进行测试

如果使用正确的方法,模拟对象将非常有用。 我在需要驱动软件开发使用的帖子中分享了一些使用Mock Objects的经验。 在这篇文章中,我分享了两件事 –使用模拟进行基于合同的测试。 –用于组织模拟代码的模式。 基于合同的测试 让我们以正在构建汇款服…

hazelcast_Hazelcast的MapLoader陷阱

hazelcastHazelcast提供的核心数据结构之一是IMap<K, V> &#xff0c;它扩展了java.util.concurrent.ConcurrentMap &#xff0c;它基本上是一个分布式地图&#xff0c;通常用作缓存。 您可以将此类地图配置为使用自定义MapLoader<K, V> -每次尝试从该地图&#xf…

html ul左侧浮动,UL里的LI元素左浮动层一行显示时使其居中的方法

在制作页面是&#xff0c;li浮动是很常用的&#xff0c;一般情况也不用其居中&#xff0c;但有时&#xff0c;其特殊原因需要居中&#xff0c;这是就有点犯难了&#xff0c;这里有了一个很好的解决方法&#xff0c;主要是用了相对定位的原理。在ul外报一层&#xff0c;使其相对…

aws s3 獲取所有文件_AWS SA associate 证书考试学习记录-EBS,S3,EFS比较

我们的目标&#xff0c;就是花最少的时间&#xff0c;学到最多的东西&#xff1a;-&#xff09;在AWS中&#xff0c;可以选择的存储服务很多&#xff0c;纷繁复杂&#xff0c;新手根本弄不清楚选择哪个。因为做为一个云架构师&#xff0c;你并不是让你的产品能用就够了&#xf…

ios调用restful接口_做iOS上最好的REST API测试App

对于Web开发者和移动应用开发者来说&#xff0c;少不了和REST API打交道。何为REST API&#xff0c;维基百科是这么解释的(https://zh.wikipedia.org/wiki/REST)REST(英文&#xff1a;Representational State Transfer)是Roy Thomas Fielding博士于2000年在他的博士论文中提出来…

Java 14:记录

Java 14是在几周前问世的&#xff0c;它引入了Record类型&#xff0c;它是一个不变的数据载体类&#xff0c;旨在容纳一组固定的字段。 请注意&#xff0c;这是预览语言功能 &#xff0c;这意味着必须使用--enable-preview标志在Java编译器和运行时中显式启用它。 我将直接介绍…

html设置顶部对齐,HTML / CSS文本从div顶部对齐

首先&#xff0c;你需要修复你的CSS选择器 .你可以通过这种方式t write all those id .#content #main #services只需选择1个元素和他的孩子 .例如&#xff0c;如果你测试它&#xff0c;它将适用于你&#xff1a;#services .langelis .txt {width: 440px;height: auto;float: l…

java与java ee_计划Java EE 7批处理作业

java与java eeJava EE 7添加了使用JSR 352以标准方式执行批处理作业的功能。 <job id"myJob" xmlns"http://xmlns.jcp.org/xml/ns/javaee" version"1.0"><step id"myStep"><chunk item-count"3"><rea…

html5 video 播放状态,10分钟了解HTML5的Video标签属性、方法和事件

标签的属性src &#xff1a;视频的属性poster&#xff1a;视频封面&#xff0c;没有播放时显示的图片preload&#xff1a;预加载autoplay&#xff1a;自动播放loop&#xff1a;循环播放controls&#xff1a;浏览器自带的控制条width&#xff1a;视频宽度height&#xff1a;视频…

hot编码 字符one_One Hot编码是什么?为什么要用它,什么时候用它?

作者&#xff1a;Rakshith Vasudev编译&#xff1a;ronghuaiyang导读当你在玩ML模型的时候&#xff0c;你会在任何地方遇到这个“One hot encoding”的术语。当你在玩ML模型的时候&#xff0c;你会在任何地方遇到这个“One hot encoding”术语。你可以看到一个one hot编码器的s…

CUBA 7.2 –有什么新功能?

CUBA平台的第七版向前迈出了一大步。 内部体系结构的改进和新的IDE为进一步改进奠定了良好的基础。 我们将继续添加新功能&#xff0c;以使开发人员的生活更轻松&#xff0c;并使他们的工作更加高效。 在7.2版中&#xff0c;我们引入了许多可能看起来像是主要更新的更改&#…