Kafka常见面试问题

1、Kafka分区设计及主副本如何同步

Apache Kafka是一种分布式流处理平台,它使用分布式复制协议来实现高可用性和容错性。在Kafka中,每个主题(topic)都有一个或多个分区(partition),每个分区都有一组副本(replica),其中一个是主副本(leader),其余的是从副本(follower)。主副本负责处理来自消费者的所有读写请求,而从副本则扮演备份的角色,并在主副本出现故障时接管其职责。

主副本同步:

  • Kafka的每个分区都有一个指定的副本,称为“初始副本”(initial replica)。这个初始副本是由Kafka在创建分区时指定的。
  • 当消费者向Kafka发送消息时,消息首先被写入到该分区的初始副本中。
  • 初始副本收到消息后,会将其复制到其他从副本中,实现副本的同步。
  • 当所有的从副本都成功接收并存储了消息后,初始副本会向Kafka发送一个“消息已提交”(message committed)的响应给消费者。

2、Kafka如何选主

  • Kafka使用一种称为“领导者选举”(leader election)的机制来选出每个分区的领导者(主副本)。
  • 在Kafka集群中,每个节点都有一个选举代理(election proxy),它负责参与领导者选举过程。
  • 当一个分区创建时,初始副本被选为该分区的领导者。
  • 如果初始副本失效,选举代理会发现并通知其他存活的副本参与领导者选举。
  • 存活的从副本会投票选举一个新的领导者。获得超过一半票数的副本会被选为新的领导者。
  • 如果所有的从副本都失效,选举代理会重新选出新的初始副本作为领导者。

3、如果有多个broken故障,是会选哪个

Kafka的生产者使用一个负载均衡机制来分配消息到不同的broker。这个负载均衡机制可以基于各种因素,例如每个broker的可用带宽、处理能力、存储容量等。

当生产者向Kafka发送消息时,它会与Kafka的代理服务器(broker)建立连接,并由代理服务器负责将消息路由到正确的分区。代理服务器会根据负载均衡机制选择一个存活的分区,并将消息发送到该分区。如果多个broker出现故障,存活的代理服务器会选择一个存活的分区来处理消息。

因此,生产者并不直接选择发送消息到哪个broker,而是通过Kafka的负载均衡机制来自动分配消息到存活的broker上。这样可以确保消息的可靠性和容错性,并且可以有效地利用Kafka集群的资源。

4、kafka如何保证一致性

Kafka保持一致性的方式有很多,其中包括:

  1. 采用分布式副本集(replica set)来保证数据的一致性。Kafka将消息复制到多个副本中,当一个副本失效时,另一个副本可以接管它的工作,从而保证数据的完整性。
  2. Kafka至少保证消息被传递给消费者一次。生产者写入消息到Kafka时,会等待消息被持久化并复制到ISR(in-sync replica)中的副本,并返回一个确认(ack)给生产者。只有当所有ISR中的副本都完成了消息的复制后,消息才被认为是提交成功的,生产者才会收到确认。这样可以确保消息的可靠性,但也可能出现消息重复传递的情况。
  3. 消费者的消费位置(consumer offset)由消费者在消费消息时记录,并提交到Kafka,以便在重启或故障恢复后继续消费。Kafka会将消息的偏移量持久化,保证在故障发生时可以对未消费的消息进行重播。

5、什么情况下rebalance

Kafka Rebalance 是 Kafka 社区中用于重新分配分区以便平衡消费者组中消费者负载的一种机制它会在消费者组发生变化时发生,例如当消费者加入或离开组时

Kafka Rebalance 的工作原理如下:

  1. 检测到消费者组发生变化后,协调者会开始重新平衡过程。
  2. 协调者会根据分区策略(例如轮询或按权重分配)将分区重新分配给组中的消费者。
  3. 协调者将新的分区分配方案发送给所有组成员。
  4. 消费者接收到新的分配方案后,会根据方案调整它们订阅的分区。
  5. 当所有消费者都完成了分区调整后,重新平衡过程结束。

Kafka Rebalance 的主要目的是确保消费者组中的负载均衡分布,以便充分利用集群资源并提高吞吐量。然而,它也可能导致短暂的延迟,因为消费者需要重新平衡分区并重新开始消费数据。因此,在设计和部署 Kafka 集群时,需要考虑 Rebalance 对应用程序性能的影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/170741.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

黑马点评-Feed流的实现方案,基于推拉结合模式实现笔记推送

Feed流实现方案 我们关注了博主之后,当用户发布了动态后我们应该把这些数据推送给粉丝,关注推送也叫作Feed(投喂)流,通过无限下拉刷新获取新的信息 传统的模式内容检索: 粉丝需要主动通过搜索引擎或者是其他方式去查找想看的内容新型Feed流的效果: 系统分析用户到底想看什么,…

高效的绩效面谈有哪些特点?

目前许多企业有相应的考核制度,绩效管理投入力度也较大,然而仅仅开展考核,很难促进绩效的质变提高,要如何去总结过去的不足、如何针对个体的特点制定下一步的工作计划?绩效面谈是解决以上问题的良策。 若不进行及时且…

【UGUI】中Content Size Fitter)组件-使 UI 元素适应其内容的大小

官方文档:使 UI 元素适应其内容的大小 - Unity 手册 必备组件:Content Size Fitter 通常,在使用矩形变换定位 UI 元素时,应手动指定其位置和大小(可选择性地包括使用父矩形变换进行拉伸的行为)。 但是&a…

突破技术障碍:软件工程师如何应对项目中的难题?

在软件开发项目中,工程师常常会遇到各种技术难题。这些难题可能涉及到复杂的算法、不兼容的系统、难以预见的软件行为,或者其他许多方面。 以下是一些策略和方法,可以帮助软件工程师有效地应对这些挑战: 1、理解问题:…

第十六章 处理空字符串和 Null 值

文章目录 第十六章 处理空字符串和 Null 值空字符串和 Null 值的默认映射导出值控制空元素的形式 第十六章 处理空字符串和 Null 值 类和属性参数 XMLUSEEMPTYELEMENT XMLIGNORENULL XMLNILNOOBJECT XMLNIL 空字符串和 Null 值的默认映射 下表总结了空字符串和 null 值的…

count=0语句的位置

简洁一点的代码: 像count0这种语句要注意放好位置,尤其是在循环里。

SAP Smartform小结

SAP系统做打印单据用的, 感觉很不好用, 特别是要嵌入韩文时必须使用嵌入的word编辑器,运行速度简直不可忍受. 见过一些Adobe interactive form的示例, 看着相当不错, 不过据说需要花money额外买licence, 哪有smartform这种免费东西来得实惠. 一般打印需求,会要求有标题抬头,打…

mmsegmentation学习笔记

mmsegmentation教程 下载预训练权重 github–>mmsegmentation–>model zoo–>XXX model(如:PSPNet)–>找到预选连权重与config的前缀一致:pspnet_r50-d8_4xb2-40k_cityscapes-512x1024 (model) 了解配置文件 查看…

TikTok 将开源“云中和”边缘加速器

“从某种意义上说,我们正在努力破解云的骨干网,以造福于我们,”TikTok产品管理基础设施经理Vikram Siwach指出,他解释了该公司即将开源的“全球服务加速器”的好处,这是一个可编程的边缘平台,可将应用程序需…

JavaScript 中松散类型的理解

JavaScript 是一种动态类型语言,它的松散类型是其独特的特性之一。本文将深入探讨 JavaScript 中松散类型的概念以及如何在代码中应用。 引言 JavaScript 是一种强大而灵活的语言,它的松散类型使得变量的类型可以在运行时动态改变。这为开发人员带来了…

Linux常用命令——bg命令

在线Linux命令查询工具 bg 用于将作业放到后台运行 补充说明 bg命令用于将作业放到后台运行,使前台可以执行其他任务。该命令的运行效果与在指令后面添加符号&的效果是相同的,都是将其放到系统后台执行。 在Linux系统中执行某些操作时候&…

【通讯协议】gRPC和Webhook

RPC(Remote procedure Call)之所以被称为“远程”,是因为在微服务架构下,当服务部署到不同的服务器上时,它可以实现远程服务之间的通信。从用户的角度来看,它的作用就像本地函数调用。 下图说明了gRPC的整…

【漏洞复现】Array VPN任意文件读取漏洞

漏洞描述 华耀(中国)科技有限公司(简称:Array)于2003年创建于北京,是优秀的网络功能平台解决方案提供商,也是应用交付解决方案、移动应用接入(SSL VPN)解决方案的全球领导者。华耀现有员工200余人,其中研发团队占到100余人,总部位于北京。并在北京、上海、广州、杭…

[Android]常见的数据传递方式

Demo:https://github.com/Gamin-fzym/DataTransferDemo 1.Intent 发送页面 A 到页面 B 的 Intent 时,可以通过 Intent 的 putExtra() 方法将数据附加到 Intent 上。 在页面 B 中,通过 Intent 的 getXXXExtra() 方法获取传递的数据。 1).在A页面发送 …

文件属性和路径

文件属性 我们先补充一个知识: 任何新建的文件刚开始都是在磁盘上的 假设我们在文件夹中新建一个1.txt文本文档,他的大小是0KB,但是不能说明这个文件不占用磁盘空间 文件由 文件属性文件内容 组成,这里只能说明文件内容是空 文件…

用户增长常用的ChatGPT通用提示词模板

用户画像:请帮助我了解目标用户的特点和需求,包括年龄、性别、职业、兴趣等方面的内容,以便我能够更好地定位和推广。 用户获取渠道:请帮助我了解用户主要从哪些渠道获取我们的产品或服务,以便我能够更好地优化获取渠…

嵌入式硬件基础知识——1

目录 SOC、MCU、MPU、CPU SPI STM32的时钟系统 can是什么 串口和并口 传感器输出引脚高阻抗好还是低阻抗好? iic 运算放大器特点 MOS管和三极管 同步电路和异步电路 SOC、MCU、MPU、CPU SOC 片上系统 手机的核心芯片 MCU 微控系统 单片机 MPU 嵌入式微处…

美国季节性干旱数据集

美国季节性干旱数据集 美国干旱展望栅格数据集由国家气象局气候预测中心生成。它在每个月的最后一天发布,提供下个月的干旱前景信息。“美国季节性干旱展望”数据集每月发布一次,特别是每月的第三个星期四。该数据集对美国不同地区发生干旱的可能性进行…

MySQL性能优化,SQL调优,SQL调优的手段

文章目录 对MySQL性能的优化的理解硬件和操作系统层面的优化架构设计层面的优化MySQL程序配置优化SQL优化 SQL调优有哪几种方式1.EXPLAIN2.SQL语句中IN包含的值不应过多3.SELECT语句务必指明字段名称4.当只需要一条数据的时候,使用limit 15.如果排序字段没有用到索引…

vue.config.js

proxy代理 proxy选项用于配置开发服务器的代理。下面是proxy的全部属性: 1. target (String | Object | Function): 指定要代理的目标主机的URL。可以是一个字符串,也可以是一个对象或函数,用于动态返回目标URL。 2. forward (Boolean): 控…