【大数据学习 | kafka高级部分】kafka的优化参数整理

1. 优化参数

参数解释
buffer.memoryRecordAccumulator 缓冲区总大小,默认 32m
batch.size默认 16k,sender线程拉取数据大小
linger.mssender线程拉取数据等待时长
acks确认应答 0 1 -1
max.in.flight.requests.per.connection没有ack返回时候可以发送几次数据
retriesproducer失败重试次数
enable.idempotence启幂等性,默认 true
compression.type生产者发送的所有数据的压缩方式
auto.leader.rebalance.enableleader是否自动切换
leader.imbalance.per.broker.percentageleader均衡比10%
leader.imbalance.check.interval.secondsleader均衡检测时间五分钟
log.segment.bytessegment大小
log.index.interval.bytes每4k生成一个索引数据,写入一次文件
log.cleanup.policy日志删除方式
log.retention.hours数据保存时长
enable.auto.commit自动提交
auto.commit.interval.ms提交间隔
auto.offset.reset初始化消费位置
offsets.topic.num.partitions__consumer_offsets分区数量
session.timeout.ms消费者断开超时时间
max.poll.records消费者拉取条数
fetch.max.bytes消费者拉取大小
partition.assignment.strategy消费者分区分配策略

2. 数据吞吐量和数据重复问题

数据在消费的时候可能会遇见数据堆积,无法及时消费计算的问题

这个时候可以适当的调节broker的数量和partition的数量,让多个机器帮助进行处理可提高吞吐量,并且分区越多消费者就可以适当增多,让消费速度得到很大的提升

适当增加每次拉取的大小也会增加消费速度。

max.poll.records  消费者拉取条数 
fetch.max.bytes  消费者拉取大小

kafka数据稳定性保证。

首先从producer出发

ack = 0 or ack = 1 会出现数据丢失问题

ack = -1 会出现数据重复问题

开始幂等性可以进行单分区去重

保证一批次数据稳定性可以开启事物

消费者部分如果是自动提交偏移量会出现重复消费问题,手动保存偏移量就不会出现这个问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/885197.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一篇Spring Boot 笔记

一、Spring Boot 简介 Spring Boot 是一个用于创建独立的、基于 Spring 的生产级应用程序的框架。它简化了 Spring 应用的初始搭建和开发过程,通过自动配置等功能,让开发者能够快速地构建应用,减少了大量的样板代码和复杂的配置。 二、核心特…

【MongoDB】MongoDB的Java API及Spring集成(Spring Data)

文章目录 Java APISpring 集成1. 添加依赖2. 配置 MongoDB3. 创建实体类4. 创建 Repository 接口5. 创建 Service 类6. 创建 Controller 类7. 启动 Spring Boot 应用8. 测试你的 API 更多相关内容可查看 Java API maven <dependency><groupId>org.mongodb</gr…

【人工智能】ChatGPT多模型感知态识别

目录 ChatGPT辅助细化知识增强&#xff01;一、研究背景二、模型结构和代码任务流程一&#xff1a;启发式生成 三、数据集介绍三、性能展示实现过程运行过程训练过程 ChatGPT辅助细化知识增强&#xff01; 多模态命名实体识别&#xff08;MNER&#xff09;最近引起了广泛关注。…

【嵌入式】STM32中的SPI通信

SPI是由摩托罗拉公司开发的一种通用数据总线&#xff0c;其中由四根通信线&#xff0c;支持总线挂载多设备&#xff08;一主多从&#xff09;&#xff0c;是一种同步全双工的协议。主要是实现主控芯片和外挂芯片之间的交流。这样可以使得STM32可以访问并控制各种外部芯片。本文…

map.computeIfAbsent() 与 map.putIfAbsent()的异同

map.computeIfAbsent() 和 map.putIfAbsent() 都是 java.util.Map 接口提供的方法&#xff0c;用于处理键值对的插入操作。它们在功能上有相似之处&#xff0c;但也有一些重要的区别。下面详细解释这两个方法的异同&#xff1a; map.putIfAbsent(K key, V value) 功能&#xf…

Python 常用数据容器(学习笔记)

文章目录 前言1、什么是数据容器&#xff1f;2、列表 (list)2.1 列表的定义和使用2.2 列表元素的访问2.3 列表的常用操作方法2.4 列表的循环遍历 3、元组 (tuple)3.1 元组的定义和使用3.2 元组的访问3.3 元组的常用操作方法3.4元组的循环遍历 4、字符串 (str)4.1 字符串的定义与…

【汽车租聘管理与推荐】Python+Django网页界面+推荐算法+管理系统网站

一、介绍 汽车租聘管理与推荐系统。本系统使用Python作为主要编程语言&#xff0c;前端采用HTML、CSS、BootStrap等技术搭建前端界面&#xff0c;后端采用Django框架处理用户的请求。创新点&#xff1a;使用协同过滤推荐算法实现对当前用户个性化推荐。 其主要功能如下&#…

快速入门CSS

欢迎关注个人主页&#xff1a;逸狼 创造不易&#xff0c;可以点点赞吗 如有错误&#xff0c;欢迎指出~ 目录 CSS css的三种引入方式 css书写规范 选择器分类 标签选择器 class选择器 id选择器 复合选择器 通配符选择器 color颜色设置 border边框设置 width/heigth 内/外边距 C…

uniapp实现H5和微信小程序获取当前位置(腾讯地图)

之前的一个老项目&#xff0c;使用 uniapp 的 uni.getLocation 发现H5端定位不准确&#xff0c;比如余杭区会定位到临平区&#xff0c;根据官方文档初步判断是项目的uniapp的版本太低。 我选择的方式不是区更新uniapp的版本&#xff0c;是直接使用高德地图的api获取定位。 1.首…

探索Python网络请求新纪元:httpx库的崛起

文章目录 **探索Python网络请求新纪元&#xff1a;httpx库的崛起**第一部分&#xff1a;背景介绍第二部分&#xff1a;httpx库是什么&#xff1f;第三部分&#xff1a;如何安装httpx库&#xff1f;第四部分&#xff1a;简单的库函数使用方法1. 发送GET请求2. 发送POST请求3. 超…

产品的四个生命周期,产品经理需深刻理解

在产品管理的世界里&#xff0c;产品就像有生命的个体&#xff0c;经历着从诞生到消亡的过程。作为产品经理&#xff0c;深刻理解产品的四个生命周期 —— 引入期、成长期、成熟期和衰退期&#xff0c;是打造成功产品的关键。 引入期&#xff1a;破局的起点 对于 B 端产品而言&…

TensorFlow|咖啡豆识别

&#x1f368; 本文为&#x1f517;365天深度学习训练营中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 &#x1f37a; 要求&#xff1a; 自己搭建VGG-16网络框架调用官方的VGG-16网络框架 &#x1f37b; 拔高&#xff08;可选&#xff09;&#xff1a; 验证集准…

《深入浅出Apache Spark》系列②:Spark SQL原理精髓全解析

导读&#xff1a;SQL 诞生于 20 世纪 70 年代&#xff0c;至今已有半个世纪。SQL 语言具有语法简单&#xff0c;低学习门槛等特点&#xff0c;诞生之后迅速普及与流行开来。由于 SQL 具有易学易用的特点&#xff0c;使得开发人员容易掌握&#xff0c;企业若能在其计算机软件中支…

需求分析管理

软件需求工程是包括创建和维护软件需求文档所必须得一切活动的过程&#xff0c;可以分为需求开发和需求管理两大工作。 需求开发过程&#xff08;四阶段&#xff09; 需求的分析(或者需求开发)过程包括&#xff0c;收集与获取需求&#xff0c;进行需求分析&#xff0c;定义需…

机器学习与深度学习-1-线性回归从零开始实现

机器学习与深度学习-1-线性回归从零开始实现 1 前言 ​ 内容来源于沐神的《动手学习深度学习》课程&#xff0c;本篇博客对线性回归从零开始实现&#xff08;即不调用封装好的库&#xff0c;如SGD优化器、MSE损失函数等&#xff09;进行重述&#xff0c;并且修改了沐神的课堂…

在 Sanic 中配置 Worker 并发数量的最佳实践

在 Sanic 中&#xff0c;您可以通过配置 worker 的数量来控制并发处理请求的能力。Sanic 是一个异步的 Python Web 框架&#xff0c;允许您创建高性能的 HTTP 服务器。您可以通过以下几个步骤来设置和管理一个 worker 的并发数量。 1. Worker 数量 在 Sanic 中&#xff0c;您…

点云从入门到精通技术详解100篇-基于结构光测量的三维人脸重建及识别(中)

目录 2.1.2 投影光栅几何标定模型建立 2.1.2.1 线性相位——高度模型 2.1.2.2 非线性相位——高度模型 2.1.2.3 三角立体模型 2.1.3 系统参数标定 2.1.3.1 摄像机模型 2.1.3.2 系统参数标定 2.2 基于结构光的三维人脸重建技术 2.2.1 人脸条纹图技术分析 2…

VMware虚拟机可以被外部机器访问吗?

如何设置让同局域网内其他机器访问本地虚拟机服务&#xff08;这里以访问我本地虚拟机ELasticSearch服务为例&#xff09; 选中虚拟机 - 虚拟机 - 设置 虚拟机网络设置&#xff1a; 选中网络适配器&#xff0c;修改网络模式为NAT模式 编辑 - 虚拟机网络编辑器 更改设置 …

【论文复现】自动化细胞核分割与特征分析

本文所涉及所有资源均在这里可获取。 作者主页&#xff1a; 七七的个人主页 文章收录专栏&#xff1a; 论文复现 欢迎大家点赞 &#x1f44d; 收藏 ⭐ 加关注哦&#xff01;&#x1f496;&#x1f496; 自动化细胞核分割与特征分析 引言效果展示HoverNet概述HoverNet原理分析整…

【NOIP普及组】质因数分解

【NOIP普及组】质因数分解 C语言代码C代码Java代码Python代码 &#x1f490;The Begin&#x1f490;点点关注&#xff0c;收藏不迷路&#x1f490; 已知正整数 n 是两个不同的质数的乘积&#xff0c;试求出较大的那个质数。 输入 输入只有一行&#xff0c;包含一个正整数…