Kafka集群部署搭建完美标准版

Kafka集群部署并启动

在本文中将从演示如何搭建一个Kafka集群开始,然后简要介绍一下关于Kafka集群的一些基础知识点。但本文仅针对集群做介绍,对于Kafka的基本概念不做过多说明,这里假设读者拥有一定的Kafka基础知识。

首先,我们需要了解Kafka集群的一些机制:

  • Kafka是天然支持集群的,哪怕是一个节点实际上也是集群模式
  • Kafka集群依赖于Zookeeper进行协调,并且在早期的Kafka版本中很多数据都是存放在Zookeeper的
  • Kafka节点只要注册到同一个Zookeeper上就代表它们是同一个集群的
  • Kafka通过brokerId来区分集群中的不同节点

Kafka的集群拓扑图如下:
Kafka集群搭建及必知必会

Kafka集群中的几个角色:

  • Broker:一般指Kafka的部署节点
  • Leader:用于处理消息的接收和消费等请求,也就是说producer是将消息push到leader,而consumer也是从leader上去poll消息
  • Follower:主要用于备份消息数据,一个leader会有多个follower

在本例中,为了更贴近实际的部署情况,使用了四台虚拟机作演示:

机器IP主机名角色brokerId
192.168.99.1masterbroker server0
192.168.99.2slave1broker server1
192.168.99.3slave2broker server2
192.168.99.4slave3集群协调者

Zookeeper安装

Kafka是基于Zookeeper来实现分布式协调的,所以在搭建Kafka节点之前需要先搭建好Zookeeper节点。而Zookeeper和Kafka都依赖于JDK,我这里已经事先安装好了JDK:

[root@192.168.99.4 ~]# java --version
java 11.0.5 2019-10-15 LTS
Java(TM) SE Runtime Environment 18.9 (build 11.0.5+10-LTS)
Java HotSpot(TM) 64-Bit Server VM 18.9 (build 11.0.5+10-LTS, mixed mode)
[root@txy-server2 ~]#

准备好JDK环境后,到Zookeeper的官网下载地址,复制下载链接:

  • https://zookeeper.apache.org/releases.html#download

然后到Linux中使用wget命令进行下载,如下:

[root@192.168.99.4 ~]# cd /usr/local/src
[root@192.168.99.4 /usr/local/src]# wget https://archive.apache.org/dist/zookeeper/zookeeper-3.6.1/apache-zookeeper-3.6.1-bin.tar.gz

解压下载好的压缩包,并将解压后的目录移动和重命名:

[root@192.168.99.4 /usr/local/src]# tar -zxvf apache-zookeeper-3.6.1-bin.tar.gz
[root@192.168.99.4 /usr/local/src]# mv apache-zookeeper-3.6.1-bin ../zookeeper

进入到Zookeeper的配置文件目录,将zoo_sample.cfg这个示例配置文件拷贝一份并命名为zoo.cfg,这是Zookeeper默认的配置文件名称:

[root@192.168.99.4 /usr/local/src]# cd ../zookeeper/conf/
[root@192.168.99.4 /usr/local/zookeeper/conf]# ls
configuration.xsl  log4j.properties  zoo_sample.cfg
[root@192.168.99.4 /usr/local/zookeeper/conf]# cp zoo_sample.cfg zoo.cfg

修改一下配置文件中的dataDir配置项,指定一个磁盘空间较大的目录:

[root@192.168.99.4 /usr/local/zookeeper/conf]# vim zoo.cfg
# 指定Zookeeper的数据存储目录,类比于MySQL的dataDir
dataDir=/data/zookeeper
[root@192.168.99.4 /usr/local/zookeeper/conf]# mkdir -p /data/zookeeper
  • 如果只是学习使用的话,这一步其实可以忽略,采用默认配置即可

接下来就可以进入bin目录,使用启动脚本来启动Zookeeper了,如下示例:

[root@192.168.99.4 /usr/local/zookeeper/conf]# cd ../bin/
[root@192.168.99.4 /usr/local/zookeeper/bin]# ./zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/local/zookeeper/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@192.168.99.4 /usr/local/zookeeper/bin]#

启动完成后,可以通过查看是否正常监听端口号来判断是否启动成功,如下则是启动成功了:

[root@192.168.99.4 ~]# netstat -lntp |grep 2181
tcp6       0      0 :::2181       :::*         LISTEN      7825/java
[root@192.168.99.4 ~]#

如果你的机器开启了防火墙的话,则需要开放Zookeeper的端口,否则其他节点无法注册上来:

[root@192.168.99.4 ~]# firewall-cmd --zone=public --add-port=2181/tcp --permanent
[root@192.168.99.4 ~]# firwall-cmd --reload

Kafka安装

安装完Zookeeper后,接下来就可以安装Kafka了,同样的套路首先去Kafka的官网下载地址,复制下载链接:

  • https://zookeeper.apache.org/releases.html#download

然后到Linux中使用wget命令进行下载,如下:

[root@192.168.99.1 ~]# cd /usr/local/src
[root@192.168.99.1 /usr/local/src]# wget https://mirror.bit.edu.cn/apache/kafka/2.5.0/kafka_2.13-2.5.0.tgz

解压下载好的压缩包,并将解压后的目录移动和重命名:

[root@192.168.99.1 /usr/local/src]# tar -xvf kafka_2.13-2.5.0.tgz
[root@192.168.99.1 /usr/local/src]# mv kafka_2.13-2.5.0 ../kafka

进入Kafka的配置文件目录,修改配置文件:

[root@192.168.99.1 /usr/local/src]# cd ../kafka/config/
[root@192.168.99.1 /usr/local/kafka/config]# vim server.properties
# 指定该节点的brokerId,同一集群中的brokerId需要唯一
broker.id=0
# 指定监听的地址及端口号,该配置项是指定内网ip
listeners=PLAINTEXT://192.168.99.1:9092
# 如果需要开放外网访问,则在该配置项指定外网ip
advertised.listeners=PLAINTEXT://192.168.99.1:9092
# 指定kafka日志文件的存储目录
log.dirs=/usr/local/kafka/kafka-logs
# 指定zookeeper的连接地址,若有多个地址则用逗号分隔
zookeeper.connect=192.168.99.4:2181
[root@192.168.99.1 /usr/local/kafka/config]# mkdir /usr/local/kafka/kafka-logs

在完成配置文件的修改后,为了方便使用Kafka的命令脚本,我们可以将Kafka的bin目录配置到环境变量中:

[root@192.168.99.1 ~]# vim /etc/profile
export KAFKA_HOME=/usr/local/kafka
export PATH=$PATH:$KAFKA_HOME/bin
[root@192.168.99.1 ~]# source /etc/profile  # 让配置生效

这样就可以使用如下命令启动Kafka了:

[root@192.168.99.1 ~]# kafka-server-start.sh /usr/local/kafka/config/server.properties &

执行以上命令后,启动日志会输出到控制台,可以通过日志判断是否启动成功,也可以通过查看是否监听了9092端口来判断是否启动成功:

[root@192.168.99.1 ~]# netstat -lntp |grep 9092
tcp6    0     0 192.168.99.1:9092     :::*      LISTEN     31943/java
[root@192.168.99.1 ~]#

同样的,开启了防火墙的话,还需要开放相应的端口号:

[root@192.168.99.1 ~]# firewall-cmd --zone=public --add-port=9092/tcp --permanent
[root@192.168.99.1 ~]# firwall-cmd --reload

到此为止,我们就完成了第一个Kafka节点的安装,另外两个节点的安装步骤也是一样的,只需要修改一下配置文件中的brokerId和监听的ip就好了。所以我这里直接将该节点中的Kafka目录拷贝到另外两台机器上:

[root@192.168.99.1 ~]# rsync -av /usr/local/kafka 172.21.254.169:/usr/local/kafka
[root@192.168.99.1 ~]# rsync -av /usr/local/kafka 172.21.254.170:/usr/local/kafka

然后修改一下这两个节点的brokerId和监听的ip:

[root@192.168.99.2 /usr/local/kafka/config]# cd /usr/local/kafka/kafka/config
[root@192.168.99.2 /usr/local/kafka/config]# vim server.properties
# 修改brokerId
broker.id=1
# 指定监听的地址及端口号,该配置项是指定内网ip
listeners=PLAINTEXT://192.168.99.2:9092
# 如果需要开放外网访问,则在该配置项指定外网ip
advertised.listeners=PLAINTEXT://192.168.99.2:9092
[root@192.168.99.2 /usr/local/kafka/config]# 
[root@192.168.99.1 ~]# vim /etc/profile
export KAFKA_HOME=/usr/local/kafka
export PATH=$PATH:$KAFKA_HOME/bin
[root@192.168.99.1 ~]# source /etc/profile  # 让配置生效
[root@192.168.99.1 ~]# /usr/local/kafka/kafka/bin/kafka-server-start.sh /usr/local/kafka/kafka/config/server.properties &
[root@192.168.99.2 /usr/local/kafka/config]# cd /usr/local/kafka/kafka/config
[root@192.168.99.3 /usr/local/kafka/config]# vim server.properties
# 修改brokerId
broker.id=2
# 指定监听的地址及端口号,该配置项是指定内网ip
listeners=PLAINTEXT://192.168.99.3:9092
# 如果需要开放外网访问,则在该配置项指定外网ip
advertised.listeners=PLAINTEXT://192.168.99.3:9092
[root@192.168.99.3 /usr/local/kafka/config]# 
[root@192.168.99.1 ~]# vim /etc/profile
export KAFKA_HOME=/usr/local/kafka
export PATH=$PATH:$KAFKA_HOME/bin
[root@192.168.99.1 ~]# source /etc/profile  # 让配置生效
[root@192.168.99.1 ~]# /usr/local/kafka/kafka/bin/kafka-server-start.sh /usr/local/kafka/kafka/config/server.properties &

配置修改完成后,按之前所介绍的步骤启动这两个节点。启动成功后进入Zookeeper中,在/brokers/ids下有相应的brokerId数据代表集群搭建成功:

[root@192.168.99.4 ~]# /usr/local/zookeeper/bin/zkCli.sh
[zk: localhost:2181(CONNECTED) 4] ls /brokers/ids
[0, 1, 2]
[zk: localhost:2181(CONNECTED) 5]

Kafka副本集

关于Kafka的副本集:

  • Kafka副本集是指将日志复制多份,我们知道Kafka的数据是存储在日志文件中的,这就相当于数据的备份、冗余
  • Kafka可以通过配置设置默认的副本集数量
  • Kafka可以为每个Topic设置副本集,所以副本集是相对于Topic来说的

一个Topic的副本集可以分布在多个Broker中,当一个Broker挂掉了,其他的Broker上还有数据,这就提高了数据的可靠性,这也是副本集的主要作用。

我们都知道在Kafka中的Topic只是个逻辑概念,实际存储数据的是Partition,所以真正被复制的也是Partition。如下图:
Kafka集群搭建及必知必会

关于副本因子:

  • 副本因子其实决定了一个Partition的副本数量,例如副本因子为1,则代表将Topic中的所有Partition按照Broker的数量复制一份,并分布到各个Broker上

副本分配算法如下:

  • 将所有N Broker和待分配的i个Partition排序
  • 将第i个Partition分配到第(i mod n)个Broker上
  • 将第i个Partition的第j个副本分配到第((i + j) mod n)个Broker上

Kafka节点故障原因及处理方式

Kafka节点(Broker)故障的两种情况:

  • Kafka节点与Zookeeper心跳未保持视为节点故障
  • 当follower的消息落后于leader太多也会视为节点故障

Kafka对节点故障的处理方式:

  • Kafka会对故障节点进行移除,所以基本不会因为节点故障而丢失数据
  • Kafka的语义担保也很大程度上避免了数据丢失
  • Kafka会对消息进行集群内平衡,减少消息在某些节点热度过高

Kafka Leader选举机制简介

Kafka集群之Leader选举:

  • 如果有接触过其他一些分布式组件就会了解到大部分组件都是通过投票选举来在众多节点中选举出一个leader,但在Kafka中没有采用投票选举来选举leader
  • Kafka会动态维护一组Leader数据的副本(ISR)
  • Kafka会在ISR中选择一个速度比较快的设为leader

Kafka集群搭建及必知必会

“巧妇难为无米之炊”:Kafka有一种无奈的情况,就是ISR中副本全部宕机。对于这种情况,Kafka默认会进行unclean leader选举。Kafka提供了两种不同的方式进行处理:

  1. 等待ISR中任一Replica恢复,并选它为Leader
    • 等待时间较长,会降低可用性,或ISR中的所有Replica都无法恢复或者数据丢失,则该Partition将永不可用
  2. 选择第一个恢复的Replica为新的Leader,无论它是否在ISR中
    • 并未包含所有已被之前Leader Commit过的消息,因此会造成数据丢失,但可用性较高

Leader选举配置建议:

  • 禁用unclean leader选举
  • 手动设置最小ISR

关于ISR更详细的内容可以参考:

  • https://www.jianshu.com/p/ff296d51385a
  • https://blog.csdn.net/qq_37502106/article/details/80271800

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/547780.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java字符流和字节流的区别_java字符流与字节流的区别是什么

java中字符流与字节流的区别:1、字节流操作的基本单元为字节;字符流操作的基本单元为Unicode码元。2、字节流默认不使用缓冲区;字符流使用缓冲区。3、字节流通常用于处理二进制数据,实际上它可以处理任意类型的数据,但…

IEPNGFix:Unclickable children of element 解决办法

以前我有写过一篇关于让IE6支持png半透明图片的方法,这期间这一神器一直发挥了很大的作用,并且没有出现过什么差错,直到昨天。 昨天同事做的一个项目因为设计图的关系,所以实现起来用到了很多position定位的属性,这里…

ASP.NET MVC 重点教程一周年版 第九回 HtmlHelper

许多时候我们会遇到如下场景 在写一个编辑数据的页面时&#xff0c;我们通常会写如下代码 1: <input type"text" value<%ViewData["title"] %> name"title" /> 由前篇我们所讲的Helper演化&#xff0c;我们思考&#xff0c;对于这种…

Tensorflow中查看gpu是否可用

Tensorflow中查看gpu是否可用 使用tf.test.is_gpu_available()函数可直接返回 import tensorflow as tf tf.test.is_gpu_available() Tensorflow测试程序 # Python import tensorflow as tf hello tf.constant(Hello, TensorFlow!) sess tf.Session() print(sess.run(hell…

websphere一直安装部署_WebSphere集群安装配置及部署应用说明

《WebSphere集群安装配置及部署应用说明》由会员分享&#xff0c;可在线阅读&#xff0c;更多相关《WebSphere集群安装配置及部署应用说明(27页珍藏版)》请在人人文库网上搜索。1、WebSphere6.1集群安装配置及部署应用说明1 安装Webphere1.1 安装WebSphere ND 6.11、 双击launc…

设置devenv命令的启动版本

机子上装了有vs 05、vs 08、vs 10如果按上顺序安装的话&#xff0c;在 运行 > devenv 就可以打开最新的vs10 工具&#xff0c;如果顺序是乱的话&#xff0c;就没那么幸运了&#xff0c;也就是说你最后安装的版本将会被你的 devenv 命令打开&#xff0c;原因是最后一次安装vs…

Yolov4训练自己的数据集

Yolov4训练自己的数据集 代码运行环境Ubuntu18.04python3.6显卡1080TiCUDA10.0cudnn7.5.1OpenCV3.4.6Cmake3.12.2&#xff0c;详细环境配置安装步骤就不讲解拉&#xff0c;网上教程一大堆。从github克隆下载源码&#xff0c;链接地址&#xff1a;https://github.com/AlexeyAB/…

[TED] Kinect控制的四翼直升机

超级精彩的demo&#xff0c;耐心看下去&#xff0c;越到后来越精彩。转载于:https://www.cnblogs.com/brucejia/archive/2013/06/14/3135206.html

vs 2010 不显示解决方案文件

vs 2010 不显示解决方案文件的问题早就遇到过&#xff0c;而且也能很容易的解决&#xff0c;唯独这次太郁闷了&#xff0c;先说说之前的我办法吧&#xff0c;像往常一样&#xff0c;在工具栏里面找到 >工具>选项>项目和解决方案>常规>勾中“总是显示解决方案”&…

debian 重启mysql_怎么重启MySQL服务,正确重启mysql

mysql> USE mysql; -- 切换到 mysql DBDatabase changedmysql> SELECT User, Password, Host FROM user; -- 查看现有用户,密码及允许连接的主机---------------------------| User | Password | Host |---------------------------| root | | localhost |--------------…

CentOS7 安装ownCloud

ownCloud的安装依赖LAMP环境&#xff0c;即 Linux Apache MySQL(Mariadb) PHP&#xff0c;所以在装owncloud前最好先装好这些&#xff0c;并且保证已经可用。 为了方便&#xff0c;本文在运行shell命令时都是以管理员用户身份运行&#xff08;root权限下运行&#xff09;&a…

Ajax跨子域

主页index.html的主要代码如下&#xff1a; <button οnclick"crossDomain();">开始跨域</button><div id"ajax"></div><iframe src"http://work.2fool.cn/crossdomain/iframe.html" id"iframe" style&quo…

关于阿拉伯数字转化成为大写汉字

public class MoneyUtil { /** 大写数字 */ private static final String[] NUMBERS { "零", "壹", "贰", "叁", "肆", "伍", "陆", "柒", "捌", "玖" }; /** 整数部分…

javascript 复制功能 兼容所有浏览器的解决方案

代码如下&#xff1a; // 兼容所有浏览器function copyUrl(url) { if (navigator.userAgent.toLowerCase().indexOf(ie) > -1) { clipboardData.setData(Text, url); alert("该地址已复制到剪切板&#xff01;"); } else { prompt(&qu…

SQL Server 性能优化之——系统化方法提高性能

原文 http://www.cnblogs.com/BoyceYang/archive/2013/06/15/3138142.html 阅读导航 1. 概述 2. 规范逻辑数据库设计 3. 使用高效索引设计 4. 使用高效的查询设计 5. 使用技术分析低性能 6. 总结 1. 概述 在比较大的范围内找出能够大幅提高性能的区域&#xff0c;并且专注于分析…

yum搭建lnmp的最简单方法

相信有些刚刚接触web开发的小伙伴对于服务器上搭建web环境还不太了解&#xff0c;今天手把手教大家搭建lemp的线上环境&#xff0c;您需要做如下一些准备&#xff1a; 阿里云或者其他服务商的云主机一台云主机已安装Centos 7了解ssh、vim 好的&#xff0c;相信大家已经做好准备…

java opencv 平移_Java中使用opencv

Java中使用opencvJava中使用opencv零、前言作为图像处理出身&#xff0c;不仅仅要会C图像处理、matlab图像处理、python图像处理、最起码也得会java图像处理&#xff0c;当然我最终还都用的是opencv这个机器视觉库了。今天简单介绍一下java中如何使用opencv。一、配置库(1)官网…

子域名跨越的问题

子域名不支持ajax直接提交&#xff0c;但支持form表单直接提交。

Linux利用PROMPT_COMMAND实现审计功能

这个系统审计&#xff0c;记录什么用户&#xff0c;在什么时间&#xff0c;做了什么操作。 然后将查到的信息记录到一个文件里。一。 配置1. 在/etc/profile 文件的最后&#xff0c;添加如下2行代码&#xff1a;export HISTORY_FILE/var/log/File_history/date %Y-%m-%d.logexp…

CentOS7 安装 NextCloud

NextCloud 的安装依赖LAMP环境&#xff0c;即 Linux Apache MySQL(Mariadb) PHP&#xff0c;所以在装 NextCloud前最好先装好这些&#xff0c;并且保证已经可用。 为了方便&#xff0c;本文在运行shell命令时都是以管理员用户身份运行&#xff08;root权限下运行&#xff0…