Zookeeper
- 三、Zookeeper
- 3.1什么是zookeeper?
- 3.2为什么需要zookeeper
- 3.3Zookeeper基本运行流程
- 3.4Zookeeper数据模型
- 3.5Zookeeper主要角色
- 3.6Zookeeper工作原理
- 3.7Zookeeper节点数据操作流程
三、Zookeeper
3.1什么是zookeeper?
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。
翻译 : zookeeper就是一个小型的文件系统(分布式),用来获取信息,进行消息的快速传递
它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
3.2为什么需要zookeeper
-
为什么需要zookeeper?
-
解决:快速存储大数据的问题,
-
解决:大数据的读取问题,在集群环境下是必须有一台服务器(master)进行协调管理(记录数据块的元数据信息)
-
解决 : 将master冗余备份 形成master 的 active/standby 状态(采用经典集群HA高可用机制,能够防止整个集群中NameNode挂掉,但是会产生数据冗余。)
active 状态 对外进行集群管理
standby 状态 同步active状态的master 随时准备成为 active -
解决 : master内部先决定出来谁才是真正的active(引入zookeeper这种分布式的协调服,active的状态信息保存在一台服务器(叫zookeeper)中,所有的机器都通过它获取active节点)
-
解决:记录active节点状态的服务器(zookeeper)如果一旦宕机
我们这台保存状态的服务器也需要搭建一个集群,这个集群内部还需要选出一个master
Zookeeper服务自身组成一个集群,2n+1个(奇数)服务允许n个失效,集群内一半以上机器可用,Zookeeper就可用。 3台 nn1 nn2 s1
为啥ZK最好是奇数台呢?其实是有一定考虑的
1、 防止由脑裂造成的集群不可用。
首先,什么是脑裂?集群的脑裂通常是发生在节点之间通信不可达的情况下&