写在前面
本文看下es分布式模型相关内容。
1:分布式模型
1.1:分布式特征
支持水平扩展,可以存储PB级别数据,每个就能都有自己唯一的名称,默认名称时elasticsearch,可以通过配置文件,如cluster.name: my-application
,修改,或者时在启动命令中指定,如-E cluster.name=xxxx
。
1.2:节点的类型
一个es集群的节点可以同时拥有多个类型。
1.2.1:corordinating node
这种类型的节点可以负责处理请求,并将请求路由的正确的节点,例如创建index的请求,就会路由到master节点。节点默认就是该类型的节点,
1.2.2:data node
负责保存分片数据的节点,节点启动默认就是该类型节点,通过设置node.data: false
禁止。通过增加data node可以解决数据的水平扩展和数据单点的问题。
需要注意:数据的分片如何在data node上分布式,是由master node决定的。
1.2.3:master node
集群的主节点,职责如下:
1:创建,删除索引
2:决定索引的数据分片分配到哪个节点
最佳实践:为一个集群设置多个maser 节点,每个master 节点只承担单一角色???
1.2.4:master eligible node
有资格在master节点故障时,通过选举成为新master node的节点,一个集群中可配置多个该类型的节点。
启动时,默认就是就是master eligible node,通过node.master: false
来禁止。
当集群中第一个master eligible节点启动的时候会将自己选举成为master节点。
2:选主流程
参考:
3:脑裂
脑裂一般是因为网络故障导致一个集群因为网络隔离,成为2个独立的集群,并各自选举产生自己的master node,
从而出现这种情况会造成数据的不可恢复的问题。想要避免脑裂问题,在7之前可通过如下设置控制不会产生两个master node:
在7后版本不需要做任何设置,es已提供必要检测来避免脑裂。
4:例子
4.1:准备工作
- 安装cerebro
在这里 下载,其中tgz在linux安装,zip在win安装。以linux为例,下载后,解压,然后进入bin目录执行./cerebro
即可:
[root@localhost bin]# ./cerebro
[info] play.api.Play - Application started (Prod) (no global state)
[info] p.c.s.AkkaHttpServer - Listening for HTTP on /0:0:0:0:0:0:0:0:9000
- es
参考这篇文章 。
4.2:正戏
我们首先来启动第一个es实例:
bin/elasticsearch -E node.name=xiaohengnode1 -E cluster.name=xiaoheng -E path.data=xiaoheng0_data -E http.port=9200 -E transport.port=9300
在cerebro查看:
接着创建索引,指定3个分片,一个副本:
创建后:
想要黄变绿
,只需要让没有分配的副本得到分配就行了,所以需要再来启动一个新节点,如下:
bin/elasticsearch -E node.name=xiaohengnode2 -E cluster.name=xiaoheng -E path.data=xiaoheng1_data -E http.port=9201
然后就变绿了:
写在后面
参考文章列表
ElasticSearch之安装和简单配置 。