一、领域对象
- Cluster:描述集群信息
- port描述当前服务端口;
- host描述当前服务主机;
- myself描述当前服务本身;
- servers描述当前服务集群列表
- registryConfigProperties配置信息;
- executor定时任务,负责更新服务信息和选主;
- timeout定时任务执行时间间隔。
- Server:描述服务实例
- url:服务地址
- status:服务状态
- leader:服务实例是否为主节点
- version:服务最新版本号
二、集群选主
- 初始化
- 获取当前服务实例地址信息
- 构建当前服务实例对象
- 获取所有服务列表
- 开启定时任务:更新集群服务信息;选主。
所有服务列表有属性文件里进行配置,分别创建当前服务对象和其他服务对象。区别是当前服务实例状态为true,其他为false。
- 更新集群服务信息
初始化的时候只是描述了服务简单信息,实际信息需要事实获取并更新。
通过http调用获取到其他服务实际的信息,包括真实转态、是否主节点、版号。
3. 选主
从所有服务列表中筛选出状态为true,是主节点的服务。
- 如果是空列表,就进行选主;
- 如果有多个服务,也需要选主
- 如果只有一个这样的节点,就不需要选主,说明当前集群只有一个主,符合预期。
选主算法有:
- 各种节点自己选,算法保证大家选的是同一个
- 外部有一个分布式锁,谁拿到锁,谁是主
- 分布式一致性算法,比如paxos,raft,,很复杂
当前实现采用第一种,通过选择出最小的hash为主节点,这种算法可以保证大家选择的都是一样的。
选主成功后,设置为主节点即可。
三、测试
- 三个节点
通过端口8484、8485、8486分别启动三个服务,模拟集群。
观察8484的日志:先更新三个服务信息,都是成功的。然后选择出8484为主节点。
观察8485的日志:先更新三个服务信息,都是成功的。然后选择出8484为主节点。
观察8486的日志:先更新三个服务信息,都是成功的。然后选择出8484为主节点。
- 两个节点
停掉8484,只保留8485和8486两个服务。
观察8485的日志:更新服务状态8484是失败的,8485和8486是成功的。选择是8485为主节点。
观察8486的日志:更新服务状态8484是失败的,8485和8486是成功的。选择是8485为主节点。
源码地址:
https://github.com/midnight2104/midnight-registry/tree/v2