集群down机的应急和恢复测试(非重做备机)

1. 集群的两台服务器的状态

实例

正常情况主备

ip

端口

node1

主机

192.168.6.6

9088

node2

备机

192.168.6.7

9088

2. 测试的步骤

  • down掉node1
  • 观察node2的状态
  • 在node2未自动切换的时候手动将node2调整为单机状态,模拟紧急使用
  • 模拟不紧急时,将node2升级为主机,并恢复节点node1

3. 主机down机后手动操纵备机使备机快速进入可使用状态

[gbasedbt@node01 install]$ onstat -g dri
On-Line (Prim) -- Up 00:16:11 -- 1650580 KbytesData Replication at 0x4cf1a028:Type           State        Paired server        Last DR CKPT (id/pg)    Supports Proxy Writesprimary        on           node2                         9 / 1          NADRINTERVAL   0DRTIMEOUT    30DRAUTO       0DRLOSTFOUND  /opt/GBASE/gbase/etc/dr.lostfoundDRIDXAUTO    0ENCRYPT_HDR  0Backlog      0Last Send    2024/06/17 22:01:20Last Receive 2024/06/17 22:01:20Last Ping    2024/06/17 22:01:05Last log page applied(log id,page): 9,2[root@node01 GBASE]# onstat -
On-Line (Prim) -- Up 00:14:11 -- 1650580 Kbytes[root@node01 GBASE]# su - gbasedbt
上一次登录:一 6月 17 21:45:54 CST 2024pts/0 上
[gbasedbt@node01 ~]$ onclean -ky
onclean: Cleaning up processes and resources for 'node1'...- Looking for the master daemon process: 13760- Looking for the shmem key: 52934803- Looking for the shmem key: 52934804- Looking for semaphore ID: 10- Looking for the shmem key: 52934801- Looking for the shmem key: 52934802
[gbasedbt@node01 ~]$
--主备集群之间由健康检查判断集群是否正常,由于心跳检查是多次连接,每次连接之间有数秒的间隔,所以主机down到备机切换之间有健康检查时间,这段时间备机显示集群是正常的
[gbasedbt@node02 ~]$ onstat -g dri
Read-Only (Sec) -- Up 00:01:22 -- 1635008 KbytesData Replication at 0x4c13d028:Type           State        Paired server        Last DR CKPT (id/pg)    Supports Proxy WritesHDR Secondary  on           node1                         9 / 1          NDRINTERVAL   0DRTIMEOUT    30DRAUTO       0DRLOSTFOUND  /opt/GBASE/gbase/etc/dr.lostfoundDRIDXAUTO    0ENCRYPT_HDR  0Backlog      0Last Send    2024/06/17 22:02:04Last Receive 2024/06/17 22:02:04Last Ping    2024/06/17 22:01:59Last log page applied(log id,page): 0,0
  • 本次模拟主机down机,备机还没有发现的情况下,将备机恢复使用
[gbasedbt@node02 ~]$ onstat -g dri
Read-Only (Sec) -- Up 00:01:22 -- 1635008 KbytesData Replication at 0x4c13d028:Type           State        Paired server        Last DR CKPT (id/pg)    Supports Proxy WritesHDR Secondary  on           node1                         9 / 1          NDRINTERVAL   0DRTIMEOUT    30DRAUTO       0DRLOSTFOUND  /opt/GBASE/gbase/etc/dr.lostfoundDRIDXAUTO    0ENCRYPT_HDR  0Backlog      0Last Send    2024/06/17 22:02:04Last Receive 2024/06/17 22:02:04Last Ping    2024/06/17 22:01:59Last log page applied(log id,page): 0,0[gbasedbt@node02 ~]$ onstat -
Read-Only (Sec) -- Up 00:01:55 -- 1635008 Kbytes[gbasedbt@node02 ~]$ onmode -d standard
[gbasedbt@node02 ~]$ onstat -
On-Line -- Up 00:02:21 -- 1635008 Kbytes

4. 备机变成单机状态后需要升为主机并恢复集群

[gbasedbt@node02 ~]$ onmode -d primary node1
[gbasedbt@node02 ~]$ onstat -
On-Line (Prim) -- Up 00:02:38 -- 1635008 Kbytes
--node1节点执行oninit -PHY执行物理日志恢复
[gbasedbt@node01 node1_dbs]$ oninit -PHY
[gbasedbt@node01 node1_dbs]$ onstat -m
Fast Recovery -- Up 00:00:13 -- 1650580 KbytesMessage Log File: /opt/GBASE/gbase/tmp/online_node1.log
06/17/24 22:49:31  SQL_FEAT_CTRL value set to 0x8008
06/17/24 22:49:31  SQL_DEF_CTRL value set to 0x4b0
06/17/24 22:49:31  GBase Database Server Version 12.10.FC4G1AEE Software Serial Number AAA#B000000
06/17/24 22:49:32  GBase Database Server Initialized -- Shared Memory Initialized.06/17/24 22:49:32  Started 1 B-tree scanners.
06/17/24 22:49:32  B-tree scanner threshold set at 5000.
06/17/24 22:49:32  B-tree scanner range scan size set to -1.
06/17/24 22:49:32  B-tree scanner ALICE mode set to 6.
06/17/24 22:49:32  B-tree scanner index compression level set to med.
06/17/24 22:49:32  DR: Reservation of the last logical log for log backup turned on
06/17/24 22:49:32  Data replication type and state information reset. To start DR, usethe 'onmode -d' command and wait for the pair to be operational,before shutting down the database server06/17/24 22:49:32  Physical Recovery Started at Page (3:394).
06/17/24 22:49:32  Physical Recovery Complete: 0 Pages Examined, 0 Pages Restored.
06/17/24 22:49:32  Dataskip is now OFF for all dbspaces
06/17/24 22:49:32  Restartable Restore has been ENABLED
06/17/24 22:49:32  Recovery Mode
--查看节点,发现为快速恢复阶段
[gbasedbt@node01 node1_dbs]$ onstat -
Fast Recovery -- Up 00:00:21 -- 1650580 Kbytes--将node1节点当成备机加入节点
[gbasedbt@node01 node1_dbs]$ onmode -d secondary node2
[gbasedbt@node01 node1_dbs]$ onstat -
Read-Only (Sec) -- Up 00:02:04 -- 2188180 Kbytes[gbasedbt@node01 node1_dbs]$ onstat -g dri
Read-Only (Sec) -- Up 00:04:31 -- 2188180 KbytesData Replication at 0x4cf1a028:Type           State        Paired server        Last DR CKPT (id/pg)    Supports Proxy WritesHDR Secondary  on           node2                         9 / 5          NDRINTERVAL   0DRTIMEOUT    30DRAUTO       2DRLOSTFOUND  /opt/GBASE/gbase/etc/dr.lostfoundDRIDXAUTO    0ENCRYPT_HDR  0Backlog      0Last Send    2024/06/17 22:50:42Last Receive 2024/06/17 22:50:44Last Ping    2024/06/17 22:53:35Last log page applied(log id,page): 0,0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/29137.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++之模板(一)

1、为什么需要模板 将具有相同逻辑的一段代码提供一份模板,当我们需要处理不同类型的时候,可以通过数据类型当作参数来传递,从而实例化出对应类型的处理版本。 2、模板的定义 也是一种静态多态。 3、模板的分类 4、函数模板 5、函数模板的使…

-------------------------面试散文-----------------------------------

问题1:vue中动态引入图片,为什么使用require? 回答:因为动态添加的src 编译过后的文件地址和被编译过后的资源文件地址不一致,从而导致无法访问题 而使用require 返回的就是资源文件被编译后的文件地址,从…

Aeron:Aeron Agent

Aeron Agent 是一个 Java 代理,用于提供 Aeron、Aeron Archive 和 Aeron Cluster 中发生的运行时低级日志信息。这些日志语句包括从高级管理员事件到大容量数据帧事件。 在调试 Archive 和 Cluster 问题时,Aeron Agent 的日志数据尤其有用。 一、Availab…

本地无法连接linux上的MariaDB数据库

问题:本地用DBeaver无法连接服务器上的MariaDB数据库 ? 测试1:在cmd中ping 服务器IP,看是否能ping通,能ping通,没有问题 测试2:在cmd中telnet 服务器IP 端口,看是否能访问&#xf…

常见的Redis使用问题及解决方案

目录 1. 缓存穿透 1.1 解决方案 2. 缓存击穿 2.1 解决方案 3. 缓存雪崩 3.1 概念图及问题描述 ​编辑3.2 解决方案 4. 分布式锁 4.1 概念 4.2 基于redis来实现分布式锁 4.3 用idea来操作一遍redis分布式锁 4.4 分布式上锁的情况下,锁释放了服务器b中的锁…

JAVA学习笔记DAY8——Spring_AOC Spring-tx

文章目录 AOC概述Spring-aop 配置举例快速实现获取切点详细信息在增强方法中获取目标方法的信息返回结果异常信息 切点表示式语法统一切点管理环绕通知 Around切面增强优先级CGlib生效场景注解方式aop总结xml 方式配置aop Spring AOP 对获取Bean的影响Spring 声明性事务概念事务…

多态深度剖析

前言 继承是多态的基础, 如果对于继承的知识还不够了解, 可以去阅读上一篇文章 继承深度剖析 基本概念与定义 概念: 通俗来说,就是多种形态。具体点就是去完成某个行为, 当不同的对象去完成时会产生出不同的状…

docker使用auth登录

配置config.json文件 vim ~/.docker/config.json 格式: {"auths":{"registry.digitalocean.com":{"auth":"xxx"}} }QA:配置不生效,去掉默认的一些其他配置,只保留auth部分 直接使用auth登录 docke…

淘宝商品信息一网打尽!深入探索item_get接口的高效应用

淘宝item_get接口技术详解 一、引言 淘宝的开放平台为开发者提供了丰富的API接口,其中item_get接口是用于获取淘宝商品详情的常用接口。通过这个接口,开发者可以获取到商品的标题、价格、描述、图片等关键信息,进而实现商品数据的抓取、分析…

如何完美解决 Xshell 使用 SSH 连接 Linux 服务器报错:找不到匹配的 host key 算法

🛠️ 如何完美解决 Xshell 使用 SSH 连接 Linux 服务器报错:找不到匹配的 host key 算法 摘要: 本文将带领大家深入学习如何解决 Xshell 使用 SSH 连接 Linux 服务器时报错“找不到匹配的 host key 算法”的问题。通过详细的操作步骤和代码案…

第12章:集合框架

第12章:随堂复习与企业真题(集合框架) 一、随堂复习 1. 数组存储数据方面的特点和弊端 数组存储多个数据方面的特点:> 数组一旦初始化,其长度就是确定的。> 数组中的多个元素是依次紧密排列的,有序的…

05-5.4.3 树和森林的遍历

👋 Hi, I’m Beast Cheng 👀 I’m interested in photography, hiking, landscape… 🌱 I’m currently learning python, javascript, kotlin… 📫 How to reach me --> 458290771qq.com 喜欢《数据结构》部分笔记的小伙伴可以…

Shopee虾皮API:获取商家店铺商品列表

一、平台介绍 Shopee,作为东南亚及中国台湾地区领先的电商平台,为卖家提供了一个便捷、高效的销售渠道。作为卖家,能够将自己的商品展示在Shopee平台上,并通过平台的流量和工具,将商品销售给更多的潜在买家。 为了帮…

系统架构设计师 - 操作系统(2)

操作系统 操作系统(5-6分)文件管理绝对路径与相对路径 ★索引文件 ★★★位示图 ★ 存储管理段页式存储 ★★★页式存储段式存储段页式存储(了解) 页面置换算法 ★ 微内核操作系统嵌入式操作系统 ★★★ 大家好呀!我是…

数据库课设-中小企业工资管理系统

一、效果展示 二、后端代码 import string import random from flask import Flask, render_template, request, jsonify, redirect, session import pymysql from flask_cors import CORS import time import schedule from datetime import datetime import threading from …

HK1-BOX X3刷UBUNTU 24.04,并开启WIFI

端午刚好有点时间,顺便把改完散热的HK1-BOX刷了个最新OC版的UBUNTU 24,这里记录下操作的步骤: 准备材料 HK1-BOX S905X3:注意X4的不行固件没匹配的。建议先改完散热,不然作为7X24小时的机器长时间高温还是很伤硬件的…

Web前端项目-拼图游戏【附源码】

拼图游戏 拼图游戏是一种经典的益智游戏,通过HTML、CSS和JavaScript等前端技术的综合运用来实现;拼图游戏可以锻炼玩家的观察能力、空间认知能力和逻辑思维能力。游戏开始时,一张图片会被切割成多个小块,并以随机顺序排列在游戏区…

CMOS图像传感器——列噪声(CFPN)去除

目前CMOS 图像传感器系统中列共用结构应用最为广泛,在该结构中,虽然像素曝光均匀,但是由于列输出系统处理属性的变动,对于不同列,像素的输出是不均匀的。因此,基于列的CMOS 图像传感器表现出垂直条纹固定模式噪声(CFPN),从而降低了图像的质量。由于人眼 的关系,CFPN …

「布道师系列文章」宝兰德徐清康解析 Kafka 和 AutoMQ 的监控

作者|北京宝兰德公司解决方案总监徐清康 01 前言 当我们使用一个软件的时候,经常都会问这个软件怎么监控、监控他的哪些指标?Kafka 的监控挺长时间都是一个老大难的问题,社区在监控方面一直没有投入太大的精力。如果要实现一…