全局Ceph节点宕机处理

在极端情况下,如数据中心断电,造成 Ceph 存储集群全局宕机,可以按照本节所示流程进行 Ceph 集群上电恢复操作。

4.1 手动上电执行步骤

  1. 如为 Ceph 集群上电,monitor server 应最先上电;集群上电前确认使用 Ceph 之前端作业服务已停止。

  2. 使用 IPMI 或于设备前手动进行上电。

  3. 确认 NTP 服务及系统时间已同步,命令如下:

    # ps-ef | grep ntp

    # date

    # ntpq -p

  4. 登入上电之 ceph server 确认 ceph service 已正常运行,命令如下:

    # ps -ef | grep ceph

  5. 登入集群 monitor server 查看状态,OSD 全都 up 集群仍为 noout flag(s) set

    # ceph -s

    # ceph osd tree

  6. 登入 monitor server 解除 stopping w/out rebalancing,命令如下:

    # ceph osd unset noout

    # ceph -w

    使用 ceph-w 可查看集群运作输出,同步完毕后集群 health 应为HEALTH_OK 状态。

4.2 恢复后检查步骤

  1. 确认设备上电状态,以 IPMI 或 于设备前确认电源为开启上电状态。

  2. ping ceph monitor server,检查 monitor server 可以 ping 通。

  3. 系统时间和校时服务器时间同步。

  4. ceph -s  状态为HEALTH_OK

  5. ceph osd tree OSD 状态皆为UP

4.3 恢复使用指令及其说明

  1. ceph -s : 确认 ceph cluster status

  2. ceph -w : 查看集群运作输出

  3. ceph osd tree : 查看ceph cluster上osd排列及状态

  4. start ceph-all : 启动 所有 ceph service

  5. start ceph-osd-all : 启动 所有 osd service

  6. start ceph-mon-all : 启动 所有 mon service

  7. start ceph-osd id={id} : 启动指定 osd id service

  8. start ceph-mon id={hostname} : 启动指定 ceph monitor host

  9. ceph osd set noout : ceph stopping w/out rebalancing

  10. ceph osd unset noout : 解除ceph stopping w/out rebalancing

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/744388.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IIS上部署.netcore WebApi项目及swagger

.netcore项目一般是直接双击exe文件,运行服务,今天有个需求,需要把.netcore项目运行在IIS上,遇到了一个小坑,在这里记录一下。 安装IIS,怎么部署站点,这些过于简单就不细说了,不知道…

C++:继承与派生

为什么会有继承这样的语法呢??试想这样一个场景:假设我们这个App需要去获取不同类型用户的数据,并进行分类,那么就需要我们去写对应不同的类,比如说学生、老师、军人、公司职工…………每个类都需要有名字、…

品牌方如何借热点做话题?媒介盒子分享

每时每刻都有热点,品牌方总想着借热点来做话题营销,然而有些热点能让品牌有效曝光,有些热点稍不注意就会让品牌产生负面舆论,今天媒介盒子就来和大家好好聊聊:品牌方如何借热点做话题。 一、 热点选择 品牌方可以通过…

猿区 Node.js 版本控制工具介绍

Node.js 版本控制工具:nvm、n 和 fnm 如果你是一位刚开始学习 Node.js 的初学者,你可能已经注意到 Node.js 有多个版本。不同的项目可能需要不同的 Node.js 版本,而在本地环境中同时安装和管理这些版本可能会变得复杂。幸运的是,…

域内令牌窃取

前言 有这样一种场景,拿到了一台主机权限,是本地管理员,同时在这台主机上登录的是域管成员,这时我们可以通过dump lsass或通过 Kerberos TGT ,但是这是非常容易被edr命中的。 本文就通过令牌窃取进行研究&#xff0c…

正则表达式笔记+demo

//1.正则表达式由普通字符和特殊字符(又称元字符)组成的文字模式,是一个模板 // 常用元符号示例:^ . \ * ? { 、} ( 、 ) [ 、 ] | $ // ★★★这些元符号都有其特殊含义,如果要表示其本来字符的含义,需要…

mysql基础之事务

简介 事务是数据库的逻辑工作单位,具有原子性、一致性、隔离性、持久性四大特性。 【原子性】:事务中的操作要么全部成功,要么操作失败全部回滚,不会出行部分完成的状态。 【一致性】:事务开始到结束时,数据…

pgsql常用索引简写

文章来源:互联网博客文章,后续有时间再来细化整理。 在数据库查询中,合理的使用索引,可以极大提升数据库查询效率,充分利用系统资源。这个随着数据量的增加得到提升,越大越明显,也和业务线有关…

《鸟哥的Linux私房菜》第6章——总结与习题参考答案

目录 一、 简介 二、一些新了解的指令 1.touch- 修改文件时间或创建新文件 2.umask-新建文件/目录的默认权限 3.文件隐藏属性 4.文件特殊权限 5.file-观察文件类型 三、简答题部分 一、 简介 本章介绍了一些常用的文件与目录指令,包括新建/删除/复制/移动/查…

2024HVV行动-进军蓝中研判(log4j2、fastjson、Struts2、Shiro)

1、log4j2 特征: 恶意请求中包含 JNDI 协议地址,如"ldap://"、"rmi://"等,被 log4j2 解析为 JNDI 查找。 原理: 在日志输出中,未对字符进行严格的过滤,执行了 JNDI 协议加载的远程恶…

教师如何搭建学生查询考试分数的平台?

随着信息技术的快速发展,搭建一个学生查询考试分数的平台已经成为现代教育管理的重要组成部分。这样的平台不仅可以提高成绩管理的效率,还能为学生提供便捷、及时的成绩查询服务。那么,作为教师,我们应该如何搭建这样一个平台呢&a…

Python中的惩罚分析:理论与实践指南

目录 写在开头1. 理论基础1.1 优化问题与约束条件简介1.2 什么是惩罚分析1.3 惩罚分析的应用场景1.4 惩罚方法的类型2. 惩罚分析在Python中的实现2.1 实现代码示例2.2 未加惩罚的模型2.3 加惩罚的模型(L1和L2正则化)2.4 选择合适的惩罚方法与调整强度2.5 惩罚过程改善过拟合问…

【海贼王的数据航海】栈和队列

目录 1 -> 栈 1.1 -> 栈的概念及结构 1.2 -> 栈的实现 1.2.1 -> Stack.h 1.2.2 -> Stack.c 1.2.3 -> Test.c 2 -> 队列 2.1 -> 队列的概念及结构 2.2 -> 队列的实现 2.2.1 -> Queue.h 2.2.2 -> Queue.c 1 -> 栈 1.1 -> 栈的…

如何缩小你和大厂UI设计师之间的差距?重点关注你的作品集!

据说金三银四,在新一轮招聘旺季到来之前,你做过UI作品集吗?一个好的作品集可以为你的面试增加很多分数!在开始之前,分享五个适合交互设计作品集的软件: 一、即时设计 这是一款专门为UI设计而设计的在线矢…

多线程(volatile)

volatile的功能 保证内存可见性禁止指令重排序 内存可见性 简单的理解 两(多)个线程同时针对一个变量进行操作, 一个线程读, 一个线程修改, 此时读到的值不一定是修改过后的值 即读线程没有感知到变量的变化 (其实是 编译器/JVM 对于代码在多线程情况下的优化进行了误判) 从 J…

maven父工程

maven父工程 一般最上面是定义的属性然后是版本管理然后是模块聚合 父工程一般只需要留一个pom.xml文件就行了。 父工程主要是用于版本管理和模块聚合。 一般最上面是定义的属性 属性中写的是各个依赖的版本&#xff0c;方便下面引用。 <properties><java.version&…

【Python】-闲聊:如何系统的自学Ptyhon

如何系统地自学Python 学习Python需要有一个系统的计划和策略&#xff0c;这样才能有效地掌握这门语言。下面是一个自学Python的指南&#xff0c;包括方法、实际例子和建议&#xff0c;适合新人小白&#xff0c;老手请绕过。 一、确定学习目标 在开始学习之前&#xff0c;首…

OD_2024_C卷_200分_3、电脑病毒感染【JAVA】【图论 / 单源最短路径(dijkstra)】

题目描述 一个局域网内有很多台电脑&#xff0c;分别标注为 0 ~ N-1 的数字。相连接的电脑距离不一样&#xff0c;所以感染时间不一样&#xff0c;感染时间用 t 表示。 其中网络内一台电脑被病毒感染&#xff0c;求其感染网络内所有的电脑最少需要多长时间。如果最后有电脑不…

Linux:设置别名命令alias

相关阅读 Linuxhttps://blog.csdn.net/weixin_45791458/category_12234591.html?spm1001.2014.3001.5482 在Linux中alias命令用于为一串字符&#xff08;常代表命令&#xff09;设置一个别名&#xff0c;该别名在Bash读取并解析一行命令时会被展开。 下面是该命令的语法。 用…

github(不是git啊)操作记录(踩坑)

专栏介绍与文章目录-CSDN博客 github是程序员绕不开的东西。 网站打不开&#xff1f; 向雇主或有关部门申请合法信道连接互联网。 明明账号密码都对却登录失败&#xff1f; 向雇主或有关部门申请合法信道连接互联网。 重置密码失败&#xff1f; 向雇主或有关部门申请合法信道…