虚拟机无法进入系统问题

概述

客户在华为云平台上创建了两台虚拟机并部署aarch64 V10 OS,2021-10-28其中一台虚拟机业务出现异常,运维重启虚拟机后系统进不去,左上角光标闪烁,接着重启另一台虚拟机同样起不来,现象一致。

分析

通过分析现场收集的message日志,确认2021-10-28日11:17进行系统重启,重启后,系统仍然无法正常进入,日志显示在11:09左右,有大量dbus-daemon服务异常信息:

可以看出,dbus-daemon报出大量和用户名有关异常日志,且重启系统后,查看boot.log中也存在一些基础服务失败的现象,使用单用户进入系统,禁用图形化显示服务,重启进入正常模式系统,通过systemctl list-units --failed列出失败服务:

以系统基础组件的dbus服务异常为例,尝试再次启动dbus服务,发现启动仍然失败,由于该服务为系统底层的基础通信服务,就会造成其他一系列的服务异常。

结合前面分析的dbus-daemon报出的大量用户相关日志,查看系统的/etc/passwd文件,发现/etc/passwd以及/etc/shadow不存在,只有/etc/passwd-和/etc/shadow-备份文件,因此证实了dbus服务异常是无法找到系统用户造成的。

为了保证业务,采用临时的手段,即首先复制备份文件passwd-文件到/etc/passwd,然后手动添加dbus用户,接着重启系统,查看系统其他服务恢复正常的,问题初步解决,接着通过执行pwconv恢复/etc/shadow文件,至此,可以认为系统恢复正常。需要注意的是,上述的操作是一种应急方案。

经过现场环境梳理,麒麟虚拟机运行在华为云平台之上,虚拟机中部署的业务应用使用的是root用户运行,且业务对外的web前端应用。

结论

此次故障,初步分析为系统丢失/etc/passwd以及/etc/shadow文件,引起一系列系统服务失败,导致业务因系统故障出现崩溃。

建议

  1. 强烈建议业务应用使用非root权限用户运行,防止外部不可控因素通过对外应用获取特权,从而造成系统故障。
  2. 建议协调云平台排查相关日志,分析是否存在平台因素,导致虚拟机系统发生故障。(案例参考链接/etc/passwd文件损坏导致云服务器登录失败怎么办?_弹性云服务器 ECS_故障排除_SSH连接_华为云 (huaweicloud.com)
  3. 建议协调运维人员,增加对虚拟机的监控。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/230091.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【MySQL命令】show slave status\G 超详细全面解释

这个命令是DBA日常运维中常用来查看主从状态的命令,很多备份,监控工具也会使用到该命令监控主从状态是否正常,主从延迟,获取位点信息等。作为常用日常命令,一定要完全理解该命令的输出。今天主要结合 官方文档 和 实际…

Spring01

一、Spring概述 自 2004年 4 月,Spring 1.0 版本正式发布以来,Spring 已经步入到了第 5 个大版本,也就是我们常说的 Spring 5。 Spring的基础是Spring Framework,其功能有: 1、IoC (控制反转),Spring 两大…

没错,数据库就应该跑在 k8s 里

昨天冯老板发了一篇文章探讨了为什么将数据库放入 K8S 中不是一个明智的选择。 如果是四年前有人质疑容器化数据库我觉得还可以 battle 一下,都 2023 年了还有人不能认清这个大势,我就有必要来谈谈我的看法了。 我从 K8s 0.9 版本时就开始做这件事&…

Pelee: A Real-Time Object Detection System on Mobile Devices(CVPR 2019)

文章目录 年三十AbstractIntroductionPeleeNet:一个高效的特征提取网络架构消融实验数据集不同设计选择对性能的影响 在ImageNet ILSVRC 2012上的结果真实设备上的速度 Pelee:实时目标检测系统Overview在VOC 2007上的结果不同设计选择的影响与其他框架的比较真实设备…

Linux下使用HTTP进行数据传输的代码实例

在Linux系统中,HTTP协议是一种广泛使用的应用层协议,用于在网络中传输数据。下面是一个使用Python的requests库在Linux下进行HTTP数据传输的代码实例。 python复制代码 import requests # 发送HTTP GET请求 response requests.get("h…

C++面试宝典第6题:访问数组和联合体元素

题目 阅读下面的代码段,并给出程序的输出。 (1)访问数组元素。 int a[] = {61, 62, 63, 64, 65, 66}; int *p = (int *)(&a + 1); printf("%d, %d\n", *(a + 1), *(p - 1)); (2)访问联合体元素。 union {short i;char x[2]; }a;a.x[0] = 10; a.x[1] = 1; …

YOLOv5改进 | 卷积篇 | SPD-Conv空间深度转换卷积(高效空间编码技术)

一、本文介绍 本文给大家带来的改进内容是SPD-Conv(空间深度转换卷积)技术。SPD-Conv是一种创新的空间编码技术,它通过更有效地处理图像数据来改善深度学习模型的表现。SPD-Conv的基本概念:它是一种将图像空间信息转换为深度信息…

Java_常见算法

一、常见算法 1.1 认识算法 接下来,我们认识一下什么是算法。算法其实是解决某个实际问题的过程和方法。比如百度地图给你规划路径,计算最优路径的过程就需要用到算法。再比如你在抖音上刷视频时,它会根据你的喜好给你推荐你喜欢看的视频&a…

Eolink Apikit 如何进行 Websocket 接口测试?

什么是 websocket ? WebSocket 是 HTML5 下一种新的协议(websocket协议本质上是一个基于 tcp 的协议)。 它实现了浏览器与服务器全双工通信,能更好的节省服务器资源和带宽并达到实时通讯的目的 Websocket 是一个持久化的协议。…

qemu 虚拟机

文章目录 一、参考资料二、QEMU调试参数三、QEMU 命令 一、参考资料 # 查询 qemu 包 apt list | grep qemu# 查询已安装的 qemu 包 apt list --installed | grep qemu # 查询 qemu 版本 qemu-img -V # 安装 sudo apt-get install qemu-system-arm qemu-system-mips qemu-syste…

惯性导航基础知识学习----01惯性器件相关

🌈武汉大学惯性导航课程合集是入门惯导的精品课程~ 作为导航路上的鼠鼠我,要开始学习惯性导航了~ 需要达到的要求是大致了解惯导的原理等~ 后期会陆续更新惯导相关的知识和笔记等~ 🐬 本blog为 武汉大学惯性导航课程 的记录~ 感谢团队提供的开…

verilog基础语法-计数器

概述: 计数器是FPGA开发中最常用的电路,列如通讯中记录时钟个数,跑马灯中时间记录,存储器中地址的控制等等。本节给出向上计数器,上下计数器以及双向计数器案例。 内容 1. 向上计数器 2.向下计数器 3.向上向下计数…

gitee的学习

1.git下载 下载地址:https://git-scm.com/ 2.建立远程仓库 访问:gitee.com 在此网站上创建 3.本地操作 在本地找一个任意文件,克隆git 执行命令:git clone https://gitee.com/beijing-jiaxin-times_0/test_zsx_cang_ku.git …

【算法刷题】Day19

文章目录 1. 山脉数组的峰顶索引题干:算法原理:代码: 2. 寻找峰值题干:算法原理:1. 暴力解法2. 二分查找 代码: 3. 下降路径最小和题干:算法原理:1. 状态表示2.状态转移方程3. 初始化…

vue写了这么久了您是否知道:为什么data属性是一个函数而不是一个对象?

一、实例和组件定义data的区别 vue实例的时候定义data属性既可以是一个对象,也可以是一个函数 const app new Vue({el:"#app",// 对象格式data:{foo:"foo"},// 函数格式data(){return {foo:"foo"}} })组件中定义data属性&#xff…

BM61 矩阵最长递增路径

题目 矩阵最长递增路径 给定一个 n 行 m 列矩阵 matrix ,矩阵内所有数均为非负整数。 你需要在矩阵中找到一条最长路径,使这条路径上的元素是递增的。并输出这条最长路径的长度。 这个路径必须满足以下条件: 1. 对于每个单元格,你…

风速预测(六)基于Pytorch的EMD-CNN-GRU并行模型

目录 前言 1 风速数据EMD分解与可视化 1.1 导入数据 1.2 EMD分解 2 数据集制作与预处理 2.1 先划分数据集,按照8:2划分训练集和测试集 2.2 设置滑动窗口大小为96,制作数据集 3 基于Pytorch的EMD-CNN-GRU并行模型预测 3.1 数据加载&a…

初识Dubbo学习,一文掌握Dubbo基础知识文集(3)

🏆作者简介,普修罗双战士,一直追求不断学习和成长,在技术的道路上持续探索和实践。 🏆多年互联网行业从业经验,历任核心研发工程师,项目技术负责人。 🎉欢迎 👍点赞✍评论…

Ubuntu-报错

Hadoop-Eclipse-java:耽误进度的几个报错 错误1:桥接模式与NAT模式相互切换后导致两种模式都不能访问互联网(1)具体错误:(2)错误原因:(3)解决方案&#xff1a…

Redis设计与实现之订阅与发布

目录 一、 订阅与发布 1、 频道的订阅与信息发送 2、订阅频道 3、发送信息到频道 4、 退订频道 5、模式的订阅与信息发送 ​编辑 6、 订阅模式 7、 发送信息到模式 8、 退订模式 三、订阅消息断连 1、如果订阅者断开连接了,再次连接会不会丢失之前发布的消…