一家专门做特卖的网站手机版/化妆品软文推广范文

一家专门做特卖的网站手机版,化妆品软文推广范文,怎么做网站变更,无锡做设计公司网站前言 本篇博文主要记录在维护 VMware VSphere 时,遇到硬盘故障引发的一系列的问题和解决方案。 1. 发现问题:虚拟机和ESXi都连不上了 今天一看,VMware vSphere 里的好几台虚拟机都挂了,服务也连不上。 第一反应:是…

前言

本篇博文主要记录在维护 VMware VSphere 时,遇到硬盘故障引发的一系列的问题和解决方案。

1. 发现问题:虚拟机和ESXi都连不上了

今天一看,VMware vSphere 里的好几台虚拟机都挂了,服务也连不上。

第一反应:是不是网络问题?还是数据中心出状况了?
我试着在 vSphere 里重启几台虚拟机(运行在同一台 Exis 物理机上的),但完全没用。再一看,连 ESXi 物理主机也显示“无法连接”——这下事情不对劲了,不是简单的虚拟机崩溃,而是更底层的问题。

2. 排查过程:硬盘故障开始浮出水面

既然 ESXi 主机都无法连接了,那只能去机房查看了。接上显示器后,屏幕上跳出了红色的错误信息:

“编号 xxx 硬盘名 的 什么什么I/O 检测暂停”
在这里插入图片描述

这很像硬盘出故障了!
但奇怪的是,无论是 iDRAC 控制台、ESXi 控制台、还是 Prometheus 监控系统,都没有任何预警,完全没有报警。这就很奇怪了。

我继续在 vSphere 界面中查看这台 ESXi 主机的状态,发现界面上的操作全部变灰,完全无法操作。此时,我更加确定了问题与硬盘有关。

3. 解决方案:重启 ESXi,问题逐渐明朗

联系供应商,他们认为应该是硬盘大概率损坏,但 vSAN 将其识别为数据逻辑错误,而非物理故障,因此既没有将该主机下线,也没有自动迁移虚拟机,导致整个环境陷入卡顿,虚拟机持续异常。供应商建议我先尝试重启 ESXi 主机进行排查。

重启后,问题更清晰了

  • iDRAC、服务器面板、Prometheus 终于开始报警,说明这块硬盘的确出现问题了。
  • 部分虚拟机自动恢复,剩余的虚拟机需手动启动。
  • 但有两台虚拟机手动启动也失败,提示 “不在线”

供应商的建议是将这两台虚拟机 手动操作才能重新注册到 vSphere

  1. 右键虚拟机 -> 取消注册
  2. 到文件目录里找到原来的 vmdk 文件 -> 重新注册虚拟机

然而,这两台虚拟机仍无法启动!
再仔细一查,发现 vmdk 文件 的大小和数量根本不对,原本 vmdk 文件 应该是几个 T 大小,现在只有几十 G,但 vSAN 总存储容量大小没有减少,说明数据应该还在,只是部分文件损坏了。

4. 硬盘状态不一致,移除硬盘操作遇到障碍

这时,我又发现一个奇怪的现象:

  • ESXi 后台,该硬盘状态显示 正常
  • 但在 VMware vSphere 控制台,硬盘状态却为 异常

理论上,两边的状态应该一致,但显然存在不一致的情况。ESXi 可能是误判了硬盘状态,认为它还能用,但实际上已经坏了
按理来说,即使设备坏了我做了 虚拟机多副本vSAN 的 RAID ,有冗余机制能确保虚拟机能正常运行,但目前很明显并没有生效。

尝试移除硬盘

  1. 先找到硬盘组,勾选 “不活动” 或 “出错” 状态的硬盘
  2. 尝试直接移除,但 vSphere 界面显示硬盘仍然存在
  3. 进入vCenter 用命令行查询,发现硬盘确实已经移除
  4. 重启 vCenter 后,界面才正确刷新

最终问题只能通过 更换硬盘 来彻底解决。我现在正在等待新的硬盘寄过来,并计划从 NAS 中恢复数据。

5. 后续处理:命令操作踢出坏硬盘,恢复数据

在等待新硬盘的同时,我决定先通过命令行操作处理坏硬盘。(前面的步骤)

  1. 通过命令成功将坏硬盘从 ESXi 移除,并拔掉硬件。
  2. 插入新硬盘后,通过命令将其重新加入原本的硬盘组。

在硬盘组完成平衡后,硬件报错消失了,但问题并没有完全解决。坏掉的数据依然占用了空间,并且没有得到修复。

原本以为硬盘修复后,丢失的 20TB vmdk 文件会自动恢复,但结果并没有恢复。我本以为是副本中某一份坏了,只要硬盘修复就能恢复数据,但实际上所有副本都坏了。而且,40TB 的数据(双副本)并没有释放出来,依然占用了空间。

6. 数据恢复与备份恢复的挑战

此时,我决定从群晖 NAS 的 Active Backup 上还原改虚拟机备份,但恰好仅此一台机的数据始终无法恢复(备份是成功,但恢复按钮是灰色的,无法点击)。找了群晖技术支持,邮件回复要求我开启远程连接,但因为我的 NAS 设备部署在内网,远程操作并不方便。

最终,我选择将改虚拟机的备份文件下载导出,并通过 NFS 挂载到 vSAN 进行测试,确认数据是没有问题的。

7. 解决硬盘空间占用问题:通过命令删除损坏文件

为了清理空间,进入 vCenter 控制台,手动删除了损坏的数据。因为在 vSphere 页面无法操作,所有操作只能通过命令行完成。
通过命令查询 vmdk 数据时,提示有损坏文件,通过删除这些文件,空间得以释放。

8. 重新导入 20TB vmdk 文件,解决空间问题

最后,空间占用问题终于解决了。为了恢复缺失的 20TB vmdk 文件,我需要登录到某台 ESXi 主机的后台进行操作。

因为ESXi 会挂载 vSAN 集群,而只有在任务开始一段时间后,vSphere 界面才能看到该任务和进度。

  • vCenter 的后台无法通过命令无法完成此操作,因为它无法挂载 NFS;
  • vSphere 页面也无法执行,虽然 NFS 挂载是成功的,但每次导入都会失败,提示资源不足(实际上资源是充足的)。

这项操作花费了一个星期,最终终于将 20TB 的 vmdk 文件导入并将虚拟机恢复了。

9. 经验总结:技术措施的局限性与重要性

这次硬盘故障让我深刻意识到,虽然我配置了 vSAN 冗余、虚拟机副本和监控系统等一堆防线,问题依然没能完全避免。

冗余≠绝对安全

即便有硬盘冗余和虚拟机副本,硬盘坏掉照样可能导致业务中断。冗余是为了降低风险,不是消除所有问题的保险。

监控≠及时报警

虽然装了监控,硬盘出问题的时刻并没有第一时间报警,直到我重启了一下才开始报错。这让我意识到,不是所有的监控都能及时响应每一个硬件问题,尤其是像这种隐性故障。

状态显示不一致

在 ESXi 后台,硬盘的状态显示一切正常,但在 vSphere 控制台却报错了,导致了 vSphere 读取硬盘数据出现逻辑错误。

一些个人经验

这次事故让我也意识到一些不得不承认的现实。如果资金允许,最好使用 VMware 的正版并有技术支持,至少碰到问题能快速得到帮助,不用自己折腾。如果预算紧张,开源方案比如 OpenStack 也是不错的选择,至少能接触到底层,知道出问题了是怎么回事,自己能定位问题。

所以,我也决定从这次经验中改进一些方面:

  • 优化监控策略:在硬盘 IO 和存储状态监测上加大力度,确保能够早期捕捉到问题。
  • 深入了解 vSAN 故障处理:深入学习 vSAN 的故障恢复机制,避免类似的情况发生。
  • 定期检查存储健康:不要等到硬盘出问题才意识到,定期检查硬盘的健康状态,做好预防工作。

总结一下:

再多的技术措施也没法代替硬件的物理故障,冗余和监控只是减小风险的手段,但无法消除所有潜在问题。所以备份、监控和及时的健康检查是必须的。只要硬件在,问题就有可能发生,做好准备,尽量早发现,早解决,才是最重要的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/70022.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JAVA安全—Shiro反序列化DNS利用链CC利用链AES动态调试

前言 讲了FastJson反序列化的原理和利用链,今天讲一下Shiro的反序列化利用,这个也是目前比较热门的。 原生态反序列化 我们先来复习一下原生态的反序列化,之前也是讲过的,打开我们写过的serialization_demo。代码也很简单&…

2024 CyberHost 语音+图像-视频

项目:CyberHost: Taming Audio-driven Avatar Diffusion Model with Region Codebook Attention 音频驱动的身体动画面临两个主要挑战:(1)关键人体部位,如面部和手部,在视频帧中所占比例较小&#x…

Qwen2-VL 的重大省级,Qwen 发布新旗舰视觉语言模型 Qwen2.5-VL

Qwen2.5-VL 是 Qwen 的新旗舰视觉语言模型,也是上一代 Qwen2-VL 的重大飞跃。 Qwen2.5-VL主要特点 视觉理解事物:Qwen2.5-VL不仅能够熟练识别花、鸟、鱼、昆虫等常见物体,而且还能够分析图像中的文本、图表、图标、图形和布局。 代理性&…

手机用流量怎样设置代理ip?

互联网各领域资料分享专区(不定期更新): Sheet

OSI 参考模型和 TCP/IP 参考模型

数据通信是很复杂的,很难在一个协议中完成所有功能。因此在制定协议时经常采用的思路是将复杂的数据通信功能由若干协议分别完成,然后将这些协议按照一定的方式组织起来。最典型的是采用分层的方式来组织协议,每一层都有一套清晰明确的功能和…

OpenEuler学习笔记(三十二):在OpenEuler上搭建项目管理平台

在OpenEuler上搭建一个支持网页和手持访问、且支持用户功能自定义的项目管理平台,可以选择多种开源工具。以下是基于 Redmine 的搭建方案,Redmine 是一个灵活的项目管理工具,支持网页和移动端访问,并且可以通过插件扩展功能。 1.…

ElementUI 的组件 Switch(开关)如何让文字显示在按钮上

效果图&#xff1a; 一、引入switch组件 给组件自定义一个类&#xff1a;tableScopeSwitch&#xff0c;设置开关的值和对应展示的文字&#xff08;开为 1&#xff0c;并展示启用&#xff1b;关为 0&#xff0c;并展示禁用&#xff09;。 <div class"tableScopeSwitch…

实现Tree 树形控件的鼠标拖拽功能

1.element中的el-tree实现可拖拽节点 通过 draggable 属性可让节点变为可拖拽 <el-tree :data"data" node-key"id" default-expand-all node-drag-start"handleDragStart" node-drag-enter"handleDragEnter" node-drag-leave"…

【第3章:卷积神经网络(CNN)——3.7 数据增强与正则化技术】

在深度学习的世界里,卷积神经网络(CNN)可谓是大放异彩,在图像识别、目标检测等众多领域都取得了超厉害的成果。不过,要想让 CNN 模型发挥出最大的潜力,数据增强与正则化技术可是必不可少的。今天咱就来唠唠这两个技术,看看它们到底有啥用,又是怎么在 CNN 里发挥作用的。…

ICIR2025 | CubeDiff:重新利用基于扩散的图像模型来生成360°全景图

CubeDiff是一种使用基于扩散的图像模型生成 360 全景图的新型框架。通过利用立方体图表示和微调预训练的文本到图像模型&#xff0c;CubeDiff 简化了全景图生成过程&#xff0c;提供了高质量、一致的全景图。 CubeDiff 利用立方体图来表示 360 全景图&#xff0c;并在一次传递中…

【第3章:卷积神经网络(CNN)——3.5 CIFAR-10图像分类】

嘿,小伙伴们,今天咱们来聊聊一个超级酷炫的话题——卷积神经网络(CNN)及其在CIFAR-10图像分类中的应用。这不仅仅是一个技术话题,更是一场探索人工智能奥秘的旅程。准备好了吗?咱们这就发车! 一、CNN:人工智能的“千里眼” 首先,咱们得知道CNN是啥。CNN,全名Convol…

贪心算法_翻硬币

蓝桥账户中心 依次遍历 不符合条件就反转 题目要干嘛 你就干嘛 #include <bits/stdc.h>#define endl \n using namespace std;int main() {ios::sync_with_stdio(0); cin.tie(0); cout.tie(0); string s; cin >> s;string t; cin >> t;int ret 0;for ( i…

开发去中心化应用(DApp)的完整路径:从0到1的实践指南

一、开发前的战略规划 开发DApp需构建完整的区块链技术栈&#xff0c;涉及智能合约、前端交互、节点通信、钱包集成等模块。开发者需明确以下核心要素&#xff1a; 应用定位&#xff1a;区分金融类&#xff08;DeFi&#xff09;、游戏类&#xff08;GameFi&#xff09;、工具类…

清华大学:DeepSeek 如何赋能职场应用(35 页 PDF)

原来已经分享过清华大学的 DeepSeek&#xff1a;从入门到精通&#xff08;100页PDF&#xff09; 现在又来第二弹&#xff1a;《DeepSeek 如何赋能职场应用&#xff1f;从提示语技巧到多场景应用》 PDF里介绍了 DeepSeek 这一人工智能工具及其在职场中的应用&#xff0c;从基础…

微信小程序登陆鉴权最佳实现

文章目录 一、使用步骤1.创建鉴权组件auth2.app.json中注册全局组件3.页面使用组件4. 读取本地存储的 token 数据&#xff0c;用于判断是否曾登录过5. 检测登录状态&#xff0c;要求未登录时不显示页面中的内容且跳转到登录页面 一、使用步骤 1.创建鉴权组件auth 2.app.json中…

【图像加密解密】空间混沌序列的图像加密解密算法复现(含相关性检验)【Matlab完整源码 2期】

1、说明 本文给出详细完整代码、完整的实验报告和PPT。 环境&#xff1a;MATLAB2019a 复现文献&#xff1a;[1]孙福艳,吕宗旺.Digital image encryption with chaotic map lattices[J].Chinese Physics B,2011,20(04):136-142. 2、部分报告内容 3 部分源码与运行步骤 3.1 部…

后端调试指南

调试后端应用程序通常涉及使用一系列工具和技术,以帮助开发人员识别和解决代码中的错误或性能问题。具体的调试过程和步骤可以根据使用的编程语言、框架、以及部署环境有所不同,但通常可以按以下流程进行: 一、选择合适的调试工具 根据你使用的开发环境和后端技术栈,选择…

在Linux中Redis不支持lua脚本的处理方法

redis安装在IP为x.x.x.x的服务器上 redis安装 第一步&#xff0c;安装前&#xff0c;检测系统是否安装了redis。若安装了redis&#xff0c;则需要删除redis&#xff1b;若没有安装redis&#xff0c;则需要安装2.6版本以上的redis。 # 确保Redis版本支持Lua脚本。从Redis 2.6…

试试DeepSeek写prompt+stable diffusion生成漫画

#deepseek #stable diffusion 模型&#xff1a;dreamshaperXL_v21TurboDPMSDE.safetensors 一、情节拟定 漫画情节由deepseek自编自导&#xff0c;画幅为四张。 Prompt 1: 魔法觉醒 "一个平凡的少年在阁楼发现一本古老的魔法书&#xff0c;书页散发着微弱的蓝光。画…

HTN77A0F:拥有强制脉宽调制的0.7A同步降压降压变换器资料参数

HTN77A0特点 内置1.8Ω/700mΩ高低端功率管&#xff0c;无需外部续流二极管&#xff0c;轻载高效率 宽输入电压范围&#xff1a;5V~130V 输出蕞大持续电流&#xff1a;0.7A 超低静态电流&#xff1a;10uA&#xff1b;3uA关断电流 可接近100%占空比工作 轻载PFM (HTN77A0P), 或强…