ORACLE ODA一体机存储节点电源故障的分析处理

近期,某用户的ORACLE ODA一体机在例行机房巡检时出现亮黄灯告警;用户反馈次问题后我们立刻通过远程方式,登陆ODA的控制台进行查看;

对于ODA一体机(2个计算节点+1个存储节点),计算节点可以通过ilom管理界面登陆进行详细的硬件信息查看和管理,当然通过命令行也可以。

对于存储节点,是没有图形界面可以看,可以通过ODA管理台(7093/mgmt/index.html)或者命令查看;

本次问题查看为存储节点的1个电源故障,由于双电源配置,系统仍然可以正常工作;并且电源的更好工作是可以在线进行的。

如下为排查分析过程:

1、故障灯及系统中查看故障原因

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4920 rpm 
        _FAN3       Cooling           OK          4530 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      Critical    -       ===>>>显示故障    
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          30 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          42 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          22 C 

4 、更换电源(可以先尝试插拔电源线,电源线松动是可能的,插拔后也可能就恢复了)

更换的步骤MOS文档(How to confirm power supply status about storage shelf on ODA X7-2 (Doc ID 2419846.1),How To Replace an ODA (Oracle Database Appliance) X6-2HA, X7-2HA, X8-2HA, X9-2HA DE3-24C Power Supply/Cooling Unit [VCAP] (Doc ID 2960220.1))有视频和步骤,没有特殊的难度,参考如下:

WHAT ACTION DOES THE FIELD ENGINEER/ADMINISTRATOR NEED TO TAKE?:
1. Locate the PSU by amber LED

The following LEDs are lit when a power supply fault is detected:

* Front and rear Service Required LEDs
* Rear PS Failure LED on the bezel of the server
* Failure LED on the faulty power supply

2. Verify the PSU part number in the System Handbook and re-confirm.

3. Removing the PSU as follows.
3.1 Clear access to the PSU of any cables harnesses or assemblies.
3.2 Ensure the PSU  On/Off switch is in the 'Off' Position.
3.3 Disconnect the power cord tie strap from the power cord, and unplug the power cord from the PSU.
3.4 Remove installed PSU by, Grasping the PSU handle, push the release button and slide out PSU.

4. Installing the Power Supply as follows or use the "online" Help Guide.

4.1 On the replacement PSU verify that the Release button is open .
4.2 Align PSU with empty bay in chassis and slide in .
4.3 Push the lever fully closed until you hear or feel a click.
4.4 Connect AC power cord to new PSU. Use the power cord retaining clips.
4.4 If required , place cable harness or assemblies back into normal position.
4.5 Turn the On/OFF switch to the On position .

5. Verify the replacement by checking for Green LED

IMPORTANT NOTE :
PSUs have a 3 minute Service time limit . When you remove a PSU the
fans on the remaining PSU go to 100 % duty cycle . Testing has shown that
HDD temperatures can exceed their operating temperature when a PSU has
been removed for 3 minutes.

5、检查最终状态(注意次命令的输出,ODA 的2个计算节点的的输出是不一致的,简单说是检测到恢复正常是有时间差的,如节点1显示OK,节点2可能过几分钟才显示OK)

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4910 rpm 
        _FAN3       Cooling           OK          4540 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      OK          -        
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          29 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          41 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          28 C  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/10029.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python爬虫实战:爬取【某旅游交通出行类网站中国内热门景点】的评论数据,使用Re、BeautifulSoup与Xpath三种方式解析数据,代码完整

一、分析爬取网页: 1、网址 https://travel.qunar.com/2、 打开网站,找到要爬取的网页 https://travel.qunar.com/p-cs299979-chongqing进来之后,找到评论界面,如下所示:在这里我选择驴友点评数据爬取点击【驴友点评…

腾讯共享WiFi项目的加盟方式有哪些?

在这个互联互通的时代,共享经济的浪潮正以前所未有的力量席卷全球,而腾讯作为中国互联网巨头之一自然不会错过这场盛宴。其推出的腾讯共享WiFi项目自问世以来就备受瞩目,它不仅为用户提供便捷的上网服务,更为创业者打开了一个全新…

untiy 为预制体动态加载光照贴图

unity版本为2021.8 预制体不能携带光照贴图信息,只能我们自己准备了 多方查找加自己摸索终于找到了适合新版本的解决方案,直接贴代码 将这个脚本挂到预制体的最上级 using System.Collections; using System.Collections.Generic; using UnityEditor; …

美颜SDK是什么?深度学习技术在直播美颜SDK中的应用探析

美颜SDK的出现为直播、视频通话等应用提供了强大的美颜功能。接下来,我们将一同探讨美颜SDK的概念,以及深度学习技术在直播美颜SDK中的应用。 一、什么是美颜SDK? 美颜SDK是一种软件开发工具包,旨在为开发者提供便捷而强大的美颜…

四大误区:中台产品时设计你中招了几个?

01 误区一:管理系统分析工具数字化中台 传统企业在经营管理过程中会根据业务或管理需求,不断添加和升级诸如OA、CRM等不同类别的管理系统。 为了更好地响应前台的业务需求,有些企业成立了新的或扩大、加强了原有的技术部门,由…

C#上位机1ms级高精度定时任务

precisiontimer 安装扩展包 添加引用 完整代码 using PrecisionTiming;using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; us…

WinSCP软件出错:连接被意外关闭了

问题描述: WinSCP 登录 M3568 的 linux系统,提示 列出’/home/root’的目录项时出错,连接被意外关闭 具体提示如下图所示,列出’/home/root’的目录项时出错。 连接被意外关闭了 服务器发送命令的退出状态255 原因及解决&#xf…

notepad++安装 hex-editor插件

打开notepad 点击插件 搜索 hex-editor,点击右侧 安装install 安装成功后,在已安装插件中就有显示了

spring boot参数验证注解@NotNull、@NotBlank和@NotEmpty区别

目录 前言说明举例 前言 使用spring boot参数验证是常常会使用NotNull、NotBlank和NotEmpty三个判断是否不为空的注解,中文都有不能为空的意思,大部分使用者都傻傻分清它们之间到底有什么区别。今天就让咱们来一起探索它们之间的不同吧。 说明 注解名…

【数据库】数据库指令

一。数据库打开 1.命令行 2.进入mysql mysql -uroot -p密码 3.退出 exit; 二。针对数据库的操作 1.创建数据库(有分号) create database student; 2.使用数据库 use student 3.删除数据库(有分号) drop database…

数据库调优-数据库优化

数据库优化 如何发现复杂的SQL有问题? 一个个去explain吗?你有没有这样的困惑,开发代码运行顺畅丝滑,上生产了却卡的一逼? 哈哈,相信大家都会遇到这样的问题! sql 复制代码 # 举个栗子&…

4. 从感知机到神经网络

目录 1. 从感知机到神经网络 2. 最简单的神经网络 3. 激活函数的引入 1. 从感知机到神经网络 之前章节我们了解了感知机,感知机可以处理与门、非与门、或门、异或门等逻辑运算;不过在感知机中设定权重的工作是由人工来做的,而设定合适的&a…

【将Maven源改为国内阿里云镜像源】

目录 一、如何配置Maven镜像源? 二、Idea中的Maven配置 ​三、项目与你本地仓库和中央仓库的联系 一、如何配置Maven镜像源? 1、打开你的Maven用户设置文件(settings.xml)。默认情况下,该文件存在于你的用户目录下的.m2文件夹中。如果你没…

Kafka 执行命令超时异常: Timed out waiting for a node assignment

Kafka 执行命令超时异常: Timed out waiting for a node assignment 问题描述: 搭建了一个kafka集群环境,在使用命令行查看已有topic时,报错如下: [rootlocalhost bin]# kafka-topics.sh --list --bootstrap-server…

《机器学习by周志华》学习笔记-决策树-01

本书中的「决策树」有时指学习方法,有时指学得的树。 1、基本流程 1.1、概念 基本流程,亦称「判定树」 决策树(decision tree),是一种常见的机器学习方法。以二分类任务为例,我们希望从给定训练数据集学得一个模型,用以对新样例进行分离。 以二分类任务为例,可看作对…

一图看懂 | 蓝卓煤炭行业解决方案

煤炭是我国能源保障的“压舱石,也是国民经济中重要的支柱产业之一无论是发电、建材、造纸、冶金、化工等工业领域都离不开煤炭近年来,在“双碳”及能源安全双重背景下推动智能化技术与煤炭产业的融合发展提升煤矿安全生产能力的重要性与日俱增智慧矿山的建设已逐渐成…

CentOS 7安装配置docker

CentOS 7、8安装、配置docker 这里宿主机的型号选择是centos7.9.2009的版本 1.宿主机关闭防火墙和selinux,配置ipv4 #设置SELinuxdisabled vim /etc/selinux/config SELinuxdisabled 查看防火墙状态:firewall-cmd --state 关闭防火墙:syst…

selenium爬取TapTap评论

上一篇写的beautifulsoup和request爬取出的结果有误。首先,TapTap网页以JS格式解析,且评论并没有“下一页”,而是每次加载到底部就要进行等待重新加载。我们需要做的,是模仿浏览器的行为,所以这里我们用Selenium的方式…

2024年数维杯B题完整代码和思路论文讲解与分析

2024数维杯数学建模完整代码和成品论文已更新,获取↓↓↓↓↓ https://www.yuque.com/u42168770/qv6z0d/bgic2nbxs2h41pvt?singleDoc# 2024数维杯数学建模B题45页论文和代码已完成,代码为全部问题的代码 论文包括摘要、问题重述、问题分析、模型假设、…

【项目实战】使用Github pages、Hexo如何10分钟内快速生成个人博客网站

文章目录 一.准备工作1.安装git2.安装node安装 cnpm 3.使用 GitHub 创建仓库,并配置 GitHub Pages0.Github Pages是什么1. 在 GitHub 上创建一个新仓库2. 创建您的静态网站3. 启用 GitHub Pages4. 等待构建完成5. 访问您的网站 二. Hexo1.什么是Hexo2.安装Hexo1. 安…