linux系统服务器中常见故障及排查方法

目录

故障1:系统无响应

故障2:网络连接问题

故障3:文件系统错误

故障4:软件包依赖问题

故障5:用户权限问题

故障6:服务无法正常工作

故障7:磁盘空间不足

故障8:内存不足

故障9:服务端口被占用

故障10:防火墙和安全组问题


故障1:系统无响应

  • 可能原因:资源耗尽、进程冲突、硬件故障等。

  • 排查方法:

  • 使用tophtopfree -h命令检查系统资源使用情况

root@fylog001:~# top
top - 11:23:31 up 46 days, 23:38,  1 user,  load average: 0.00, 0.01, 0.00
Tasks: 156 total,   1 running, 155 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.1 us,  0.1 sy,  0.0 ni, 99.8 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 16431740 total,   940580 free,  1922844 used, 13568316 buff/cache
KiB Swap:        0 total,        0 free,        0 used. 14119512 avail Mem PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                                                                                                                                                1528 root      10 -10 1153656  24084   2276 S   0.3  0.1 180:53.36 AliDetect                                                                                                                                                                              8292 root      10 -10  117128  15572  10396 S   0.3  0.1 150:16.64 AliYunDun                                                                                                                                                                              8303 root      10 -10  137980   2304      0 S   0.3  0.0 197:15.24 AliYunDunMonito                                                                                                                                                                        8805 root      20   0 5882368 403512   4624 S   0.3  2.5  46:00.51 java                                                                                                                                                                                   
25413 root      20   0  690340  12256   8180 S   0.3  0.1  53:15.80 aliyun-service                                                                                                                                                                         
31180 root      20   0 2193756  13052  11080 S   0.3  0.1 275:12.95 argusagent                                                                                                                                                                             1 root      20   0  184908   4972   3308 S   0.0  0.0   0:27.71 systemd                                                                                                                                                                                2 root      20   0       0      0      0 S   0.0  0.0   0:00.31 kthreadd                                                                                                                                                                               3 root      20   0       0      0      0 S   0.0  0.0   0:10.57 ksoftirqd/0                                                                                                                                                                            5 root       0 -20       0      0      0 S   0.0  0.0   0:00.00 kworker/0:0H                                                                                                                                                                           7 root      20   0       0      0      0 S   0.0  0.0  27:04.35 rcu_sched                                                                                                                                                                              8 root      20   0       0      0      0 S   0.0  0.0   0:00.00 rcu_bh                                                                                                                                                                                 9 root      rt   0       0      0      0 S   0.0  0.0   0:00.03 migration/0                                                                                                                                                                            10 root      rt   0       0      0      0 S   0.0  0.0   0:06.02 watchdog/0                                                                                                                                                                             11 root      rt   0       0      0      0 S   0.0  0.0   0:04.28 watchdog/1 
root@fylog001:~# free -htotal        used        free      shared  buff/cache   available
Mem:            15G        1.8G        913M        3.7M         12G         13G
Swap:            0B          0B          0B
  • 使用ps命令检查是否有异常进程
root@fylog001:~# ps axu
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0 184908  4972 ?        Ss   Mar25   0:27 /sbin/init
root         2  0.0  0.0      0     0 ?        S    Mar25   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S    Mar25   0:10 [ksoftirqd/0]
root         5  0.0  0.0      0     0 ?        S<   Mar25   0:00 [kworker/0:0H]
root         7  0.0  0.0      0     0 ?        S    Mar25  27:04 [rcu_sched]
root         8  0.0  0.0      0     0 ?        S    Mar25   0:00 [rcu_bh]
root         9  0.0  0.0      0     0 ?        S    Mar25   0:00 [migration/0]
root        10  0.0  0.0      0     0 ?        S    Mar25   0:06 [watchdog/0]
root        11  0.0  0.0      0     0 ?        S    Mar25   0:04 [watchdog/1]
root        12  0.0  0.0      0     0 ?        S    Mar25   0:00 [migration/1]
root        13  0.0  0.0      0     0 ?        S    Mar25   0:04 [ksoftirqd/1]
  • 检查硬件状态,如内存、硬盘等。
  • 解决方法:
    • 重启系统或关闭不必要的进程。

    • 升级硬件或增加系统资源。

故障2:网络连接问题

  • 可能原因:网络配置错误、防火墙设置、网络设备故障等。

  • 排查方法:

  • 使用pingtraceroute命令检查网络连接。

root@fylog001:~# ping www.baidu.com
PING www.a.shifen.com (220.181.38.150) 56(84) bytes of data.
64 bytes from 220.181.38.150: icmp_seq=1 ttl=53 time=7.40 ms
64 bytes from 220.181.38.150: icmp_seq=2 ttl=53 time=7.40 ms
64 bytes from 220.181.38.150: icmp_seq=3 ttl=53 time=7.41 ms
64 bytes from 220.181.38.150: icmp_seq=4 ttl=53 time=7.37 ms
  • 检查网络配置文件(如/etc/network/interfaces/etc/sysconfig/network-scripts/下的文件)。

  • 检查防火墙设置(如iptablesfirewalld)。

root@fylog001:~# iptables -L
Chain INPUT (policy ACCEPT)
target     prot opt source               destination         Chain FORWARD (policy DROP)
target     prot opt source               destination         
DOCKER-USER  all  --  anywhere             anywhere            
DOCKER-ISOLATION-STAGE-1  all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere             ctstate RELATED,ESTABLISHED
DOCKER     all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere             ctstate RELATED,ESTABLISHED
DOCKER     all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere            
ACCEPT     all  --  anywhere             anywhere
root@fylog001:~# systemctl status firewalld.service
  • 解决方法:

    • 修复网络配置或重启网络服务。

    • 调整防火墙规则或重启防火墙服务。

故障3:文件系统错误

  • 可能原因:磁盘故障、文件系统损坏、不正常关机等。

  • 排查方法:

  • 使用fsck命令检查并修复文件系统

root@fylog001:~# fsck
fsck from util-linux 2.27.1
e2fsck 1.42.13 (17-May-2015)
/dev/vda1 is mounted.
  • 检查磁盘状态(如使用smartctl)。

  • 解决方法:

    • 修复文件系统或恢复备份数据。

    • 更换损坏的硬盘。

故障4:软件包依赖问题

  • 可能原因:依赖关系不完整、版本不匹配等。

  • 排查方法:

  • 使用包管理器(如aptyumdnf)检查依赖关系。

  • 解决方法:

    • 更新软件包或安装缺失的依赖包。

    • 手动调整软件包依赖关系。

故障5:用户权限问题

  • 可能原因:权限不足。

  • 排查方法:

  • 使用ls -l命令检查文件或目录的权限。

root@fylog001:/etc# ls -l
total 844
-rw-r--r-- 1 root root    3028 Feb 27  2019 adduser.conf
-rw-r--r-- 1 root root      18 Oct 25  2021 adjtime
drwxr-xr-x 2 root root    4096 Oct 25  2021 alternatives
drwxr-xr-x 3 root root    4096 Oct 25  2021 apm
drwxr-xr-x 3 root root    4096 May 10 10:59 apparmor
drwxr-xr-x 8 root root    4096 May 10 10:59 apparmor.d
drwxr-xr-x 7 root root    4096 May 10 11:02 apt
-rw-r----- 1 root daemon   144 Jan 15  2016 at.deny
-rw-r--r-- 1 root root    2188 Sep  1  2015 bash.bashrc
  • 解决方法

    • 修改文件或目录的权限(如使用chmod命令)。

    • 使用具有足够权限的用户执行操作。

故障6:服务无法正常工作

  • 可能原因:软件配置错误、版本不兼容、资源耗尽等。

  • 排查方法:

  • 检查服务的配置文件和日志文件。

  • 使用systemctl命令检查服务状态。

root@fylog001:/etc# systemctl status ssh
● ssh.service - OpenBSD Secure Shell serverLoaded: loaded (/lib/systemd/system/ssh.service; enabled; vendor preset: enabled)Active: active (running) since Mon 2024-03-25 11:44:40 CST; 1 months 16 days agoMain PID: 955 (sshd)Tasks: 1Memory: 928.0KCPU: 112msCGroup: /system.slice/ssh.service└─955 /usr/sbin/sshd -D
  • 解决方法:

    • 修复配置文件或重启服务。

    • 升级软件或调整配置以适应环境。

故障7:磁盘空间不足

  • 排查方法:

  • 使用df -h命令查看磁盘使用情况。

root@fylog001:/etc# df -h
Filesystem      Size  Used Avail Use% Mounted on
udev            7.9G     0  7.9G   0% /dev
tmpfs           1.6G  3.8M  1.6G   1% /run
/dev/vda1       394G   15G  363G   4% /
tmpfs           7.9G     0  7.9G   0% /dev/shm
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           7.9G     0  7.9G   0% /sys/fs/cgroup
  • 解决方法:

    • 清理不必要的文件或目录。

    • 增加磁盘空间或扩展分区。

故障8:内存不足

  • 排查方法:

  • 使用free -m命令查看内存使用情况。

root@fylog001:/etc# free -mtotal        used        free      shared  buff/cache   available
Mem:          16046        1881         908           3       13256       13783
Swap:             0           0           0
  • 解决方法:

    • 关闭不必要的进程或服务。

    • 升级硬件或增加虚拟内存。

故障9:服务端口被占用

  • 排查方法:

  • 使用netstat -tuln命令查看端口占用情况。

root@fylog001:~# netstat -tulnp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name
tcp        0      0 0.0.0.0:3306            0.0.0.0:*               LISTEN      12199/docker-proxy
tcp        0      0 127.0.0.1:42859         0.0.0.0:*               LISTEN      21096/hbrclient 
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      8207/redis-server 0
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      955/sshd 
  • 解决方法:

    • 停止占用端口的进程或服务。

    • 配置服务使用其他端口。

故障10:防火墙和安全组问题

  • 排查方法:

  • 检查防火墙规则和安全组设置。

  • 解决方法:

    • 调整防火墙规则或安全组设置以允许必要的通信。

请注意,以上只是一些常见的故障和排查方法,实际情况可能因系统和环境的不同而有所差异。在排查和解决故障时,应根据具体的错误信息和日志进行分析和处理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/10208.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年华为OD机试真题- 手机App防沉迷系统-(C++)-OD统一考试(C卷D卷)

题目描述: 智能手机方便了我们生活的同时,也侵占了我们不少的时间。“手机App防沉迷系统”能够让我们每天合理的规划手机App使用时间,在正确的时间做正确的事。 它的大概原理是这样的: 1、在一天24小时内,可注册每个App的允许使用时段; 2、一个时段只能使用一个App,举例…

掼蛋—开牌三步走

掼蛋是消遣也是一项脑力活动&#xff0c;除了牌运&#xff0c;还要掌握技巧。和大家一起分享一下掼蛋游戏中的“开牌三步走”技巧。 1、快速理牌 目的&#xff1a;潜力最大化 开局时可以快速查看一下自己的同花顺&#xff0c;优先保留不损害其他炸弹的同花顺&#xff0c;并及时…

精益生产咨询公司:深入探讨其独特魅力与核心竞争力

精益生产咨询公司&#xff0c;作为专注于帮助企业实现精益转型和效率提升的专业机构&#xff0c;在现代工业生产中扮演着不可或缺的角色。这些公司不仅具备深厚的行业经验和专业知识&#xff0c;还能够根据企业的实际情况和需求&#xff0c;提供个性化的解决方案和持续的支持服…

用户至上!探索7种常用的用户体验研究方法

用户体验研究是产品开放过程中的重要组成部分&#xff0c;优秀的产品设计与高质量的用户体验是不可分割的。对于产品开发&#xff0c;选择合适的用户体验研究方法在很大程度上决定了产品的使用效果。本文全面阐述了用户体验研究、用户体验研究的重要性和用户体验研究方法&#…

mamba复现—mamba+yolov8魔改(win)

Mamba复现出现的问题 安装下列步骤一步步走 一、 注&#xff1a;若是Windows环境下python一定是3.10版本的&#xff0c;要不然trition无法安装 conda create -n mamba python3.10 conda activate mamba conda install cudatoolkit11.8 -c nvidia pip install torch2.1.1 t…

探索国外静态住宅代理:保护网络安全与隐私的利器

随着互联网的日益发展&#xff0c;网络安全和隐私保护成为越来越多用户关注的焦点。在这个信息爆炸的时代&#xff0c;如何确保网络活动的匿名性和安全性成为了我们必须面对的问题。国外静态住宅代理作为一种新兴的网络技术&#xff0c;为我们提供了有效的解决方案。 &#xf…

OSTEP Projects:KV

本文将介绍操作系统导论&#xff08;Operating Systems: Three Easy Pieces&#xff09;作者所开源的操作系统相关课程项目 的 KV 部分&#xff0c;包含个人的代码实现和设计思路。 思路 题目要求实现一个最简单的数据库&#xff0c;以支持数据的持久化。 每个操作由格式为 o…

目标检测——道路检测数据集

引言 亲爱的读者们&#xff0c;您是否在寻找某个特定的数据集&#xff0c;用于研究或项目实践&#xff1f;欢迎您在评论区留言&#xff0c;或者通过公众号私信告诉我&#xff0c;您想要的数据集的类型主题。小编会竭尽全力为您寻找&#xff0c;并在找到后第一时间与您分享。 …

C#中的异步编程模型

在C#中&#xff0c;async和await关键字是用于异步编程的重要部分&#xff0c;它们允许你以同步代码的方式编写异步代码&#xff0c;从而提高应用程序的响应性和吞吐量。这种异步编程模型在I/O密集型操作&#xff08;如文件读写、网络请求等&#xff09;中特别有用&#xff0c;因…

在Ubuntu上安装Anaconda并配置远程访问Jupyter

安装 下载Anaconda的.sh文件后&#xff0c;上传到服务器&#xff0c;然后进行安装&#xff1a; chmod x anaconda.sh ./anaconda.sh创建虚拟环境 可以指定Python版本创建虚拟环境&#xff1a; conda create --name langchain python3.11.7 conda activate langchain conda …

如何在Springboot项目的Mapper中增加一个新的sql语句

在做项目的过程中&#xff0c;我发现有的时候需要用到一些不在springboot的Mapper中的Sql语句&#xff0c;那么应该如何进行操作呐&#xff1f;&#xff1f; 平常我们创建springbootmybatisPlus项目的时候是这样创建的&#xff1a;&#xff1a; 1、创建实体类 2、创建Mappe…

【Python】如何训练模型并保存本地和加载模型

这个年纪的我们 爱情跟不上分开的节奏 这个年纪的我们 更珍惜难得的自由 这个年纪的我们 比起从前更容易感动 这个年纪的我们 徘徊在理想与现实之中 &#x1f3b5; 齐一《这个年纪》 逻辑回归是一种常用的分类算法&#xff0c;能够根据输入特征预测目标变…

https://blog.csdn.net/gang542725/article/details/138621192

uboot Ethernet 数据收发流程【1】 总结了一部分uboot收发数据的流程 这里继续 ! static int eqos_start(struct udevice *dev) 1210{ 1211 struct eqos_priv *eqos = dev_get_priv(dev); 1212 int ret, i; 1213 ulong rate; 1214 u32 val, tx_fifo_sz, rx_fifo_sz, tqs, …

Vite:下一代前端构建工具的快速上手

Vite 是由 Vue.js 的作者尤雨溪开发的下一代前端构建工具&#xff0c;它以其快速的冷启动、按需编译和热更新能力而受到广泛关注。Vite 通过利用浏览器原生的 ES 模块导入功能&#xff0c;提供了几乎即时的开发环境启动速度和高度优化的开发体验。 安装 Vite 首先&#xff0c…

2024年最新方法下载钉钉群直播回放

链接&#xff1a;百度网盘 请输入提取码 提取码&#xff1a;1234 --来自百度网盘超级会员V10的分享 1.首先解压好所有的压缩包&#xff0c;这个压缩包里面还套着一共逍遥一仙下载器压缩包&#xff0c;也解压 2.进入逍遥一仙下载器文件夹&#xff0c;打开M3U8 V1.4.8 0508.e…

TMS320F280049 CLB模块--FSM(3)

功能框图 FSM有效状态机内部框图如下图所示&#xff0c;可以看到内部有S0 / S1两个状态和下一状态的跳转查找表。还有个输出查找表。 下图是FSM LUT的示意框图。FSM还可以工作在3输入或4输入的查找表模式下。对于输入&#xff0c;EXTRA_EXT_IN1/0可以替换S0/1。 寄存器 参考文…

java基础教学 |Java Stream API详解

Java Stream API 是Java 8引入的一个重要特性&#xff0c;它为集合对象提供了一种新的计算模型&#xff0c;使得开发者能够以声明性的方式处理数据集合。Stream API 不仅提高了代码的可读性和简洁性&#xff0c;还极大地优化了并行处理能力&#xff0c;让复杂的集合操作变得高效…

将python库下载到本地安装—Pypi官网wheel版本选择详解—小白详解版

python库—本地安装文件下载&#x1f680; 在项目中需要在内网环境下配置python的环境&#xff0c;因此需要将用于安装python库的文件下载到本地传到内网环境当中然后再安装&#xff0c;通过这契机我开始了解了一下如何离线下载安装python的第三方库&#xff0c;以及配置本地的…

【Linux】环境变量是什么?如何配置?详解

&#x1f490; &#x1f338; &#x1f337; &#x1f340; &#x1f339; &#x1f33b; &#x1f33a; &#x1f341; &#x1f343; &#x1f342; &#x1f33f; &#x1f344;&#x1f35d; &#x1f35b; &#x1f364; &#x1f4c3;个人主页 &#xff1a;阿然成长日记 …

深入理解JavaScript事件循环Event Loop:宏任务与微任务的奇幻之旅

&#x1f525; 个人主页&#xff1a;空白诗 文章目录 &#x1f389; 引言&#x1f31f; 什么是事件循环&#xff1f;&#x1f4da; 「宏任务」 vs 「微任务」「宏任务」(Macrotask)「微任务」(Microtask)实际应用中的注意事项 &#x1f500; 执行流程概览&#x1f4dd; 代码示例…