网络运维故障排错思路!!!!!(稳了!!!)

1 网络排错的必备条件

为什么要先讲必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,我真的不能保证下面讲的这些你可以听得懂,并且能运用到实际当中,所以还是先看看这些基础的条件吧。

1.1 熟悉OSI七层模型与TCP/IP协议栈

这应该是网络排错要知道的最基本的知识了。

无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的认识。OSI七层模型对应OSI七层模型的协议,DoD模型对应DoD模型的协议,也就是TCP/IP协议栈。

TCP/IP协议栈里面的协议就显得十分重要了,比如DNS、TCP、UDP、IP、ICMP、ARP,这些最基本的应该得知道吧,我们不需要像《TCP/IP协议栈》中说得的那么细,但至少,对于这些协议的基本功能我们是必须得要知道的,这些就不是一两句可以说清楚的了,自己百度一下吧~

1.2 了解网络通信的基础设备和其对应的OSI层次

像交换机、三层交换机、路由器、防火墙这些最基本的网络设备应该要有些了解,尤其是它们对应的OSI层次以及作用,比如普通的二层交换机对应OSI七层模型中的数据链路层,它可以隔绝冲突域,同时可以通过虚拟局域网技术(VLAN)来隔绝广播域,二层交换机通过二层地址即MAC地址来实现数据帧的转发;再比如路由器,它对应网络层,可以提供路由寻址的功能等等。

1.3 了解中小型企业网络的基本架构

一般中小型企业网络的基本架构都是这样的:接入层--汇聚层--核心层--网络出口。

下面给个图:

图片

如果网络环境比较庞大,汇聚层和核心层都会有,像这里的话,就直接没有汇聚层,不过思想是一样的。下面讲的排错其实都是针对用户PC来说明的,事实上,数据中心中的网络排错也是类似的。不管网络环境多么复杂,其实简化下来跟这个都是差不多的。

1.4 知道常用的网络排错命令

如果用户使用的是Windows操作系统,那么下面的这些命令就很重要了:

图片

如果使用的是Linux操作系统,那么也有对应的相关命令。其实说到底就是要熟悉你所使用的设备,当然,在实际网络排错的过程中,如果只是为了测试网络通信是否正常,你可以换上你熟悉的设备操作。

1.5 清楚知道网络排错的一个重要原则

网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数据的走向。

所以一个重要原则是:关注数据的走向。

下面讲的网络排错思路其实就是通过追踪数据的走向来一步步缩小网络故障点的,因此,时刻记住这一点非常非常重要!这也是为什么上面需要让你了解中小型企业网络的基本架构了。

2 网络排错的基本思路

基本思路如下,这跟网上的大多数人写的应该是差不多的。

(1)检查物理链路是否有问题

(2)查看本机IP地址、路由、DNS的设置是否有问题

(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试

(4)测试ping公网ip的通畅情况(平时要记几个外部IP)

(5)测试DNS的通畅情况,可以直接ping网站地址

3 网络排错详细步骤

为了更好的讲述网络排错的过程和思路,假设我们有下面的一个网络环境:

(说明:虽然是假设,但实际上该网络环境是通过GNS3联动虚拟机和真实网络架设起来的,所以是可以真实参考的)

图片

下面,我们就以上面这个网络环境为例子,详细介绍我们的网络排错思路,每一步要怎么做,每一步为什么要这样做以及这样做之后我们可以得到什么信息,都会做一个说明。

3.1 检查物理链路是否有问题

这一步是我个人认为在做网络排错时必须要做的第一步!经常会听朋友说,领导的电脑上不了网,需要过去排错,搞了老半天,还发现不了问题,最后在几经绝望之时,竟然发现网线都没接上电脑。这就真的是悲剧了,浪费了很多时间不说,这样的网络排错思路本来就是有错误的。

因为也许不是每个人都可以去机房查看交换机的接线情况,所以这一步,我们排查的重点范围就应该放在如下面图所示的地方:

图片

在这一步,下面几点是需要注意排查的:

1. 确认电脑本身的网卡有没有问题

2.确认接的网线有没有问题

3.本机所连接的交换机(如果可以去机房查看的话)

如果上面这几点排查都没有问题了,那么就是该网络环境中的其他设备问题了。这一范围的排查相对比较简单,因为只涉及到物理链路的连接问题。

对于这种测试,可以考虑使用测线器,但个人的建议是,拿一台配置正确的笔记本来做测试也未尝不可。

3.2 查看本机IP地址、路由、DNS的设置是否有问题

上面第一步,物理链路的排查没有问题了,也就是说,电脑接上网线之后,电脑有反应了,可以识别,但是网络还是不通,来到这一步,就应该先把注意的范围放在电脑的设置上面了。

这一步,我们关注的重点是:

1.IP地址设置

如果采用的是DHCP自动获取的方法,那么这时候只需要看自己本机的设置上有没有开启自动获取IP的设置以及有没有开启相关的服务;

如果用的是静态IP,那么就必须要注意IP地址的填写有没有错(一般网络管理人员给的)、IP地址的子网掩码有没有问题(这很重要,对于静态IP,很多人在这里设置错误,建议是,最好把IP地址、VLSM这方面的知识学一下)。

一般可以用下面的命令查看:

图片

2.路由设置

对于服务器、PC,一般是指默认网关的设置了;对于路由器本身或三层交换机,那就是静态路由或动态路由的设置问题了。

3.DNS设置

主要是要确保所设置的DNS服务器地址到底有没有提供域名解析服务或者是否出现了故障,至于如何判断,后面会给出方法,这里关注的是,你得设置一个正确的DNS服务器地址或可以自动获取。在windows上面你可以通过下面的命令查看:

图片

3.3 测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试

在上面的网络环境中,在网络通的情况下,我们在电脑上使用命令tracert -d命令,会得到下面的结果:

图片

通过这个测试结果,我们可以清楚地知道电脑在访问互联网时,数据的走向情况:

图片

根据这个数据走向,我们就可以得到一个重要的思路,就是根据数据走向来检测网络的通畅情况!因此,我们可以分两步:

1.先测试电脑到网关192.168.2.254的通畅情况

图片

我们可以在自己的电脑上自己ping网关的地址,看是否有响应

图片

一般这样的判断方法是比较快的,但有时候,无论怎样ping都不能,那么则可能有以下的几种情况:

a.网关设备做了禁止ping的设置

b.网关接口或网关设备出现故障

对于a,一般很少会在这些设备在做ping的限制操作,实在是没有太大的必要这样做,当然,网络安全等要求十分严格的除外。ping通192.168.2.254网关后,再ping一下172.16.13.1以确认电脑到整个网关设备都没有问题。

对于ping不通的时候,我个人还建议在电脑上执行如下操作:

图片

即查看电脑本身有没有获取到网关的MAC的地址,显然,如果没有网关的MAC地址,那也是不可能ping通网关的,在排除了前面电脑设置的问题后,你可以猜测是网关设备出了问题,这时就可以联系网络工程师对网关设备进行测试了。

2.测试到其它路由器的通畅情况

前面一步没有问题了,也就是电脑到网关通信正常了,再测试网关到出口路由器的通畅情况:

图片

这里,我们使用tracert -d命令就可以了:

图片

当然,如果发现不通,那么则可能是下面的情况:

a.网关设备与路由器之间的物理链路问题

b.网关设备与路由器之间的设置问题,比如路由协议、接口配置之类的

出现上面的情况,那就是网络工程师的问题了,当然,如果你是网络工程师,应该要马上查看一下设备的状态,看是不是设备哪里出现问题了。

上面的步骤完成了,假设你的出口路由器设置是没有问题的,比如NAT与默认路由等的设置,那么我们大致可以知道,内网的一个基本通信是正常的(至少你的电脑和出口路由器的通信没问题),我们就要看看电脑到底能不能访问互联网了。

3.4 测试ping公网ip的通畅情况(平时要记几个外部IP)

来到这一步的时候,就说明前面三步是没有问题的,也就是说,本地局域网络的通信是正常的,这时要做的就是判断本地局域网络与外网(公网)之间的通信有没有问题了:

图片

这里采取的是直接ping公网地址的方法,是为了排除DNS的影响(万一你的DNS设置又有问题),至于要ping什么样的公网地址,个人建议是,可以ping一些没有禁止ping的公共DNS服务器地址,比如114.114.114.114和8.8.8.8的:

图片

这样之后,基本上就可以确定网络是没有问题的了。当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?由于还要涉及到防火墙的设置,这里就不再提及了,只是仍要注意这一点就是了。

3.5 测试DNS的通畅情况,可以直接ping网站地址

如题,可以直接ping网站地址,看有没有回显IP地址,至于通不通是另外一回事,只要可以回显IP地址,那么DNS就没有问题了,不过这里仍然要说一下nslookup这个命令,这是一个非常好用的命令,我平常自己在网络排错时,基本上都会用到:

图片

当然也可以像下面这样使用:

图片

使用nslookup命令,作用有二:

1.帮你测试你设置的DNS服务器有没有问题

2.在不考虑DNS服务器是否智能的前提下,你可以根据回显IP地址速度的快慢来大致判断DNS服务器的优劣情况

所以可以充分利用nslookup命令了。

加油哦!!!宝~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/10574.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试 Java 并发编程八股文十问十答第十五期

面试 Java 并发编程八股文十问十答第十五期 作者:程序员小白条,个人博客 相信看了本文后,对你的面试是有一定帮助的!关注专栏后就能收到持续更新! ⭐点赞⭐收藏⭐不迷路!⭐ 1)什么是锁的自适应…

Kubernetes 控制平面的安全管理

目录 1. API Server 安全2. etcd 安全3. 网络策略4. 日志与审计5. 定期安全检查与更新6. 云提供商安全集成 Kubernetes 控制平面的安全管理是维护整个集群稳定性和保护敏感信息的关键。控制平面主要包括 API Server、etcd、Controller Manager 和 Scheduler 组件。 1. API Ser…

高斯-牛顿法C实现

高斯-牛顿法(Gauss-Newton method)是一种用于求解非线性最小二乘问题的迭代优化算法。其核心思想是通过近似二阶泰勒展开来简化求解过程,并利用雅可比矩阵(Jacobian matrix)来更新迭代方向。 下面是一个高斯-牛顿法的简单C语言实现示例。这个示例假定我们有一个非线性最小…

Python模块之Numpy(一)-- 创建数组

Numpy是Python用于数据科学计算的基础模块,NumPy 的数据容器能够保存任意类型的数据,可以无缝快速整合各种数据,有助于更加高效地使用pandas等数据处理工具。 数组操作 以下代码是创建一维数组与多维数组并查看数组属性的过程: i…

Mujoco仿真【将urdf文件转化为xml文件】

最近开始学习mujoco仿真方面的内容 先前写过一篇博客:强化学习:MuJoCo机器人强化学习仿真入门(1)_mujoco仿真-CSDN博客 简单介绍了mujoco仿真的一些内容,下面想在Mujoco中将urdf转为xml文件,了解到mujoco是…

Unity值类型和引用类型

我们都知道C#编程语言中,数据类型被分为了两种: 值类型引用类型 那么什么是值类型?什么是引用类型呢?它们的区别又是什么? 为了搞清楚这些问题,我们先列举一下我们开发中会碰到的值类型和引用类型。 常…

【AI+老照片焕新】母亲节用AI把时间的印记变成暖心礼物

想念是一张泛黄的照片,藏在抽屉里的笑容,总是那么亲切。今天是母亲节,是不是想给妈妈来点不一样的惊喜?用AI技术,把那些老照片瞬间焕新,让妈妈的青春记忆重放光华! 想象一下,妈妈年…

使用Giskard进行LLM的测试

Giskard是一个对AI模型进行测试的平台,可以执行功能验证、安全测试及合规扫描。工具主要分为两大块:Giskard Python库和一个server端Giskard Hub。其中Python库是开源的,github地址:https://github.com/Giskard-AI/giskard 使用G…

(delphi11最新学习资料) Object Pascal 学习笔记---第11章第2节 (从接口引用中提取对象)

11.2.5 从接口引用中提取对象 ​ 在过去多个Object Pascal 语言版本中,当你将一个对象赋值给一个接口变量时,是无法访问原始对象的。有时,开发人员会在接口中添加一个 GetObject 方法来执行该操作,但这种设计非常奇怪。 ​ 在今…

华为校招机试 - 模拟汇编计算(20240508)

题目描述 要求设计一种虚拟机解释器,能解析并执行以下虚拟指令。 虚拟机约定: 32位的整型寄存器有 a0,a1,... ,a31 共 32 个寄存器整个虚拟机只有寄存器和立即数参与计算规则集: dst一定为寄存器src为寄存器或十进制正整数运算结果存在负数场景序号虚拟指令含义1MOV dst…

Unity读书系列《Unity高级编程:主程手记》——C#技术要点

文章目录 前言一、业务逻辑优化技巧二、Unity3d中C#的底层原理三、List底层源码剖析四、Dictionary底层源码剖析五、浮点数的精度问题六、委托、事件、装箱、拆箱七、算法总结 前言 本文旨在总结某一概念的性质,并引出相关的技术要点。如果读者希望深入了解相关技术…

docker部署调度程序

Dockerfile(构建初始镜像) # python:3.8-slim-buster为精简版的python FROM python:3.8-slim-buster # 1059为组的id,newgroup为组名,1088为用户的id,newuser为新用户 RUN groupadd -g 1059 newgroup && \useradd -g -u 1088 -g newgroup -m newuser USER newuser RUN…

Python函数和代码复用-课堂练习[python123题库]

函数和代码复用-课堂练习 1、来自计算机的问候-无参无返回值函数 类型:函数‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪…

react 屏幕信息滚动

1. 引入组件 import DoScrollingbar from @/components/basic/DoScrollingbar; 2.使用组件 <DoScrollingbar>{flightInfo.historytoday && flightInfo.historytoday.map(item => {return <div><div><span style={{ paddingRight: "10px&q…

如何根据招聘信息打造完美简历

如何根据招聘信息打造完美简历 招聘信息分析简历调整策略个性化与关键词结语 在求职过程中&#xff0c;简历是第一块敲门砖。它不仅展示了你的专业技能和工作经验&#xff0c;还体现了你对所申请职位的理解和热情。然而&#xff0c;如何从招聘信息中提炼关键点&#xff0c;打造…

如何在 Ubuntu 上创建一个 SSH CA 以验证主机和客户端

简介 在配置大量具有许多用户的服务器时&#xff0c;保持基础架构的 SSH 访问一致可能会变得复杂。有许多实现集中式身份验证机构的方法&#xff0c;例如 LDAP&#xff0c;但有时这些方法可能过于复杂。 SSH 实际上具有使用证书机构对服务器和客户端进行身份验证的功能。这种…

chatGLM或chatgpt:什么是tokens以及如何计算tokens长度?

token是什么? 简单的来说tokens就是大语言模型输入的向量数据,它是从原始的文本转化而来。 比如 输入:here is a text demo tokens为:[64790, 64792, 985, 323, 260, 2254, 16948] 解码:将tokens转化为文本 [‘[gMASK]’, ‘sop’, ‘▁here’, ‘▁is’, ‘▁a’, ‘▁…

mysql --- 内置函数

MySQL数据库提供了一系列内置函数&#xff0c;这些函数可以在SQL查询中使用&#xff0c;以执行计算、格式化数据、处理字符串、日期和时间等操作。这些函数可以大致分为几个类别&#xff1a;字符串函数、数值函数、日期和时间函数、控制流程函数、加密和压缩函数等。下面是一些…

神经网络模型与前向传播函数

1.概念 在神经网络中&#xff0c;模型和前向传播函数是紧密相关的概念。模型定义了网络的结构&#xff0c;而前向传播函数描述了数据通过网络的流动方式。以下是这两个概念的详细解释&#xff1a; 1.1 神经网络模型 神经网络模型是指构成神经网络的层、权重、偏置和连接的集…

SpringBoot拦截器中使用RedisTemplate

这几天想着把登陆拦截器的验证规则修改一下&#xff0c;验证介质由session中获取改为从redis中获取&#xff0c;结果发现redisTemplate一直为空&#xff0c; Configuration public class WebInterceptorConfig implements WebMvcConfigurer {Overridepublic void addIntercept…