跟我学-域名解析故障排查技巧

天苍苍,野茫茫,网站一瘫,唯有泪两行!!
客户跳,老板叫,解析故障,心惊又肉跳!!

对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象。为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套《域名解析故障排查技巧实操全网最全手册》,并分为“初阶版”“进阶版”,跟我学完保您在排查解析故障方面,脑回路神清晰,分分钟就能定位问题。为了助您减少客户不可用时间,并赢得老板信任,今天就来听听小编跟大家唠唠域名解析那点事儿。

因为DNS是互联网流量的入口,所以企业网站一旦发现不可用,运维人员都需要第一时间优先排除是否为域名解析故障导致。其次我们需要知道域名解析故障与网站不能访问是两个概念,因为网站的访问与域名解析、网站服务器、网站备案、网站程序、网路环境等诸多因素都有关联,而本文则重点描述 域名解析故障 排查的方法和思路。

初阶版

多数用户反映的域名解析故障,其实并不一定是真的域名解析出了问题,小编在这里为大家总结了最常见的四种原因,可帮助大家快速定位原因:
第一、 因为域名过期、被锁定都会导致域名无法正常访问。 
① 首先我们要知道为什么域名异常会直接导致域名解析异常呢?
因为域名处于域名解析的上游服务,所以递归解析过程中如果域名环节存在异常,权威DNS服务器是接收不到DNS查询请求并完成响应任务的。
② 其次我们要知道域名在什么场景下会导致域名解析异常?

  • 域名过期:一般域名注册商通过修改用户DNS服务器名称,实现访问页面显示域名过期。
  • 域名状态:如果域名处于clienthold、serverhold、inactive三种状态,则代表是因为域名状态异常导致解析异常。

③ 最后我们再加深了解如何定位原因与解决。
阿里云DNS为用户提供了 域名检测工具,可一键查询出域名有效期和域名状态是否存在异常。

  • 域名过期: 域名续费后解析生效时间取决于TTL的设置,一般10分钟后可以在进行解析生效测试。
  • 域名状态:域名状态异常时可参考下图提供的解决方法处理。

第二、 check备案是否存在异常
首先我们需要知道域名解析和备案实际并无直接关联关系,即使网站出现备案异常,是完全不影响域名解析的设置和解析的生效。而备案异常则会直接影响网站的访问与使用,您可以通过 域名检测工具一键查询备案情况,如备案检查出现异常,即可联系网站服务器供应商定位备案的异常原因并解决。

第三、 check下是否在48小时内修改过域名DNS服务器名称

修改DNS服务器后,解析生效时间取决于本地DNS中缓存的DNS服务器名称的TTL时间,一般需要24-48小时。所以在修改DNS服务器48小时内,新/旧DNS服务商的解析数据需要保持一致,如果您在原DNS服务商删除了解析记录、或者在新DNS服务商未添加解析记录、或者新/旧DNS服务商添加的解析记录不一致,都有可能导致解析不可用、或者出现站点时而正常时而异常的现象。
结论:如果排查是此情况导致,您可到新/旧DNS服务商操作,最终保持解析数据一致,即可实现快速恢复。

第四、 check解析记录
①检查解析记录的设置是否正确

建议运维GG们首先可通过 域名检测工具 ,检查下DNS服务商的解析结果,如提示“未检测到该域名设置DNS解析记录”,则建议您检查下解析记录的设置是否正确,例如是未设置该条子域名,还是被“误操作”“不小心”给删除了?还是修改解析记录时输入错误了?总之错误的原因皆有可能,我们首要先排除下因配置原因导致的异常错误。

②检查是否近期刚修改过解析记录。
如果修改了解析记录,需要等待各地的运营商Localdns的缓存到期,域名解析才会生效。一般修改解析后的生效时间取决于域名的TTL设置。您可以通过 域名检测工具 查出TTL生效时间,等待此TTL生效时间后再次检查。

③检查智能解析线路是否未设置默认线路
云解析DNS的智能解析线路,解析优先级是按照“专线”线路、“默认”线路的排序应用,如果访问者来源不属于“专线”线路,而管理员又未设置“默认”线路场景,则会造成此部分用户无法访问站点。

如果以上初步排查后,排查结果都属于正常,那么则可以随小编进入进阶版学习了。

进阶版

在进入进阶版前,要深入了解域名解析异常情况,绕不开的就得先了解域名解析递归流程,很多同学应该还不知道解析的110套路,简单来说就是在递归DNS未有缓存场景下,1次域名解析需要经历10次查询交互。

从上面的解析流程介绍我们可以看出,域名解析的过程是经历很多查询交互,任意一环节出现问题都可能会导致解析不生效,所以接下来小编就教教在每个环节如何排查解析异常问题。一般判断解析不生效的定义是DNS查询请求未能查询到域名指向的服务器IP地址或者查询的IP地址与预期不一致。多表现于权威DNS解析结果和递归解析结果/本地DNS解析结果/公共DNS解析结果不一致,或查询结果显示无数据。

第一、排除下权威DNS的解析数据是否存在异常
权威DNS是真正管理域名和IP地址映射关系的DNS服务器,阿里云提供的云解析DNS就是权威DNS,所以第一步,小编教您优先检查权威DNS的解析数据是否存在异常。
用 域名检测工具,重点查看DNS服务商解析结果,见下图。

① 检查解析结果和您在DNS服务商控制台处设置的解析记录对比是否一致,如一致代表权威DNS解析是正常生效的。
② DNS服务商解析结果显示DNS未设置解析记录,则需要检查您是否为忘记设置或误操作过删除等行为。
③ 检查结果和您在DNS服务商控制台设置的解析记录不一致,此种场景则需要联系您的DNS服务商进行解析数据刷新处理。

第二、排除下是否属于用户本地DNS服务器问题
本地域名服务器是响应来自客户端的递归请求,并最终跟踪直到获取到解析结果的DNS服务器。例如用户本机自动分配的DNS、运营商ISP分配的DNS,我们也可称之为递归DNS。
用 域名检测工具,在本地DNS检查模块下载客户端查询工具。

用本地DNS工具检测结果如下:

如果确认权威DNS解析是正确的情况下,发现本地DNS解析结果与权威DNS结果不一致,则代表域名解析是在用户本地没有生效。那么为什么会出现本地解析没有生效呢?
主要有下列几种情况:
① 本地DNS服务器上的缓存信息未到期导致。 ->此场景,只需要等待本地DNS解析处显示的TTL生效时间到期后,再次尝试测试即可。
② 如果本地DNS解析TTL过期后测试,仍然和权威DNS解析结果不一致,尝试检查公共DNS解析结果是否一致。
③ 如果公共DNS解析结果和权威解析结果一致,说明权威DNS和公共DNS上解析数据都是生效的,那么可以判断为是用户本地DNS未生效,此种情况建议刷新本地DNS服务器后再进行测试、或将本地DNS服务器修改为公共DNS服务器。

放心放心,小编为了让您能加深了解和记忆,早已为您精心绘制了精简版的Check List,一表在手,让我们帮您把排查解析异常故障的时间“打下来”。

第三、排除下是否为域名被阻断导致域名解析异常

①通过 域名检测工具 ,如递归解析追踪报错“域名递归解析过程被污染“。
一般是域名正常解析过程中受到上级网络设施强行阻断,这已超出权威DNS服务能力, 如果遇到此情况,小编也很遗憾不能给予更好的解决办法,一般建议用户更换业务域名。

②判断递归解析过程哪个环节被“污染”
您也可以通过命令dig+trace测试,本地DNS向根DNS服务器查询时,直接返回了IP地址,则一般可判断为在DNS查询在根DNS服务器处就被阻断。

这次的分享就先到这里了,最后,希望小编为大家总结的《域名解析故障排查技巧实操全网最全手册》,能够有效帮助到您快速定位解析异常原因和降低业务不可用时间。


原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516978.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

axios安装使用

1.进入项目运行命令,原因同v-resource安装 cnpm install axios --save 2.在需要使用时引入 如: 使用按照gitubs上提供的示例做就可以了

首次曝光 | 阿里数万名开发者都在使用的数据库开发工具到底长什么样?

除了基础的数据查询开发功能,DMS还内置SQL审核、性能诊断优化、测试数据自动生成、多环境数据对比同步、数据库日志追踪回滚、不锁表变更、访问控制、敏感数据脱敏、安全审计等高端功能。 1、丰富的数据源 🔸丰富的数据库类型支持(当前已超…

MySQL5.7.x 安装 Linux7环境

文章目录一、软件安装1. 下载2. 解压3.安装4. 跳过权限5. 启动mysql服务端6. 设置密码7. 允许远程连接8.开发3306端口二、安装报错方案一、软件安装 1. 下载 wget https://downloads.mysql.com/archives/get/p/23/file/mysql-5.7.33-1.el7.x86_64.rpm-bundle.tarhttps://dev.…

使用ant design vue 中table组件运行时not found: Error: Can't resolve 'reqwest' in 'D:\vue\antd-demo01\src\com

最近使用table时按照官网api使用table报了上面这个错误 1.只需要安装无法找到文件就可以正常运行了 2.命令行cd进入项目文件 3.运行npm install --save reqwest table就出来了

Serverless Kubernetes 入门:对 Kubernetes 做减法

导读:Serverless Kubernetes 是阿里云容器服务团队对未来 Kubernetes 演进方向的一种探索,通过对 Kubernetes 做减法,降低运维管理负担,简化集群管理,让 Kubernetes 从复杂到简单。 背景 Kubernetes 作为通用的容器编…

硬核“毕业证”:5 位本科生带自研处理器芯片毕业,包云岗解读“一生一芯”计划...

作者 | 包云岗责编 | 伍杏玲本文经作者授权转载自包云岗知乎【编者按】近日,中国科学院大学五位本科生的硬核“毕业证”引发IT圈热议,在“一生一芯”培养计划下,由五位2016级本科生主导完成一款64位RISC-V处理器SoC芯片设计并实现流片&#x…

如何打造“智能助理”?阿里对话开发平台这样做

阿里妹导读:一个合格的智能助理能够帮你预约开会时间,处理日常办公需求,还能打电话提醒你要还信用卡了,作为用户或者消费者,我们已经越来越习惯对话机器人提供的各色服务。但对于企业来讲,搭建提供这些服务…

关于vue中使用iconfont

1.进入iconfont图标库 2.点击下载 3.将下载文件解压拷贝至项目assets文件夹下 4.在main.js中全局引入 import ./assets/iconfont/iconfont.css5.在App.vue中使用 <span class"icon iconfont icon-****"></span>今天使用过程中按照这个导入还是一直会…

openoffice 安装 linux环境

文章目录一、安装配置启动1. 下载软件2. 上传文件3. 解压4. 安装rpm文件5. 安装openoffice6. 前台启动7. 后台启动8. 查看启动状态二、openoffice卸载与异常2.1. 删除openoffice2.2. 启动异常2.2. 解决方案2.3. 启动异常22.3. 解决方案2一、安装配置启动 1. 下载软件 https:/…

阿里巴巴大规模应用Flink的踩坑经验:如何大幅降低 HDFS 压力?

众所周知 Flink 是当前广泛使用的计算引擎&#xff0c;Flink 使用 checkpoint 机制进行容错处理[1]&#xff0c;Flink 的 checkpoint 会将状态快照备份到分布式存储系统&#xff0c;供后续恢复使用。在 Alibaba 内部我们使用的存储主要是 HDFS&#xff0c;当同一个集群的 Job 到…

云原生领域首本架构白皮书,你Get到了吗?

来源 | 《云原生架构白皮书》【导读】近日&#xff0c;由阿里云 20 位云原生技术专家共同编撰的《云原生架构白皮书》正式对外发布。作为业界第一本全方位构建云原生架构规划与实践全景图的白皮书&#xff0c;本书在详细阐述云原生架构定义的同时&#xff0c;完整展示云原生架构…

让机器读懂视频:亿级淘宝视频背后的多模态AI算法揭秘

背景 随着4G的普及和5G的推出&#xff0c;内容消费的诉求越来越受到人们的重视。2019年互联网趋势报告指出在移动互联网行业整体增速放缓的大背景下&#xff0c;短视频行业异军突起&#xff0c;成为“行业黑洞”抢夺用户时间&#xff0c;尽管移动互联网人口红利见顶&#xff0…

“崩溃!我再也不搞 AI 了”谷歌 AI 专家:别让你的方法打败你!

今天&#xff0c;想跟大家聊聊 Python 人工智能。最近几年&#xff0c;我看过市面上很多 Python和人工智能的教程&#xff0c;基本都是先介绍Python基本语法、dict、tuple 等基本库的使用&#xff0c;最后学习机器学习、深度学习的常用算法......但我与 Google 人工智能开发专家…

解决jodconverter 2.2.1 版本不支持docx、xlsx、pptx 转换成PDF格式异常

文章目录一、基础对比1.版本对比2.异常现象二、分析定位2.1. 找异常输出处2.2. 找异常源头2.3. api源头三、实现流程3.1. 思路3.2. 新建包重写类3.3. 完整类一、基础对比 1.版本对比 03版本office07版本及高版本office.doc.docx.xls.xlsx.ppt.pptx 2.异常现象 搭建好 Spring…

突破边界局限,阿里云神龙负责人张献涛分享15年虚拟化之路

2020年1月8日&#xff0c;弹性计算服务技术总负责人张献涛受邀出席“面对面 见未来”的沙龙分享活动&#xff0c;现场听众主要是银行、保险、证券等金融行业的CTO、CIO等。 演讲开始前&#xff0c;听众们了解神龙云服务器的并不多。在听完张献涛的介绍后&#xff0c;他们对神龙…

Tablestore入门手册-UpdateRow接口详解

表格存储Tablestore入门手册系列主要介绍表格存储的各个功能接口和适用场景&#xff0c;帮助客户了解和使用表格存储Tablestore。本文对表格存储Tablestore的UpdateRow接口进行介绍&#xff0c;包括其参数、功能示例、使用场景等。 接口概述 UpdateRow接口是表格存储Tablestor…

给力!一行代码躺赚普通程序员10年薪资!

笔者这两天闲逛知乎&#xff0c;看到了这个帖子&#xff1a;匿名答题&#xff0c;发表于2014年&#xff0c;此外没有留下任何多余信息。2年躺赚200万&#xff0c;相当于普通程序员10年的工资。没想到Pyhon这么强大&#xff0c;怪不得有人说“除了不会生孩子&#xff0c;Python什…

支付宝移动端 Hybrid 解决方案探索与实践

目前 mPaaS H5 容器 Demo 源码已发布至 GitHub&#xff0c;全新的接入方式让你可以一键集成 mPaaS 环境并快速接入 H5 容器&#xff0c;体验统一的容器和内核&#xff0c;获取媲美原生的 Hybrid 方案及完美的动态能力。 支付宝 Hybrid 方案建设与演进 目前支付宝有 2 套 Hybr…

SpringBoot 整合 knife4j

文章目录简述2. 导入依赖3. 创建配置类4. 创建User实体类5. 创建开发接口6. 启动项目简述 Swagger是一款测试文档Api接口&#xff0c;具体用法见SpringBoot整合Swagger。而knife4j是对Swagger进一步封装&#xff0c;其优化了api文档的界面。官网https://doc.xiaominfo.com/kni…

如何将数据仓库从 AWS Redshift 迁移到阿里云 AnalyticDB for PostgreSQL

阿里云AnalyticDB for PostgreSQL&#xff08;以下简称 ADB PG&#xff0c;即原HybridDB for PostgreSQL&#xff09;为基于PostgreSQL内核的MPP架构的实时数据仓库服务&#xff0c;可以支持复杂ETL任务&#xff0c;也支持高性能在线查询&#xff0c;同阿里云生态紧密结合。AWS…