一次有关 DNS 解析导致 APP 慢的问题探究

一、业务背景

HTTTPDNS

AWS Router53

APP 使用 HTTPDNS, 为解决 DNS 解析生效慢, DNS 劫持等问题。

我们 IOS 和安卓都是使用了 HTTPDNS

域名托管在 AWS Router53

域名有多个解析(基于延迟),为了解决就近接入。

示例配置

ai.baidu.com	CNAME	延迟	亚太地区(香港)	alias-ai-hk.baidu.com
ai.baidu.com	CNAME	延迟	默认值 	123455.baidu.com
ai.baidu.com	CNAME	延迟	中国	alias-ai-zh.baidu.com
alias-ai-zh.baidu.com  A - - 18.18.18.18(国内ip接入)

二、 问题

很直观的体现就是, APP 打开很慢。反馈主要是国内的用户。APP 用户面向的群体是全球,所以我们有多个接入。背后通过专线打通。

三、问题排查

不管是从前往后查,还是从后往前查。每个阶段都需要查下。

  1. 用户访问到接入层的网络
  2. 接入层到网关的网络。
  3. 各个服务的耗时。看下链路追踪。

这里也就直接说下我们重点关注的问题的地方: DNS 解析。

3.1、问题一: 基于DNS 延迟的解析

因为我们发现由于是基于DNS 延迟的策略,我发现在深圳通过 HTTPDNS 接口获取对应域名的解析,有很大概率会解析到香港的节点。 我们发现这个并不准确。

然后我们调整为 基于 地理位置 的 路由策略。

ai.baidu.com	CNAME	地理位置	香港	 alias-ai-hk.baidu.com
ai.baidu.com	CNAME	地理位置	默认值 	123455.awsglobalaccelerator.com
ai.baidu.com	CNAME	地理位置	中国	alias-ai-zh.baidu.com
alias-ai-zh.baidu.com  A - - 18.18.18.18(国内ip接入)

我们经过测试,发现这个对应的大陆请求都是解析到大陆的节点。 经过这次调整,我们几个APP 好像打开都快了点(不知道是不是心里作用)。 我们继续往下看。

3.2、问题二:HTTPDNS侧

HTTPDNS基础理论

img

HTTPDNS 的原理:

原本用户进行 DNS 解析是向运营商的 DNS 服务器发起 UDP 报文进行查询,而在 HTTPDNS 下,修改为用户带上待查询的域名和本机 IP 地址直接向 HTTPDNS 服务器发起 HTTP 请求,这个 HTTPDNS 服务将返回域名解析后的IP地址。那么这个 HTTPDNS 服务器会做什么? 第一 HTTPDNS 获取到请求后,如果当前节点(HTTPDNS 有很多节点) 没有缓存,那么 HTTPDNS 当前节点会向 DNS权威服务器 发起请求获取对应的解析记录。

那么一个域名的 DNS 权威服务器是什么? 我们可以找到我们的域名再对应的 DNS 管理可以看到。我们的 DNS 服务器信息。

image-20230530223820806

[root@185 ~]# dig xiaoaxiao.cn; <<>> DiG 9.11.4-P2-RedHat-9.11.4-26.P2.el7_9.13 <<>> xiaoaxiao.cn
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 16195
;; flags: qr rd ra; QUERY: 1, ANSWER: 0, AUTHORITY: 1, ADDITIONAL: 1;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4096
;; QUESTION SECTION:
;xiaoaxiao.cn.			IN	A;; AUTHORITY SECTION:
xiaoaxiao.cn.		600	IN	SOA	dns27.hichina.com. hostmaster.hichina.com. 2022052002 3600 1200 86400 600;; Query time: 261 msec
;; SERVER: ……
;; WHEN: Tue May 30 22:37:28 CST 2023
;; MSG SIZE  rcvd: 105

其中 dns27.hichina.com 和 dns28.hichina.com 就是我们这个域名的对应的权威服务器。

每个域名的权威DNS服务器是指该域名的DNS服务器,它负责管理该域名下的所有DNS记录,包括IP地址、邮件服务器、别名等。权威DNS服务器的作用是回答其他DNS服务器关于该域名的所有DNS查询请求。当用户访问该域名时,他们的计算机会向该域名的权威DNS服务器发送查询请求,以获取与该域名相关的IP地址和其他DNS记录

相关问题

前面讲到 HTTPDNS 会请求 该域名的 DNS 权威服务器, 这里注意我们的域名是托管在AWS 的 router53 上的,也就是该域名对应的 DNS 服务器是 AWS 的在海外的。 注意是海外的。 那么这里有个链路就涉及到跨地域了,我们国内的用户访问 HTTPDNSHTTPDNS服务端 再去访问 AWS 的DNS 服务器,这就涉及到跨地域。我询问了下 httpdns 的技术人员,并让他们给出对比数据。 HTTPDNS服务端 再去访问 AWS 的DNS 服务器 这个延迟会比访问国内的 DNS服务器慢很多。

北京:dp(35ms),aws(110ms);
上海:dp(3ms),aws(61ms);
广州:dp(5ms),aws(90ms);

那么这也是一个慢的原因。

我们继续怀着疑问,那么 HTTPDNS 服务端的节点不会有缓存吗? 如果有缓存的话那也只有第一次会慢。 HTTPDNS对应的技术人员告诉我们目前的策略是,是有缓存的,基于域名的 ttl 值来进行缓存的。当到达 ttl 值的 30% 剩余时间,如果剩余时间内有请求过来,那么会异步去再去请求权威服务器来刷新当前的缓存值。 如果没有请求,则到了ttl 值缓存失效。

  • ttl 值
  • 请求量。

实际测试并不是这个逻辑。 根本没有 30% 的阈值和 异步。说是后期会有。

image-20230531181616551

也就是说,HTTPDNS, 服务端做的缓存只有存在一个基于TTL的缓存,如果你的请求是在TTL 过期的时间后,那么那一次请求 HTTPDNS 会耗时比较久。我测试了几次,第一次获取基本需要400MS左右。

四、优化方向

4.1、域名解析配置

  • 尽量只配置一层解析。或者使用 CNAME 加速

    假设 a.comb.comc.com 都是在 解析的域名:

    域名记录类型记录值
    www.a.comCNAMEwww.b.com
    www.b.comCNAMEwww.c.com
    www.c.comA1.2.3.4

    只配置一层解析也就是 www.a.com 直接 A 记录到具体的 IP

    如果我们设置的是 www.a.com cname 到 www.b.comwww.b.com cname 到 www.c.com, www.c.com A 记录到具体的 IP,

    一般情况下,递归需要到授权服务器请求三次才能得到 www.a.com 的 IP 地址,如下图所示:
     

    img


    启用 CNAME 加速功能,授权服务器会把 CNAME 记录和最终的 A 记录一次返回给递归,递归服务器由请求三次授权服务器,减小到请求一次,如下图所示:
     

    img


    这样就极大地减少了请求和应答中网络通信消耗的时间,让解析变得更快,特别是在设置多条 CNAME 解析记录的情况下,加速效果更明显。

4.2、靠近 HTTPDNS 服务端层

  • 缩减 HTTPDNS 到权威服务器之间的耗时。 把域名切到 DNSPOD 、万网等国内域名商。 AWS(非AWS 中国) Router53 不支持国内 DNS 节点。

  • 调整 TTL 值, 也就是增大 TTL 值,让它在 HTTPDNS 服务端缓存失效的时间变长,时间变长,在相同时间范围内,需要去请求权威服务器的次数也会变少。

  • 增加请求量, 像 HTTPDNS 某个运营商在国内有近 100多个节点。 如果我们的请求量达不到一个层级的话。那么请求到每个节点的请求去命中缓存的概率也会降低。 这样可以通过拨测实现,但是注意,不是直接拨测对应的域名,拨测的应该特定的接口(HTTPDNS 的接口)。 如果直接拨测域名的话,只是改变的公网解析的场景,而改变不了HTTPDNS 的场景。

4.3、靠近用户层

也就是APP 层

  • 减少请求HTTPDNS

    尽量使用缓存的DNS , 不要频繁请求 HTTPDNS

  • 预解析和乐观DNS

    预解析: 绝大多数的 APP 在应用初始化阶段都有一个启动期,我们可以在这个启动期做一些preflight工作,即在初始化阶段我们可以针对业务的热点域名在后台发起异步的 HTTPDNS 解析请求。这部分预解析结果在后续的业务请求中可以直接使用,进而消除首次业务请求的 DNS 解析开销,提升 APP 首页的加载速度。

    乐观DNS: 乐观 DNSOptimistic DNS)是一种基于缓存的 DNS 解析方法,它认为大多数 DNS 查询都会命中缓存,因此不需要每次都向上游 DNS 服务器发送查询请求,而是直接使用本地缓存中的结果。只有在缓存中没有找到对应的解析结果时,才会向上游 DNS 服务器发送请求。

五、扩展

5.1、如何测试本地到权威DNS服务器 获取域名的时间

[root@185 ~]# time dig @ns4.dnsv4.com  www.a.com  
……real	0m0.074s
user	0m0.006s
sys	    0m0.008s

5.2、 同地区不同网络,访问HTTPDNS 会不会命中缓存。

比如同一个手机,不同的网络,切换 联通到电信 在TTL 时间范围内,访问 HTTPDNS(腾讯云) 会不会命中缓存?
比如后面的 DNS 配置只配置了,基于地理位置的逻辑的配置。 比如 国内 到 A , 国外到 B. 在这个场景下 会不会命中缓存? 可以想一想?

经过确认, 腾讯云的HTTPDNS 是 同一个地域(省或者直辖市)+同一个运营商,会命中同一个缓存。 但是注意,同一个地域的 HTTPDNS 后端节点有多个,可能请求会到不同的节点,也可能命中不了缓存。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/7393.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

首席数据官CDO行业背景主要职责是什么?

首席数据官&#xff08;Chief Data Security Officer&#xff0c;简称CDO&#xff09;&#xff0c;是指在企业中负责整个机构的数据安全策略&#xff0c;监控、治理、控制、协调企业内部的数据安全工作、政策制定和有效利用的高级管理人员。包括信息技术、人力资源、通信、合规…

英语学习笔记3——Sorry, sir.

Sorry, sir. 对不起&#xff0c;先生。 词汇 Vocabulary umbrella n. 伞&#xff0c;保护伞 注意读音 [ʌm’brelə] 英国人离不开雨伞。 please 请 特殊用法&#xff1a;让路&#xff08;升调&#xff09;      用餐礼仪&#xff08;平调&#xff09;      求求你…

10.Java对象内置结构

文章目录 Java对象内置结构1.Java对象的三个部分1.1.对象头1.2.对象体1.3.对齐字节 2.对象结构中核心字段的作用2.1.MarkWord(标记字)2.2.Class Pointer(类对象指针)2.3.Array Length(数组长度)2.4.对象体2.5.对齐字节 3.Mark Word的结构信息3.1.不同锁状态下的Mark Word字段结…

在vcenter 资源池中创建安装虚拟机

打开vSphere客户端并登录到vCenter服务器。在左侧导航栏中&#xff0c;选择您要在其中创建虚拟机的资源池。在资源池的摘要选项卡中&#xff0c;单击"创建虚拟机"按钮。在虚拟机创建向导中&#xff0c;填写虚拟机的名称、操作系统和其他配置选项。在选择存储选项中&a…

耐高温轴承新选择:锅炉、固化炉、无油自润滑,稳定又可靠

江苏鲁岳轴承制造有限公司是一家专业从事高温轴承研发、生产和销售的企业。该公司的高温轴承产品具有出色的技术性能和广泛的应用领域。 以下是江苏鲁岳耐高温轴承的技术介绍&#xff1a; 承载能力强&#xff1a;江苏鲁岳的高温轴承通常采用高温合金、陶瓷等特殊材料制造&…

人工智能_大模型049_模型微调009_llama2模型训练_代码分析和实现_代码记录---人工智能工作笔记0184

以上是项目的整体结构,其中上一节我们看了chatglm3目录下,对chatglm3模型的训练部分的代码,然后 这里的llama2目录下是对llama2模型进行训练的代码. 然后web_demo目录是,对web浏览器中,使用chatglm3,以及llama2.py进行的封装下一节我们再看这个部分 E:\2024\人工智能\fine-tun…

[疑难杂症2024-004] 通过docker inspect解决celery多进程记录日志莫名报错的记录

本文由Markdown语法编辑器编辑完成&#xff0e; 1. 前言 最近我负责的一个服务&#xff0c;在医院的服务器上线一段时间后&#xff0c;利用docker logs查看容器的运行日志时&#xff0c;发现会有一个"莫名其妙"的报错&#xff0e;报错的大致内容就是&#xff0c;ce…

docker的commit命令使用制作镜像

docker run -it ubuntu 最基础的ubuntu启动后安装vim 的命令 apt-get update apt-get -y install vim docker commit -m"my_test_ubuntu" -a"za" 80977284a998 atljw/myubuntu:1.0 将本地镜像推送到阿里云 首先登录阿里云服务-控制台 记得一定要设定设…

JVS物联网设备连接管理:支持手动与定时启停

通道连接的启停 功能说明 为了更灵活地管理设备连接&#xff0c;平台需要在设备连接的新增和编辑功能中增加启停策略的配置。支持手动启停和定时启停两种选项&#xff0c;以便根据实际需求对设备连接进行灵活的控制。 功能 手动启停&#xff1a; 用户可以选择手动启停作为…

uniapp uni-push 1.0 APP消息推送实现

1.获取cid plus.push.getClientInfoAsync((info) > {let cid info["clientid"]; }); 2.在manifest.json中找到App模块配置&#xff0c;勾选Push(消息推送)&#xff0c;重新打一个自定义基座&#xff0c;再真机运行 3.在DCloud官网使用获取到的cid自测消息是否可…

抖音爆火的QQ价格评估前端源码

最近抖音很火直播给别人测qq价值多少&#xff0c;这个源码只有前端&#xff0c; 包含激活码验证页&#xff0c;评估页 源码免费下载地址抄笔记 (chaobiji.cn)

springboot+mp自动生成没有实体类

mybatisX版本冲突问题 一开始我的MyBatisX版本是1.6.1-3,使用mybatis-plus一直不能正常生成实体类 将MyBatisX的版本换成了1.5.7就可以了 MyBatisX版本更换 1.将原有的MyBatisX卸载后重新安装一个新的版本 2.选择一个合适的版本,这里我选的是1.5.7 下载完成后自己选择一个…

两次DNAT(端口映射)的问题验证

1.问题描述 某Linux课程上看到&#xff0c;两次DNAT&#xff08;端口映射&#xff09;会导致TCP源丢失的问题&#xff0c;因为本身学过网络相关的知识&#xff0c;理论上并未发现会在哪个节点丢失源的问题&#xff0c;遂实验验证。 2.ensp模拟验证 因为使用手头没有eve模拟器…

Apache POI入门学习

Apache POI入门学习 官网地址 excel中使用到的类读取excel表格内容表格内容maven依赖方式一测试结果 方式二测试结果 向excel中写入数据方式一方式二方式三测试结果 从 Excel 工作表中的公式单元格读取数据测试结果 Excel 工作表中写入公式单元格从受密码保护的Excel中读取数据…

远程代码/命令执行(RCE)

远程代码执行/远程命令执行&#xff08;remote/code/execute||remote/command/execute&#xff09; 类似sql注入xss等漏洞&#xff0c;rce也是代码注入&#xff08;用户可控&#xff09;&#xff0c;注入对象为操作系统命令、后端代码&#xff0c;用户参 数可控&#xff0c;且未…

autoware.auto 安装 ROS2

先进行docker安装 sudo apt-get update sudo apt-get install ca-certificates curl gnupg lsb-release curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [archamd64] https://download.docker.com/linux/u…

【前端】HTML基础(2)

文章目录 前言一、HTML常见标签1、 注释标签1.1 标题标签1.2 段落标签1.3 换行标签 2、 格式化标签2.1 加粗标签2.2 倾斜标签2.3 删除线标签2.4 下划线标签 3、 图片标签3.1 src属性3.2 alt属性3.3 title属性3.4 图片大小3.5 图片边框 4、 超链接标签4.1 属性4.2 属性 前言 这篇…

Chromium编译指南2024 Windows11篇-配置depot_tools工具(二)

前言 在《Chromium编译指南2024&#xff08;一&#xff09;》我们探讨了Chromium编译前的准备工作和Visual Studio安装。 接下来&#xff0c;我们将详细介绍如何下载、解压并配置depot_tools工具&#xff0c;以便顺利进行后续的开发工作。 1. 下载解压depot_tools 包 下载d…

Python | Leetcode Python题解之第73题矩阵置零

题目&#xff1a; 题解&#xff1a; class Solution:def setZeroes(self, matrix: List[List[int]]) -> None:m, n len(matrix), len(matrix[0])flag_col0 Falsefor i in range(m):if matrix[i][0] 0:flag_col0 Truefor j in range(1, n):if matrix[i][j] 0:matrix[i]…

DS:链表的分类

欢迎来到Harper.Lee的学习世界&#xff01; 博主主页传送门&#xff1a;Harper.Lee的博客主页 想要一起进步的uu欢迎来后台找我哦&#xff01; 链表的结构⾮常多样&#xff0c;以下情况组合起来就有8种&#xff08;2 * 2 * 2&#xff09;链表结构。下面我们依次来认识它们吧&am…