流量隔离方案 Dpath 护航双十一新零售

需求

在今年的双11准备期间,业务同学提出要针对新零售进行特殊的保障,希望新零售过来的流量,单独进入到一批机器,和其他普通流量隔离开来,这对新零售系统稳定性提出更高的要求。

需求总结下来就是:

  • 针对特殊流量可以在链路上按需选择一些应用,从所有机器(公共集群)里圈定一些机器作为特殊流量的专属机器,以便对特殊流量进行特殊支持。
  • 普通流量不进入专属服务器,特殊流量可以按需使用普通服务器
  1. 如果链路上某个应用app_x没有划出专属机器,那么特殊流量和普通流量公用app_x的所有机器(我们称之为公共集群)。
  2. 如果app_x划了专属机器,但是这些机器因为某种原因不可达,那么特殊流量可以根据配置的failover策略决定是否使用公共集群。
  • 整个链路上各个应用的划出来的专属机器组成了特殊流量的专属通道,类似公交专用道。
  • 我们的RPC框架已有的路由功能是在单次调用上生效,基于单次调用的路由功能实现全链路的路由会非常麻烦。所以我们提出了一个全链路上的做流量隔离的方案Dpath(Dedicated path)。

方案工作机制

我们分三步来说明Dpath如何工作:

  • 圈定专属服务器
  • 识别特殊流量
  • 在链路上引导流量到对应的服务器

圈定专属机器

简单来说,我们需要的信息就是一个专属环境里包含哪些应用的哪些机器。该信息以JSON形式存放在配置中心,样本如下:

{
"enable": true, 
"envRules": [{"envName": "newRetail", "failoverPolicy": 0,"envAppRules": [{"appName": "app1", "ips": [ ], "machineGroups": ["app1_newRetail_host"]}, {"appName": "app2", "ips": [ ], "machineGroups": ["app2_newRetail_host"]}, {"appName": "app3", "ips": [ ], "machineGroups": ["app3_newRetail_host"]}, {"appName": "newRetailEntryApp", "ips": [ ], "machineGroups": ["newRetailEntryApp_host"]}]}
]
}    

上述配置申明了一个名为newRetail的专属环境,里边包含app1,app2,app3,newRetailEntryApp四个应用以及对应的机器。

Dpath工具包会订阅该配置,各个中间件使用Dpath工具包即可获知所需的信息。

识别流量

Dpath通过trace模块(全链路的trace功能,可以在链路上传递数据)携带的dpath_env属性来识别当前流量属于哪一个专属环境。具体如何根据请求信息映射到一个专属环境是业务逻辑,由业务同学完成。这个识别动作可以放在如下三个地方:

  • Nginx

可以根据http请求信息来识别流量。根据业务规则实现请求到dpath_env的映射,通过Nginx模块生成将env信息添加到trace模块的上下文

  • 入口应用

中间件取环境信息如果为空,默认会使用当前机器所属的环境。所以如果入口应用确定,那么将整个入口应用划到专属环境即可。目前新零售都是这种模式。

  • 业务代码

业务代码可以根据需要设置trace模块上下文中的的dpath_env,随时改变流量所属的环境。

引导流量

dpath只定义了机器,环境,以及流量的关系,并没有规定如何引导流量。引导流量由各个中间件自行实现。

这里只以rpc为例说明如何基于Dpath的规则来引导流量到对应的服务器。

为了方便理解,先忽略RPC其他的路由逻辑,看最简单情况下,单次调用的处理。没有Dpath功能时,RPC客户端就是从注册中心拿到service对应的服务器列表,然后随机调用。如下图所示:

增加Dpath功能之后,服务名到服务器的映射中间插入了一个dpath_env的逻辑。RPC客户端先根据请求上下文中的环境信息选中对应环境的地址,然后随机调用。如下图所示:

整个链路上,一个专属环境里所有应用的专属服务器串起来构成了特殊流量的专属路径。如下图所示:

  • newRetailEntryApp进入的newRetail流量使用专属机器
  • 链路上没有划机器给newRetail的应用,使用公共集群

RPC之外,消息等中间件,都用各自的方式达到了类似的隔离效果。这里不再赘述细节。下面只提供一个RPC和消息支持Dpath的效果简图:

野流量隔离

根据上面的描述,RPC的隔离逻辑是在客户端生效。那么如果客户端没升级的话(很难快速协调所有客户端统一升级),就会有未知流量打到专属服务器,老客户端过来的不符合规则的流量我们称之为野流量。

为了解决野流量问题。注册中心的同学在发布订阅功能的基础上,提供了一个namespace功能。我们会把专属服务器的服务发布到Dpath这个namespace下,普通服务器默认发布到default这个namespace。新版本的客户端会订阅default+dpath两个namespace的数据,相当于拿到全量地址。而注册中心保证老的客户端只能看到default空间下的数据,这样就不会有野流量达到专属服务器了。

总结

Dpath是一个通用的流量隔离方案,可以支持一些需要隔离或者引导流量的场景,比如全链路常态隔离,灰度测试,蓝绿发布等。

目前业务方主要是在全链路上按业务属性进行常态流量隔离,已经在几个新零售场景线上使用,并且经历了双11的考验。

以下列举一些业务流量隔离的好处:

  • 业务方可以根据业务属性的不同做不同的支持:个性的配置,更全的监控等。
  • 重要业务不受其他流量影响,不会因为其他流量突增而导致load高,被限流。
  • 小集群支持单业务,发布,回滚,都更快。当特定业务出问题时,可以更快地响应。

 


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/520368.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

潘石屹接连带货 Python,要来抢我们的饭碗?

地产大亨潘石屹近日开始一项全新学习,刷爆程序员的朋友圈,程序员纷纷议论起来:地产大亨也要来抢饭碗啦?11月14日,他说:今天开始我学习一门新的语言Python,我在寻找。这也是今天给自己人生的礼物…

mysql连接不上怎么重置密码错误_MySQL数据库连接不上、密码修改问题

1.问题描述版本:【CentOS8】【MySQL5.7】问题:远程使用navicat连接不上数据库,后来试了在linux中都登不进去。根据提示应该是密码不对,此文主要介绍密码修改和一些注意事项。2.解决方法1)因为现在登不进去,所以没法修改…

服务化改造的云上利器 | 阿里云 EDAS 重大升级发布

11月22日,广东云栖大会企业级互联网架构专场上,阿里云发布了全新版本的企业级分布式应用服务EDAS。 新版本增强了对主流微服务框架的原生支持,实现SpringCloud & Dubbo用户代码零侵入就能迁移至EDAS,降低开发者的接入门槛&am…

Nacos发布0.5.0版本,轻松玩转动态 DNS 服务

阿里巴巴微服务开源项目Nacos于近期发布v0.5.0版本,该版本主要包括了DNS-basedService Discovery,对Java 11的支持,持续优化Nacos产品用户体验,更深度的与Spring Cloud体系的网关集成等方面做了演进。 一、发布 DNS-F 为了进一步…

刷爆了!华为:这类程序员我给200万!你怎么看?

从2017年开始,人工智能便波澜不断,无论是从BAT高调布局AI,还是从年薪50万招聘AI应届生,炽手可热形容AI工程师一点都不过分。百度推出“少帅计划”,针对30岁以下的深度学习科学家,开出100万以上年薪!阿里巴巴…

如何在优雅地Spring 中实现消息的发送和消费

本文将对rocktmq-spring-boot的设计实现做一个简单的介绍,读者可以通过本文了解将RocketMQ Client端集成为spring-boot-starter框架的开发细节,然后通过一个简单的示例来一步一步的讲解如何使用这个spring-boot-starter工具包来配置,发送和消…

假如有人把支付宝存储服务器炸了

戳蓝字“CSDN云计算”关注我们哦!作者 | 净整些没用的责编 | 阿秃近日,在知乎看到了一个问题《假如有人把支付宝存储服务器炸了(物理炸),大众在支付宝里的钱是不是就都没有了呢?》外行人问题。网站都是有服…

如何在一分钟内实现微服务系统下的架构可视化

为什么需要架构可视化 随着企业进行微服务架构改造,系统架构复杂度越来越高,架构变化日益频繁,微服务改造后的实际架构模型可能与预期已经产生了巨大差异,架构师或系统运维人员很难准确记忆所有资源实例的构成和交互情况&#xf…

SpringBoot2.x整合Redis 分布式集群_02

文章目录1. maven依赖2. RedisConfig3. RedisUtils4. application.yml5. 单元测试6. redis 客户端查看1. maven依赖 <!--redis Start--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis<…

驱动阿里云的高性能网络引擎- 飞天洛神

大家都知道阿里云部件的系统都是以神仙命名的&#xff0c;比如说洛神、伏羲、盘古、女娲等等。而在11月15日的GNTC 云专场峰会上&#xff0c;阿里云资深网络技术专家宗志刚先生首先分享了“驱动阿里云的高性能网络引擎- 飞天洛神”主题演讲。洛神是阿里云飞天系统的虚拟网络系统…

6G为什么不被看好?

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 小枣君责编&#xff5c;阿秃前段时间&#xff0c;科技部官宣我国正式启动6G研发的新闻&#xff0c;在网上引起了广泛的转发&#xff0c;相信大家都有看到。新闻摘要&#xff1a;2019年11月3日&#xff0c;科技部会同发展改革…

阿里巴巴IPv6应用平台引领下一代互联网

在11月15日的GNTC IPv6专场峰会上&#xff0c;阿里巴巴网络架构师张先国先生首先分享了“阿里巴巴IPv6应用平台引领下一代互联网”主题演讲。演讲中讲述了阿里巴巴为何尽早启动IPv6项目、阿里巴巴PV6应用平台实践、以及阿里巴巴五大应用及集团各种平台如何构建在阿里云平台之上…

SpringBoot 整合 Redis 哨兵机制_02

文章目录1. maven依赖2. RedisConfig3. RedisUtils4. application.yml5. 单元测试6. redis客户端查看1. maven依赖 <!--redis Start--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis<…

mysql慢查询日志分析工具比较_MySQL慢查询日志总结 日志分析工具mysqldumpslow

慢查询日志概念MySQL的慢查询日志是MySQL提供的一种日志记录&#xff0c;它用来记录在MySQL中响应时间超过阀值的语句&#xff0c;具体指运行时间超过long_query_time值的SQL&#xff0c;则会被记录到慢查询日志中。long_query_time的默认值为10&#xff0c;意思是运行10S以上的…

北大教授张大庆:无线感知,让你变老也优雅

受访者 | 张大庆记者 | 胡巍巍出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09;在国内高校中&#xff0c;北大的校庆日很特殊——5月4日。这一天&#xff0c;也是青年节。北大&#xff0c;是五四运动的策源地。100年来&#xff0c;“爱国、进步、民主、科学”的五四…

揭秘阿里云EB级大数据计算引擎MaxCompute

日前&#xff0c;全球权威咨询与服务机构Forrester发布了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》报告。这是Forrester Wave首次发布关于云数仓解决方案&#xff08;Cloud Data Warehouse&#xff0c;简称CDW&#xff09;的测评。报告对云数仓的当前产品功能、…

SpringBoot整合Redis 主从复制_02

文章目录1. maven依赖2. RedisConfig3. RedisUtils4. application.yml5. 单元测试6. redis客户端查看1. maven依赖 <!--redis Start--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-redis<…

idea 找不到 Free MyBatis plugin

idea 找不到 free mybatis plugin 可以使用mybatisX替换&#xff1a; 插件安装成功后&#xff0c;重启idea。

mysql malloc lib_CVE-2016-6662-MySQL ‘malloc_lib’变量重写命令执行分析 | CN-SEC 中文网...

摘要今天有个关于MySQL的漏洞被披露出来&#xff0c;编号CVE-2016-6662。该漏洞主要涉及到 mysqld_safe 脚本中在加速/处理内存时会采用 “malloc_lib”变量作为辨别标记选择性加载(preload方式)比如tcmalloc之类的malloc库。不幸的的是这个变量可以被my.cnf所控制&#xff0c;…

TPC-C中跑赢Oracle的OceanBase,最近有何惊艳?

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 晶少责编 | 阿秃出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;就在一年一度震撼人心的双11前夕&#xff0c;有消息称前段时间火爆到瞬间刷屏的OceanBase已经完成了Oracle模式的研发&#xff0c;助力银行…