AirBnb架构简史

2007 年,布莱恩·切斯基 (Brian Chesky) 和乔·加比亚 (Joe Gabbia) 搬到了旧金山。他们一边想为自己的创业想法筹集资金,一边又需要支付房租。

碰巧的是,当时城里正要举行一个设计会议,这意味着很多设计师都会寻找住处。他们想出了在客厅里放一个充气床垫,把它变成一个提供住宿和早餐的旅馆的主意。

2008 年,Nathan Blecharczyk 加入 Brian 和 Joe 的公司,担任首席技术官和联合创始人,他们创办了名为 AirBed and Breakfast 的企业。

这就是 Airbnb 的诞生。

如今,Airbnb 已覆盖 200 多个国家,400 万房东在全球范围内接待了超过 15 亿客人。

随着 Airbnb 的突飞猛进,其软件架构也不断发展以跟上时代的变化。

在这篇文章中,我们将回顾 Airbnb 架构多年来的演变、他们一路走来所获得的经验教训以及他们为支持这一愿景而开发的工具。

初始版本

与大多数初创公司一样,Airbnb 的第一个 Web 应用程序版本是一个单体应用程序。它使用 Ruby-on-Rails 构建,内部称为monorail

在 Airbnb 看来,Monolith 是一个负责客户端和服务器端功能的单层单元。

这在实践中意味着什么?

这意味着模型、视图和控制器层被组合在一个单一的存储库中。

下图显示了这种方法。

这种整体式方法有几个优点:

  • 单体应用很容易上手,这也是 Airbnb 最初的需要
  • 它们有利于敏捷开发
  • 复杂性是可控的

随着 Airbnb 工程团队的快速发展,问题也随之而来。Airbnb 的规模逐年翻倍,这意味着越来越多的开发人员在单体应用程序中添加新代码,并更改现有代码。

随着时间的推移,代码库开始变得更加紧密,数据所有权变得不明确。例如,很难确定哪些表属于哪个应用程序功能。任何开发人员都可以对应用程序的任何部分进行更改,跟踪和协调更改变得困难。

这种情况导致了多个问题,例如:

  • 在任何时候,都有数百名工程师在单轨列车上工作,因此部署变得缓慢而繁琐。
  • 由于 Airbnb 遵循民主部署的理念(每个工程师负责测试和部署他们的更改以投入生产),这导致其变更相互冲突,陷入混乱。
  • 工程效率下降,开发人员的挫败感日益增加。

为了缓解这些痛点,Airbnb 开始了从单体架构向面向服务架构(SOA)的迁移之旅。

Airbnb 的 SOA

Airbnb 如何看待面向服务架构(SOA)?

对于他们来说,SOA 是一个松散耦合的服务网络,其中客户端向某种网关发出请求,网关将这些请求路由到多个服务和数据库。

采用 SOA 使 Airbnb 能够单独构建和部署服务。此外,这些服务可以独立扩展,所有权也变得更加明确。

然而,构建服务是一回事。以规范的方式设计这些服务也极其重要。

Airbnb 决定采用一些关键原则来以规范的方式设计这些服务:

  • 服务应拥有对其数据的读取和写入。这与每个服务一个数据库的模式非常相似,其中特定的数据库应由一个且仅一个服务拥有,从而更容易维护数据一致性。
  • 每项服务都应解决一个特定的问题。Airbnb 希望确保单体不会分解成另一个巨型服务,随着时间的推移,该巨型服务又会变成另一个单体。此外,他们还希望避免走上只擅长一件事的传统细粒度微服务之路。相反,Airbnb 转向构建专注于特定业务功能的服务。可以将其视为高内聚设计。
  • 服务应避免功能重复。通过共享库和共享服务可以共享部分基础设施或代码,从而更易于维护。
  • 数据变更应通过标准事件进行。例如,如果预订服务创建了新行,则可用性服务应通过事件了解此预订,以便将房屋的可用性标记为繁忙。
  • 每项服务都必须像任务关键型服务一样构建。这意味着服务应该具有适当的警报机制、内置可观察性和基础设施最佳实践。

在 Airbnb 看来,这些原则极其重要,它们有助于创建一条所有工程师都可以遵循的逻辑路径,以建立对服务架构的共同理解。

职场攻略与副业指南,成就你的IT人生。快扫描下面二维码关注吧!

ba1e8177db424136a3b666cf83ea7eef.png

Airbnb 的迁移之旅

秉承着上述原则和目标,Airbnb开始了从单轨模式向全新服务型模式的迁移之旅。

这是一个漫长的迁移过程,一路上经历了多次迭代。

版本 1

在这个版本中,每个请求都通过单轨进行。

单轨主要负责表示视图、业务逻辑以及数据访问。

你可以将其视为 Airbnb 架构的初始状态。

版本 2

下一个版本是单轨与面向服务的架构共存的混合版本。

主要区别在于单轨仅处理路由和视图层。它的工作是将传入的 API 流量发送到负责业务逻辑、数据模型和访问的新服务网络。

我们在这里谈论的是什么样的服务?

Airbnb 将其服务分为四种不同类型,如下图所示。

以下是各类服务的详细信息:

  • 数据服务——这是最底层,是所有数据实体读写操作的入口点。数据服务不能依赖于任何其他服务,因为它只访问数据存储。
  • 派生数据服务 — 派生服务位于数据服务之上一层。这些服务可以读取数据服务,也可以应用一些基本的业务逻辑。
  • 中间层——用于容纳不适合数据服务级别或派生数据服务级别的大量业务逻辑。
  • 演示服务 — 结构最顶层是演示服务。它们的工作是汇总来自所有其他服务的数据。此外,演示服务还会在将数据返回给客户端之前应用一些前端特定的业务逻辑。

有了这些服务定义,Airbnb 开始构建数据服务层。

例如,他们从家庭数据服务开始,这是 Airbnb 业务的基础层。当​​前的单轨设置使用 Rails 中的 Active Record 数据访问库从表中访问数据。

他们在 Active Record 级别拦截传入的请求,并且不路由到数据库,而是将这些请求发送到新的家庭数据服务。然后,家庭数据服务负责路由到数据存储。

下图显示了这种方法。

在创建核心数据服务之后,Airbnb 还将核心业务逻辑迁移到了 SOA 方法。

例如,迁移定价派生数据服务等服务,该服务需要来自家庭数据服务以及其他存储(如离线价格和趋势)的有关房屋的一些信息。

下一步涉及迁移演示服务,例如依赖于派生数据服务和核心数据服务的定价信息和房屋信息的结帐演示服务。

所有这些变化都是版本 2 的一部分,其中单轨列车和新服务在同一个请求周期内共存。

版本 3

在这个版本的迁徙之旅中,单轨列车被彻底淘汰了。

客户端向 API 网关发出请求,该网关充当负责中间件和路由的服务层。网关填充请求上下文并将请求路由到 SOA 网络,其中各种服务负责表示逻辑和数据访问逻辑。

Web 客户端的处理方式略有不同。有一个专门的服务来处理 Web 请求。

为什么需要它?

此服务通过调用 API 网关并以所需格式填充收到的响应,将 HTML 返回到 Web 客户端。API 网关负责所有中间件功能并通过 SOA 网络传播请求。

下图试图展示这种情况:

迁移读取和写入

到目前为止,您可能已经意识到,从单一架构转变为面向服务的架构并不是一朝一夕的过程。

对于 Airbnb 来说,中间阶段花费了大量时间,其中必须将单轨列车和新服务作为一等公民来支持。

请求可以通过单轨或服务进行。这意味着,确保两条路线的功能不会中断并且响应相同是一项关键要求。

为了支持这一点,Airbnb 建立了读取和写入的比较框架。

阅读

这些比较框架的首次使用是在读取操作中,因为读取是幂等的。您可以发出多个读取请求并获得相同的响应。

这个想法是发出双重读取,并将通过单轨的读取路径 A 的响应与通过新服务的读取路径 B 的响应进行比较。然后将捕获的响应作为标准事件发出,这些事件被使用并发送到离线比较框架。

比较框架被置于管理工具后面,这样无需更改代码和部署即可控制流量。响应调整完成后,Airbnb 工程师可以通过服务路径缓慢增加流量,并监控比较结果是否存在差异。

一旦比较看起来清楚,所有读取请求都会移动到新服务。

写入

对于写入,必须采取不同的做法,因为无法对同一个数据库进行双重写入。因此,我们利用了影子数据库。

假设单轨列车正在调用访问生产数据库的演示服务。这是写入路径 A。

现在,引入了中间层服务来减轻演示服务的一些验证负担。最初,此中间层服务将写入影子数据库,而不是主生产数据库。

此时,可以轻松地向生产数据库和影子数据库发出强一致性读取请求并比较结果。

一旦比较清楚,我们就可以通过新服务将写入内容移至生产数据库。

SOA 的优点和缺点

随着 Airbnb 从单轨铁路向基于 SOA 的架构的迁移,一些优点和缺点开始变得明显。

一些优点如下:

  • 系统变得更加可靠和高可用。即使一个服务出现故障,面向服务架构的其他部分仍可正常运行。
  • 服务现在可以单独扩展,允许根据系统的实际需求对资源分配进行微调。
  • 由于将产品的不同部分划分为不同的服务,因此提高了业务敏捷性。每个团队可以并行迭代。

然而,也存在一些缺点:

  • 工程师可能需要更多时间才能在面向服务架构中发布一项功能,因为他们需要首先熟悉各种服务。此外,任何变更都可能涉及多项服务
  • 即使服务是松散耦合的,某些逻辑模式也必须在不同的服务之间重复。
  • 依赖关系图复杂,尤其是在缺乏 API 治理的情况下。这也可能导致循环依赖,并使工程师难以调试错误。

支持 SOA 的工具和技术

正如我们从上一节看到的,迁移到 SOA 为 Airbnb 工程团队带来了多重挑战。

例如,单个请求现在会分散到多个服务,从而增加失败的几率。此外,将数据模型分离到多个数据库中有利于服务级别的一致性,但这会使事务性更难以实施。

随着时间的推移,服务编排也变得越来越复杂。由于有数百名工程师在构建服务,Airbnb 需要更多的 EC2 实例。最终,这促使其转向使用 Kubernetes。

为了让工程团队轻松构建服务,Airbnb 的基础设施团队在此过程中创建了许多构建模块。

API 框架

Airbnb 创建了一个使用 Thrift 语言构建的内部 API 框架。

所有 Airbnb 服务均使用该框架来定义可以相互通信的清晰 API。

例如,假设服务 A 想要与服务 B 通信。服务 B 工程师只需使用简单的 Thrift 语言定义端点,框架就会自动生成端点逻辑来处理常见内容,例如模式验证、可观察性指标等。

此外,它还创建一个多线程 RPC 客户端,服务 A 可以使用它来与服务 B 通信。该客户端处理各种功能,例如重试逻辑、错误传播和传输。

这有什么好处呢?

工程师可以专注于处理核心业务逻辑,而不必花时间担心服务间通信的细节。

为了提高开发人员的工作效率,Airbnb 基础设施团队还开发了 API Explorer,工程师可以在其中浏览不同的服务,确定要调用哪些端点,甚至使用 API 游乐场来了解如何调用这些端点。

使用 Spinnaker 进行自动 Canary 分析

Airbnb 还利用了开源持续交付平台 Spinnaker。

Spinnaker 用于跨各种云平台进行应用程序管理和部署。它支持所有主流平台,例如 AWS、Azure、Kubernetes 等,因此可以非常轻松地启动新的部署环境。

您可以在 Spinnaker 中创建管道来表示特定的交付过程,该过程从创建构建工件开始,一直到在环境中部署该工件。

借助 Spinnaker,Airbnb 能够轻松设置执行自动金丝雀分析的环境。

基本上,他们将新旧快照都部署到两个临时环境中,然后将一小部分流量路由到它们两个。

根据流量分析和错误率,为金丝雀环境生成一个总体分数,帮助决定是否失败或将金丝雀提升到部署过程的下一阶段。

Powergrid

Airbnb 还建立了一个名为 Powergrid 的内部库,使并行运行任务变得容易。

通过 Powergrid,他们能够将代码执行组织为有向无环图 (DAG)。

这个 DAG 的每个节点都是一个函数或任务。利用这个,Airbnb 工程师可以将每个服务端点建模为一个数据流,其中请求为输入,响应为输出。

由于 Powergrid 支持多线程和并发,因此可以用来并行运行任务。

下图显示了 Powergrid 的概念。

例如,假设主人想给客人发送特别优惠。然而,在发送之前,需要进行多次检查和验证。

借助 Powergrid,各个服务可以并行执行这些验证。汇总响应后,即可向客户发送特别优惠。

简化服务依赖关系

一旦 Airbnb 开始走上 SOA 之路,就再也没有回头路了。

然而,最初缺乏服务治理和依赖管理,导致服务交互图复杂。在面向服务的方法中,调用图变得极其复杂总是一种危险的情况。

  • 任何新的改变都会导致开发速度减慢。
  • 此外,维护也变得困难。

为了处理这种情况,Airbnb 决定使用服务块的概念来简化服务依赖关系。

基本上,您可以将每个块视为与特定业务功能相关的服务的集合。

例如,列表块封装了与核心列表属性相关的数据和业务逻辑。同样,您还可以拥有其他块,例如用户块和可用性块。

然后,Block 可以向上游客户端公开一个干净整洁的外观,并具有一致的读写端点。在底层,外观会根据需要协调数据和业务逻辑服务之间的协调。此外,还会实施严格的检查,以防止直接调用块内的任何内部服务。

这种方法大大降低了面向服务调用图的复杂性。

结论

总而言之,Airbnb 在从单轨迁移到 SOA 的整个过程中得到了几个重要的教训。

以下是一些需要注意的重要事项:

  • 尽早投资公共基础设施
  • 优先简化服务依赖关系
  • 进行必要的文化变革以实现面向服务的方法
  • SOA 不是一个固定的目的地,而是一个不断改进和完善的旅程。

职场攻略与副业指南,成就你的IT人生。快扫描下面二维码关注吧!

ba1e8177db424136a3b666cf83ea7eef.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/17508.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 五种内部类演示及底层原理详解

内部类 什么是内部类 在A类的内部定义B类,B类就被称为内部类 发动机类单独存在没有意义 发动机为独立个体 可以在外部其他类里创建内部类的对象去调用方法 类的五大成员 属性 方法 构造方法 代码块 内部类 内部类的访问特点 内部类可以直接访问外部类的成员&a…

AI手语研究数据集;视频转视频翻译和风格化功能如黏土动画;AI检测猫咪行为;开放源码的AI驱动搜索引擎Perplexica

✨ 1: Prompt2Sign 多语言手语数据集,便捷高效用于手语研究。 Prompt2Sign 是一个全面的多语言手语数据集,旨在通过工具自动获取和处理网络上的手语视频。该数据集具有高效、轻量的特点,旨在减少先前手语数据集的不足之处。该数据集目前包含…

代码随想录算法训练营Day 50 | 动态规划part12 | 309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费

代码随想录算法训练营Day 50 | 动态规划part12 | 309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费 文章目录 代码随想录算法训练营Day 50 | 动态规划part12 | 309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费309.最佳买卖股票时机含冷冻期一、两…

AI架构设计7:TGI

这个专栏主要关注围绕着AI运用于实际的业务场景所需的系统架构设计。整体基于云原生技术,结合开源领域的LLMOps或者MLOps技术,充分运用低代码构建高性能、高效率和敏捷响应的AI中台。该专栏需要具备一定的计算机基础。 若在某个环节出现卡点,…

员工管理和激励怎么做?试试场景化激励解决方案!

截止到2020年底,中国企业主体数量达3858.3万,同比增速达11.1%。如何留住人才、激励人才以强化人才与企业“黏性”,最大化提升员工的忠诚度与敬业度,成为企业未来人才发展战略的主要方向之一。 一、传统激励方式存在哪些不足 传统的…

香橙派 AIpro初体验

香橙派(Orange Pi)AI Pro开发板是一款高性能的AI开发板,由香橙派联合华为精心打造。香橙派(Orange Pi),作为深圳市迅龙软件有限公司倾力打造的开源产品品牌,致力于向全球个人及企业用户提供卓越…

十五届蓝桥杯国赛模拟(下)

题单详情 - 蓝桥云课 (lanqiao.cn) 填空题: 2360 互质 互质的定义是:两个数最大公约数为1,因此此题利用gcd模板即可AC: #include<iostream> using namespace std; int ans; int gcd(int a,int b){return b?gcd(b,a%b):a; } int main(){for(int i1;i<2020;i) if(g…

C#实现Queue的加锁和解锁

在C#中&#xff0c;可以使用lock语句来对队列进行加锁和解锁&#xff0c;以确保在多线程环境下的线程安全。以下是一个简单的示例&#xff1a; using System; using System.Collections.Generic; using System.Threading;public class ThreadSafeQueue<T> {private read…

设计软件有哪些?建模和造型工具篇(3),渲染100邀请码1a12

这次我们接着介绍建模工具。 1、FloorGenerator FloorGenerator是由CG-Source开发的3ds Max插件&#xff0c;用于快速创建各种类型的地板和瓷砖。该插件提供了丰富的地板样式和布局选项&#xff0c;用户可以根据需要轻松创建木质地板、石板地板、砖瓦地板等不同风格的地面。F…

Spring 框架中 Bean 的生命周期?

在 Spring 框架中&#xff0c;Bean 的生命周期包括以下几个阶段: 1. 实例化(Instantiation):在这个阶段&#xff0c;Spring将根据配置文件或注解等方式创建Bean实例&#xff0c;并将其存储在容器中。 2. 属性赋值(PopulateProperties):在这个阶段&#xff0c;Spring将会自动将…

人生二选一:央企就业?美国做博士后?—请看她的抉择

一位30岁的女博士&#xff0c;收到国内央企和德国、美国的博士后邀请函&#xff0c;她该如何选择&#xff1f;知识人网小编推荐这篇文章&#xff0c;为大家解开谜题的同时&#xff0c;也给有同样纠结的学者提供一些启迪。 去年12月底的一个晚上&#xff0c;我收到美国一所高校发…

100个 Unity小游戏系列六 -Unity 抽奖游戏专题四 翻卡游戏

一、演示效果 二、知识点讲解 2.1 布局 void CreateItems(){reward_data_list reward_data_list ?? new List<RewardData>();reward_data_list.Clear();for (int i 0; i < ItemCount; i){GameObject item;if (i 1 < itemParent.childCount){item itemParent…

前端基础入门三大核心之HTML篇:Webpack、Vite、Grunt、Gulp的场景与实战运用

前端基础入门三大核心之HTML篇&#xff1a;Webpack、Vite、Grunt、Gulp的场景与实战运用 一、Webpack&#xff1a;模块打包与优化的集大成者基本概念与作用应用场景实战例 二、Vite&#xff1a;快速开发的现代化构建利器基本概念应用场景实战例 三、Gulp&#xff1a;任务自动化…

护网期间遇到的几个上传bypass waf、edr

1. weblogic部署war的时候 http/1.1 改成http/2绕过waf 其实jar和ear部署应该也可以&#xff0c;但是我没成功。 2. tomcat windows的话部署 1.war变成 1.w/a/r 应该是 1.w\a\r 3. 上传绕过waf filename"x.jsp" 换成 filename x.jsp 还不行把 把ban…

【MySQL精通之路】SQL优化(1)-查询优化(7)-嵌套循环联接

主博客&#xff1a; 【MySQL精通之路】SQL优化(1)-查询优化-CSDN博客 上一篇&#xff1a; 【MySQL精通之路】SQL优化(1)-查询优化(6)-索引条件下推-CSDN博客 下一篇&#xff1a; 1.嵌套循环连接算法 一个简单的嵌套循环联接&#xff08;NLJ&#xff09;算法一次从循环中的…

Python解析网页-requests_html

目录 1、什么是requests_html 2、安装与配置 3、快速入门 4、图片下载 1.什么是requests_html requests_html是一个Python库&#xff0c;用于从Web页面中提取数据。 它提供了对HTML内容的解析和处理功能&#xff0c;使您可以轻松地从网页中提取文本、链接、图像和其他元素。…

python字典形式的字符串转换成python字典的两种方法eval()和json.loads()

有时候我们需要将python字典形式的字符串转化成python字典&#xff0c;有两种方法&#xff1a; 方法一&#xff1a;eval() dic_str "{name:jack, age:18, gender:male}" # dic_str {"name":"jane", "age":27, "gender":…

嵌入式UI开发-lvgl+wsl2+vscode系列:4、动画(Animations)

文章目录 一、前言二、动画示例1、示例1&#xff08;基础按钮label的组合动画&#xff09;2、示例2&#xff08;回放效果动画&#xff09;3、示例3&#xff08;贝塞尔曲线3动画&#xff09;4、示例4&#xff08;动画时间轴&#xff09; 三、最后 一、前言 接下来我们进行动画的…

Golang | Leetcode Golang题解之第101题对称二叉树

题目&#xff1a; 题解&#xff1a; func isSymmetric(root *TreeNode) bool {u, v : root, rootq : []*TreeNode{}q append(q, u)q append(q, v)for len(q) > 0 {u, v q[0], q[1]q q[2:]if u nil && v nil {continue}if u nil || v nil {return false}if …

pnpm使用教程

pnpm&#xff08;Performant npm&#xff09;是一个高性能的包管理器&#xff0c;旨在解决npm和yarn中的问题&#xff0c;提供更快的安装速度、节省磁盘空间、良好的monorepo支持以及高级安全性。下面是一个简要的pnpm使用教程&#xff1a; 安装 pnpm 通过 npm 安装 在已安装…