元数据驱动的 SaaS 架构与背后的技术思考

简介: 在抽象能力以及沉淀了产品的基础上,把所承载和沉淀的业务能力快速输出,贡献给整个行业。

道冲而用之或不盈,渊兮似万物之宗。

—老子

引言

作为业务系统技术开发同学,面向当下:

  • 首先应该是快速搭建业务通路,让线上业务跑起来,快速试错,解决生存问题;

  • 第二步是在链路畅通、业务基本跑起来的基础上,如何支撑业务跑得更快,就需要解决快速增长问题;

  • 第三步,在完成支撑业务快速增长的基础上,要进行精细化提升,通过在支撑业务快跑间隙挤时间打磨系统功能和体验,踏踏实实花时间去抽象能力,沉淀产品,提升效能;

同时我们也必须面向未来,如何在抽象能力以及沉淀了产品的基础上,把所承载和沉淀的业务能力快速输出,贡献给整个行业,或为整个社会商业生态提供基座支撑。面向未来,将平台产品进行 SaaS 化升级,真正将能力进行有价值开放输出是我们提前要布局的核心方向。

将平台产品进行 SaaS 输出,需要解决那些问题呢?这里尝试把核心问题列举一下:

  1. 如何根据不同用户需求进行计算能力按需调度分配?(IaaS/PaaS)

  2. 如何满足用户数据安全性要求,严格隔离不同用户的数据,使用户只能看到自己的数据?(PaaS)

  3. 如何支持不同用户在标准的数据对象/数据模型上按需添加自定义的数据对象/扩展模型?(PaaS & SaaS)

  4. 如何按照不同用户进行按需功能搭配组合,满足不同用户从基础到专业级不同业务场景需求?(SaaS)

  5. 如何统一对平台产品进行升级而不影响用户已有数据及功能?(IaaS、PaaS、SaaS)

通过以上问题,我们可以看出,产品 SaaS 化输出的关键是如何对不同的用户通过标准+扩展能力按需进行算力、数据、安全、功能有效定制,支持多用户共性和个性的问题,即多租户的问题,同时也涉及到计费和服务水平等相关问题。我们下面来聊下上述问题的解题关键和解题思路:

  • 第1个算力问题的核心是调度问题,弹性计算提供在 IaaS 层的统一算力调度能力,而 Serverless 则可以在 PaaS 层提供更高层次的算力调度能力。

  • 第4个问题的核心是业务流程的抽象和业务功能的拆分。领域驱动设计以及服务化(微服务)在平台功能抽象拆分上提供了相对成熟的思路,催化了以纵向业务功能细分作为域划分的依据的服务化方案以及组织结构,主要诉求是在细分的业务功能服务基础上,能按需快速灵活的组合,从而支撑不同的业务模式,提供业务敏捷性,支撑业务创新求变。

当然反过来,由于纵向功能细分,业务功能域增多,整个业务链条上的咬合点越来越多,随之产生越来越多的数据来源冗余重复或者缺失,功能或者重合且各自发散,或者缺失,最终给整体业务带来较多数据和功能的不一致性风险。这样一来,不仅横向端到端的业务串联成本高,而且关键路径的风险收敛成本比较高,矛盾冲突点集中在各纵向域功能和数据咬合处,具体表现为:

数据上:

  • 无主数据,有数据需求无 owner;

  • 大量重复且不一致数据;

功能上:

  • 部分业务功能缺失;

  • 域之间存在业务功能重复且行为不一致。

到底是纵向切分域还是横向分业务模式拉平来做,这个问题没有标准答案,更没有最佳答案。只有根据不同的业务发展阶段及时动态调整试错,换言之,这是一个不断寻找相对最优解的动态过程。

弹性计算和 Serverless 解决了算力的问题,领域驱动服务化设计解决了功能的拆分和按需搭配组合的问题,那么剩下的核心问题就是数据了:如何以一套统一的数据架构,既能支撑多租户的数据安全性需求以及通用的数据存储,也能支撑用户扩展的自定义数据对象定义和模型变更,同时也要保证数据定义层面的扩展和变更不会影响自身和其他租户业务功能的可用性。我们来分析下可能的方案(暂不考虑按服务边界进行数据库拆分):

  1. 统一的数据库,标准数据模型和扩展数据模型直接映射到物理表和索引:很显然,对于不同租户自定义的数据对象和数据模型要求是无法支撑的,物理数据模型会相互干扰、相互冲突直到无以为继。即使是对于所有租户完全标准的功能和数据存储,平台自身的标准模型升级的 DDL 也会对用户的可用性造成较大影响,所以显然是行不通的。

  2. 如果为每个租户创建各自的数据库呢?各自租户拥有各自的数据库,可以满足用户数据安全隔离的需求,也可以满足各租户自定义的数据需求,看上去像是一种合理的 SaaS 数据方案。但是仔细分析,会发现有两个明显的问题:

  • 如果用户需要修改或者扩展现有物理数据模型而进行的 DDL 操作,必然会影响线上业务的整体可用性,也可能会影响到标准数据模型,从而影响到线上功能使用。
  • 如果用户可自定义对物理模型进行扩展和定制,当平台进行模型升级的时候,极容易产生物理模型的冲突,导致新旧功能异常。
  • 由于用户在各自数据库存在各自定义的扩展和定制,则平台数据模型和功能升级需要针对不同的租户进行分别验证,存在极大的升级验证工作量和风险。

以上两种方案可行性低,我们从其中发现的问题是:平台业务系统的逻辑模型到物理模型的直接映射是造成问题的主要因素。既然物理模型的变更是平台不稳定的动因,那么我们是否能通过解耦业务逻辑模型和物理模型的映射关系来尝试解决这个问题呢?

既然问题已经定义清楚了,如何解决这个问题呢?通常我们解决架构问题的一个“万能”的方法是:增加一个层次,我们也来套用一次,增加一个层次(元数据层)来解耦逻辑模型到物理模型强映射的问题。

首先,我们需要对业务进行建模,对业务进行抽象,定义出业务逻辑模型,然后对模型进行二次抽象,定义出逻辑模型的定义数据,实现业务模型的数据化,即模型的元数据(The Metadata of the Logic Model ),将模型结构存储为数据,而不是直接对应的物理存储结构。

其次根据定义出的元数据进行统一抽象,形成元数据逻辑模型。

将元数据逻辑模型映射到元数据物理模型,对应实际存储结构。

通过对业务模型的变更,形成对元数据层的数据变更,而不是物理结构的变更,从而实现业务逻辑模型同物理模型的解耦。

 

image.png

很多事情说起来好像挺简单,实际上是一个非常巨大的系统工程,将其付诸实践是挑战非常大的事情,而取得踏踏实实的成功则更难。上述问题的解题思路是 Salesforce 的解题思路,而且 Salesforce 不仅取得了成功,也接近将其做到了极致,下面我们站在巨人的肩膀上来看看 Salesforce 如何通过元数据驱动的架构(核心是基础数据架构)来支撑多租户的 SaaS 业务平台。
注意:由于 Salesforce 并未有对核心实现逻辑进行完全公开和说明,所以本文所整理的部分核心逻辑包含了作者的逻辑推理和解读,但是确实进行了逻辑验证和场景验证,如有纰漏和不全面的地方,欢迎讨论及指正。

元数据驱动的多租户架构

Salesforce 将 Force.com 定义为 PaaS 平台,Force.com 的基础就是元数据驱动的软件架构来支撑多租户应用。首先我来解释下什么是以元数据驱动的软件架构为核心。

一、多租户意味着什么

多租户的含义用一句话来描述就是:一个云平台,无数多个客户。

一个云平台的含义是:一个代码库,一个数据库,一整套共享的可扩展服务,包括数据服务、应用服务以及 Web 服务。

无数多个客户的含义是:每个客户都被分配一个唯一的租户 OrgID,所有的数据存储都是按照租户 OrgID 隔离的,所有的数据访问必须包含 OrgID,所有的操作也都是包含租户 OrgID 的,也就是所有的客户数据和行为都是被安全的通过唯一的租户 Org 进行严格隔离的。

每个租户/组织只能看到和定义按照自己租户 OrgID 隔离的自己版本的元数据和数据,而且只能执行自己租户 OrgID 所授权的行为,这样每个租户就拥有各自版本的 SaaS 方案。

二、元数据驱动意味着什么

元数据对于平台意味着平台数据的数据,对于租户意味着是关于租户数据的数据。

当用户定义一个新的用户表的时候,用户创建的不是数据库中的物理表,而是在系统态的元数据表中添加了一条记录,这个记录描述的是用户表的逻辑定义,是虚拟的,这个表并不在数据库中物理存在,而这条记录代表就是用户态的数据表。

当用户定义了用户表的一个新的字段时,用户并没有在物理表中创建物理字段,而是在系统态的元数据表中添加了一个记录,这个记录描述的用户表的字段组成的逻辑结构,是虚拟的,这个字段也不在数据库表结构中物理存在,而这条记录代表的就是用户态的用户表字段。

也就是通过存储在系统态的元数据表中的元数据记录作为虚拟用户的数据库结构。

三、元数据驱动的多租户整体架构

我们先来大概了解下元数据驱动的多租户的整体架构,整体架构大概分为 5 个逻辑层次:

  1. 底层数据架构分为三个层次:
  • 最底层是数据层,存储了离散的系统和用户的业务数据,业务日常运营的数据存储在这里。

  • 公共元数据层,存储了应用系统标准的对象和标准的字段定义,对底层数据的结构进行定义说明。

  • 租户特定元数据,存储了租户自动的对象和自定义的字段定义,用于对底层的数据结构进行定义说明。

  1. 通用数据字典 UDD(Universal Data Dictionary) 运行引擎层实现了应用对象到底层数据存储的映射,包含对象模型操作、SOQL 语言解析、查询优化,全文搜索等功能,我们常说的 ORM 功能也是其核心功能,但比其复杂的多。

  2. 平台服务层提供 PaaS 层平台服务,提供应用对象模型的创建,权限模型创建,逻辑和工作流程创建以及用户界面的创建,包括屏幕布局、数据项、报表等。

  3. 标准应用层提供端到端的标准的业务应用功能。

  4. 租户虚拟应用层,用户可以在标准应用层或者平台服务层之上定义自己特有的业务应用功能,满足自己特定的业务场景需要。

 

image.png

其中,底层数据架构是最为关键的平台基石(The Corner Stone),其核心运行引擎也是基于强大的底层数据架构基础上构建的。本文则以元数据驱动的多租户数据架构为核心来一一展开。

四、元数据驱动的多租户数据架构

下面我们具体来看下系统态的数据模型,基于 Salesforce 加上个人推理的元数据驱动的多租户数据模型。
注意:由于 Salesforce 并未有对核心逻辑进行完全公开和说明,所以本文所整理的部分核心模型包含了个人的逻辑推理和解读,但是确实进行了逻辑验证和场景验证,如有纰漏和不全面的地方,欢迎讨论及指正。

Salesforce 云服务平台遵循的是面向对象的设计理念,所有的实体、实体关系以及实体的 CRUD 均是以对象的视角进行的,所以其元数据驱动的多租户数据模型的存储基本元素也是按照对象的颗粒度进行存储,源自于 OO 的对象间引用,同普通关系数据库主外键关系异曲同工,只是细节处理上不尽相同,请大家注意这一点。

1. 元数据驱动的多租户数据架构概览

首先,我们先来大概了解下元数据驱动的多租户模型的核心内容,元数据驱动的多租户的数据模型主要分为三个部分:元数据表、数据表和功能透视表。

元数据表(Metadata Tables)

元数据表用于存放系统标准对象以及用户自定义对象和字段定义的元数据,也就是系统和用户对象的逻辑结构,即对应于关系数据库中的虚拟表结构。元数据表主要包括Objects 表以及 Fields 表,是系统标准对象和用户对象定义数据的仓库,即元数据仓库。

数据表(Data Tables)

数据表用户存放系统以及用户对象和字段的实际数据,实际的用户业务数据以及应用系统相关数据存放在这里。数据表包括 Data 表和存放大文本数据的 Clob 表,数据表存储了绝大部分用户的实际数据,是一个巨大的用户业务数据仓库。

功能透视表(Specialized Pivot Tables)

功能透视表包含了非常关键的关系表、索引表、关系表以及其他特定用途表。例如关系表定义了对象间的关系,索引表解决虚拟结构索引的问题,这部分后续将进行详尽的介绍。

 

image.png

2. 元数据驱动的多租户数据架构详解

上一节粗略地描述了元数据驱动的多租户模型三大部分模型实体和基本作用,大家可能会比较疑惑,这么简单一个实体模型,怎么就起了这么个牛逼的名字,而且支撑了“一个云平台,无数个客户”。我们下面就对此模型的核心逻辑进行详细展开和推理说明,同时详细阐述以此模型为中心的服务来说明整个元数据层或者说 UDD(Universal Data Dictionary) 层的设计。

土话说:“没有对比,就没有伤害”。道理是相通的,用相似的事物进行对比是对理解客观事物比较好的方法,找出其相同点和共性的地方,找出其不同点和异样的地方,同时识别出是否有不可对比的方面。从各个方面去对比,则能更全面、更深入的了解客观事物。

下面我按照普通应用设计思路方式来定义一个简单直观的多租户 SaaS 数据架构方案示例,作为元数据驱动多租户数据架构方案的对比基准方案,用对比来更好的帮大家了解元数据驱动多租户数据模型及架构的设计逻辑。

普通多租户 SaaS 数据架构方案示例(仅做示例)

  • 多租户基本思路:每个租户一个数据库,提供数据库级别的租户数据隔离,平台提供标准应用功能模型,用户可以在各自数据库内定义以及修改各自的定义模型,所有模型采用数据库物理表、索引、主外键实现。不同的租户通过路由到不同的数据库来实现隔离。

  • 域模型样例采用大家都熟悉的最小集的订单模型实现,包含商品、用户、订单和订单详情表。注意:此简化模型仅用做示意说明,和意图无关的大多数字段均省略,非严谨定义。

 

image.png

  • 示例模型数据

数据库物理表数据:Customer

 

image.png


数据库物理表数据:Product

image.png

数据库物理表数据:Order

image.png

数据库物理表数据:OrderItem

image.png

  • 实体表关系
    Order 表同 OrderItem 为父子表,通过 OrderID 进行主外键关联;Customer 表同 Order 表为父子表,通过 CustomerID 进行主外键关联;Product 表同 OrderItem 表为父子表,通过 ProductID 进行主外键关联。

  • 用户自定制
    用户有执行 DDL 权限,可以在自己租户数据库内在进行扩展模型自定义,建立自定义的物理表,索引,关系等。

  • 问题和风险
    用户具有执行 DDL 权限,可以自定义数据库物理模型,会带来各租户的自定义数据模型大爆炸,会给后续平台模型定义升级冲突,造成模型升级的巨大的障碍

同时,由于系统标准模型和用户模型均为物理模型,未有做系统标准和自定义数据的有效隔离,如何保证平台应用的每一次升级必然会考虑对现有用户自定义模型的稳定性和可用性的影响,在自定义物理模型的情况下,不仅挑战巨大,而且包含巨大的回归验证的工作量,很难收敛。

当用户执行 DDL 时,通常会锁定数据库物理资源,当数据库数量非常巨大时可能会带来不可控的 downtime,对应用系统的可用性造成巨大的影响。如果数据库是每个租户各自独占,还只会影响到单个租户;如果是多租户共享数据库,则可能会影响到其他租户,影响是灾难性的。作为云平台服务商,不管是用户操作还是系统行为,我们都不期望我们的设计对用户系统的可用性造成影响,所以用户执行 DDL 的行为是否允许确实有待商榷,但是如果不允许,用户可扩展性在这种设计环境中必然受到一定程度的限制。

元数据驱动的多租户数据模型(Metadata Tables)

前面章节描述了元数据驱动的多租户模型简单模型图,本小节详细解说下每个核心实体表的核心结构,同时已知资料部分较为简略,无法描述模型全貌和核心细节,为了模型完整性,整体数据模型包含了作者思路推理部分,用以来完整清晰地定义模型。当然由于所有模型都是主观的(subjective),仅代表个人观点,欢迎大家的不同的观点,一起讨论改进。

正如前面介绍“一个云平台”时提到,通过一个统一的数据库来支撑无数个租户,所以元数据驱动的多租户模型是基于一个共享数据库的前提。当然多租户实现设计多种多样,大家可以不拘泥此种。

1)元数据表之对象定义表:Objects 表

 

image.png

Object 系统表存储了每个租户为它的扩展应用对象定义的元数据,包含如下核心字段:

  • ObjID:应用对象唯一标识,具有固定长度和格式。

  • OrgID:应用对象所归属的租户 ID,用于统一共享数据库内的多租户数据隔离,通常和租户定义的域名对应。

  • ObjName/Name:对象名称,用于系统配置和开发(developer name)。

  • Label: 对象的显示名称。

除了用户自定义对象,系统的标准对象也是采用相同的方式进行定义的。

2)元数据表之字段与关系定义表:Fields 表

 

image.png

Fields 系统表存储了每个租户为他的扩展应用对象字段定义的元数据,包含了其所归属的应用对象的租户 OrgID,字段所属对象的 ObjID,字段定义标识 FieldID,字段名称FieldName,字段存储位置定义 FieldNum,数据类型 DataType。数据类型重要补充关联字段(DigitLeft,Scale,TextLength,RelatedTo,ChildRelationshipName)以及是否必选、唯一、索引标记,还有部分标准字段。Fields表非常关键,其不仅定义了普通的应用对象字段,包括基本信息和数据类型信息,而且通过特殊关系字段对不同应用对象之间的关系进行定义,详细说明如下:

  • FieldID:此对象字段的唯一标识,具有固定长度和格式
  • OrgID:其所归属的应用对象所归属的租户 OrgID
  • ObjID:字段所属对象的 ObjID
  • FieldName/Name:字段名,用于系统配置和开发(developer name)。
  • Label:字段展示名称,用以展示给最终用户。
  • FieldNum:对应到 Data 数据表的数据存储字段映射,暨 Data 表中 ValueX 字段中的X。
  • DataType:指定此对象字段的数据类型包含普通类型:Number、TEXT、Auto Number、Date/Time、Email、Text Area等,也包含特殊的关系类型如:Look up关系类型、Master-Detail 关系类型等。
  • DigitLeft 和 Scale:用于 Number、Currency、Geolocation 等数字数据类型的关联设定,例如定义了一个字段的 DateType 为 Number,则需要指定其整数部分的最大位数 DigitLeft 和小数部分的最大位数 Scale,两部分长度总和不超过 18 位。
  • TextLength:当数据类型为 TEXT 时启用,用于指定 TEXT 类型的字符的长度限制。
  • RelatedTo 和 ChildRelationshipName:这两个字段当 DateType 为关系类型(Look up,Master-Detail 等)时会启用,其中 RelatedTo 保存关联的应用对象 ID,ChildRelationshipName 用于保存父子关系中子方的关系名称,同一个父对象的子方的关系名称唯一,用于关系的反向查询。
  • IsRequired:此字段数据保存时,是否校验值的存在。
  • IsUnique:是否允许重复值。
  • IsIndexed:此字段是否需要建索引。
  • 其他字段:此处仅列举了说明模型所需要的字段,其他字段暂不进行列举,不列举原因和其重要性并无直接关联。

3)数据表(Data Tables)之关系数据表:Data 表

 

image.png

MTData 系统表存储了 MTObjects 和 MT_Fields 元数据表内定义的数据对象(表)所对应的数据,一一映射到不同的租户各自定义的表和表中的字段(对象和对象字段)。

  • GUID:数据表的主键,用于存放每个应用对象实例的标识 ID。
  • ObjID:其所归属的应用对象所归属的租户 OrgID。
  • Name:应用对象实例名称。
  • Value0....Value500:用于存放对象实例字段的数据,其 ValueX 中 X 值对应到 Fields 表中 FieldNum 定义,ValueX 存放的数据,不管原始数据类型、存储格式均为变长字符串格式。

4)数据表(Data Tables)之非结构化数据表:CLobs

MT_Clobs 用于存储大字符段的存储 CLOB,同时 CLOB 也存储在数据库外的索引结构中,用于快速的 Full-Text 文本检索。

3. 元数据模型核心实体关系图

我们在应用系统开发中,通常我们定义的数据结构包括数据表、表字段,索引通常都会直接定义在物理数据库中,创建物理的表和字段以及索引等。

但是在元数据驱动平台数据模型中,我们定义的用户表包括系统表都是逻辑表,其结构是虚拟的,用户表的定义存储在 Objects 表,对应的字段定义存储在 Fields 表中,实际用户数据存储在 Data 表中。特别注意的是,对象的引用关系定义也定义在 Fields 表中,以特殊数据类型方式来定义。(另:Relationships 表后面章节进行描述)。

从每个租户视角来看,每个租户都在一个共享数据库内拥有一个基于租户标识 OrgID 来隔离的虚拟的租户数据库。

元数据实体包括 Objects 和 Fileds 实体以及实际数据 Data 实体都包含租户 OrgID,这样就可以通过租户 OrgID 来天然隔离各租户的数据,当然不止这些实体,包括索引相关等透视表实体也使如此。

 

image.png

4. 标准对象与标准字段

前面整体架构层次里提到了公共元数据层和标准应用层,公共元数据层提供了标准对象和标准字段的定义。

其中标准对象为每个租户提供公共端到端的应用的标准应用功能。

 

image.png

同时用户可以在标准的对象基础上扩展自定义的应用对象,满足自己的特定业务场景。__c 后缀代表自定义,后续详解。

 

image.png

而标准字段则提供给每个对象包括自定义对象的共同的字段,包含部分业务字段和非业务字段。

 

image.png

用户也可以在标准对象和自定义对象内自定义不同的字段,以满足业务需要。__c后缀代表自定义,后续详解。

 

image.png

5. 对象关系类型

应用对象关系类型主要分为 Look up 和 Master-Detail 两种关系类型,其中 Look up 为弱的父子关系类型,Master-Detail 为强的父子关系类型,其特性对比如下。

 

image.png

6. 元数据驱动的多租户数据架构示例

同样采用普通多租户 SaaS 数据架构方案中相同的域模型和示例数据作为参照进行说明,只不过在这里域模型不再对应到数据库的物理模型,而是对应到元数据所定义的虚拟数据库的逻辑模型。请前后对比两种模型对用户业务模型承载的差异和联系,以便深入了解元数据驱动的多租户数据架构。

 

image.png

对于 Tenant 租户 A00001,需要支撑相同的业务逻辑,需要定义相同的域模型,和普通的方案不同的是,这里采用元数据驱动的多租户数据模型来定义订单域模型和对应示例数据,其中域模型定义在元数据表(Metadata Tables)中,数据存储在 Data Tables 表中。

1)用户自定义对象 Product 的定义

Product 对象的基本信息定义在 Objects 表,作为 Objects 表的一条记录,通过 OrgID 进行不同租户数据隔离。Object 中的每一条记录都代表一个不同的对象。Objects 表的定义非常清晰,这里不做过多的解释,请参考 Objects 表介绍。

 

image.png

Product 对象的字段结构定义在 Fields 表,同时通过 ObjID 同 Order 对象定义进行关联,通过 OrgID 进行多租户数据隔离。

FieldID 格式为字段定义的标识 ID,用于区分每个字段定义,对于标准字段,则采用标准字段 ID,如 Name,则直接采用 Name 作为字段标识 ID,对于自定义字段,则元数据引擎自动生成 15 位的标准格式的 FieldID。其他字段定义请参考前面的 Fields 元数据表详细介绍。

下面详细描述一下 Product 对象中每个字段定义:

  • 产品名称 Name 字段 为标准字段,数据格式为TEXT,长度为80。
  • 产品编号 ProductNo 为自定义字段,数据格式为 TEXT,长度为 22,FieldNum 为 1 对应 Data 表存储字段 Value1,存储格式为变长字符串。
  • 产品价格 ProductPrice 为自定义字段,数据格式为 Currentcy(此格式类似Number,不同是带币种),整数最大长度 DigitLeft:16 位,小数位最大精度Scale:2 位,FieldNum 为 2 对应 Data 表存储字段 Value3,存储格式为变长字符串。
  • 状态 ProductStatus 为自定义字段,数据格式为 TEXT,长度为 20,FieldNum 为 3对应 Data 表存储字段 Value3,存储格式为变长字符串。

 

image.png

2)用户自定义对象 Customer 的定义

Customer 对象的基本信息定义在 Objects 表,作为 Objects 表的一条记录,通过 OrgID 进行不同租户数据隔离。Object 中的每一条记录都代表一个不同的对象。Objects表的定义非常清晰,这里不做过多的解释,请参考Objects表介绍。

 

image.png

Customer 对象的字段结构定义在 Fields 表,同时通过 ObjID 同 Order 对象定义进行关联,通过 OrgID 进行多租户数据隔离。

下面详细描述一下 Customer 对象中每个字段定义:

  • 用户名称 Name,必选标准字段,不过多解释。
  • 用户编号 CustomerNo 为自定义字段,数据类型为 TEXT,长度为 22,FieldNum 为 1 对应 Data 表存储字段 Value1,存储格式为变长字符串。
  • FirstName 和 LastName 为自定义字段,数据类型为 TEXT,长度均为 20,FieldNum 为 2,3 对应 Data 表存储字段 Value2 和 Value3,存储格式为变长字符串。
  • 用户昵称 Nick Name 为自定义字段,数据类型为 TEXT,长度均为 20,FieldNum 为 4 对应 Data 表存储字段 Value4,存储格式为变长字符串。
  • 用户登录名 LoginName 为自定义字段,数据类型为 TEXT,长度均为 20,FieldNum 为 5 对应 Data 表存储字段 Value5,存储格式为变长字符串。
  • 用户状态 CustomerStatus 为自定义字段,数据类型为 TEXT 或者 PickList,长度为 20,FieldNum 为 6 对应 Data表存储字段 Value6。为简化起见,状态字段暂定义为 TEXT,对应 Data 表存储字段 Value4,存储格式为变长字符串。

 

image.png

3)用户订单 Order 逻辑表的定义

Order 对象的基本信息定义在 Objects 表,作为 Objects 表的一条记录,通过 OrgID 进行多租户数据隔离。Objects 表中的每一条记录都代表一个不同的对象。

 

image.png

Order 对象的字段结构定义在 Fields 表,同时通过 ObjID 同 Order 对象定义进行关联,通过 OrgID 进行多租户数据隔离。

下面详细描述一下 Order 对象中每个字段定义:

  • 订单编号 OrderNo 为自定义字段,DataType 数据格式为 TEXT,长度为 22,FieldNum 为 1,对应 Data 表存储字段 Value1,存储格式为变长字符串。
  • 关系字段 Customer 为自定义关系字段,DataType 类型为弱类型 Look up 关系,关联到父对象 Customer,则 RelatedTo 列存储 Customer 的 ObjID:01I2v000002zTEZ,对应的 FieldNum 为 2,则 Customer 对象实例 GUID 存储在 Data 表的 Value2 列。ChildRelationshipName 列存储对象父子关系中子关系名称:orders,用于对象关系中从父对象实例数据反查子对象实例数据。
  • 订单状态 OrderStatus 为自定义字段,DataType 类型为 TEXT,长度为 20,FieldNum 为 3,则状态存储在 Data 表的 Value3 列。为简化起见,状态字段暂定义为 TEXT。
  • 下单时间 OrderTime 为自定义字段,DataType 类型为 Date/Time,FieldNum 为4,则下单时间存储在 Data 数据表的 Value4 列。

 

image.png

4)用户订单行 OrderItem 逻辑表定义同样的,OrderItem 对象的基本信息也以一条记录的信息定义在 Objects 表,通过 OrgID 进行多租户数据隔离。Objects 表中的每一条记录都代表一个不同的对象。

 

image.png

OrderItem 的字段结构也定义在 Fields 表,通过 ObjID 同 OrderItem 对象关联,通过 OrgID 进行多租户数据隔离。

下面详细描述一下 Order 对象中每个字段定义:

  • 关系字段 Order 为自定义关系字段,DataType 类型为强类型的 Master-Detail 关系,关联到父对象 Order,则 RelatedTo 列存储 Order 对象的 ObjID:01I2v000002zTEj,对应的 FieldNum 为 1,则 Order 对象实例 GUID 存储在 Data 表的 Value1 列。ChildRelationshipName 列存储对象父子关系中子关系名称:OrderItem(s),用于对象关系中从父对象 Order 实例数据反查子对象实例数据。
  • 关系字段 Product 为自定义关系字段,DataType 类型为弱类型的 Look up 关系,关联到父对象 Product,则 RelatedTo 列存储 Product 对象的 ObjID:01I2v000002zTEU,对应的 FieldNum 为 2,则 Product 对象实例 GUID 存储在Data 表的 Value2 列。ChildRelationshipName 列存储对象父子关系中子关系名称:OrderItem(s),用于对象关系中从父对象 Product 实例数据反查子对象实例数据。
  • 商品实际售价 ItemPrice 为自定义字段,DateType 类型为 Currentcy(此格式类似 Number,不同是带币种),整数最大长度 DigitLeft:16 位,小数位最大精度 Scale:2 位,FieldNum 为 2 对应 Data 表存储列 Value3,存储格式为变长字符串。
  • 商品购买数量 Item Quantity 为自定义字段,DataType 类型为 Number,整形长度为 18 位,无小数位数,FieldNum 为 4,对应 Data 数据表存储列 Value4。
  • 订单明细状态 OrderItemStatus 为自定义字段,Datetype 类型为 TEXT,长度为 20,对应 FieldNum 为 5,对应 Data 数据表存储列 Value5。为简化起见,状态字段暂定义为 TEXT。

 

image.png

5)对象 Schema

定义好的用户应用对象 Schema 如下图

 

image.png

6)数据表 Data 表用户数据存储

前面提到了用户自定义的应用对象以虚拟结构的方式存储在 Objects 和 Fields 表中,那么用户定义的应用对象 Product、Customer、Order 和 OrderItem 里的数据存储在哪里呢?答案是 Data 表,用户定义的对象的数据均会存储在 Data 表中,每个用户定义对象实例(或者近似称为用户表记录)数据以 Data 表中一条记录的形式存在。Product、Customer、Order 表的数据记录均存储在 Data 表,OrderItem 也亦是如此。

其中,GUID 作为每条数据记录暨是每个对象实例的全局唯一标识,OrgID 进行多租户数据隔离,ObjID 同 Objects 表关联代表具体哪个对象定义。这里重点提一下,Fields 中定义的对象字段在 Data 表中的存储,其中 Fields 表中 FieldNum 非常关键,它对应了对象实例字段在 Data 表中的具体存储位置,FieldNum 对应数字决定着数据存储在 Data 表中的哪个 ValueX 列。前面每个对象结构定义都对 FieldNum 对应 Data 的进行了说明,对象字段 FieldNum 可以不按照顺序来,只要 FieldNum 没有占用,可以任意对应,当然按照顺序是比较好的实践。

再举例来说:

  • Order 对象的 Customer 关系字段定义在 Fields 表中,其 FieldNum 为 1,则其在 Data 表中存储的位置,就是是 Order 对象实例在 Data 对应的记录中 Value1 这个字段所存储的值,存储的值为 Customer 对象实例 GUID,也就是:a062v00001YXEKuAAP、a062v00001YXEKzAAP 等。

  • OrderItem 对象的 Product、ItemQuantity 字段定义在 Fields 表中,其对应的 FieldNum 分别为2、4,则其在 Data 表中存储的位置,就是 OrderItem 对象在 Data 对应的记录中 Value2、以及 Value4 所存储的数据,也就是:a052v00000jbgEQAAY、2以及a052v00000jbgMqAAI、3 等记录。

 

image.png

 

image.png

7. 通用的存储,按需转换 —Data 表数据类型与存储

我们看了元数据驱动的多租户模型的核心关系,明白了用户自定义表(包括应用系统表)以及表结构是在 Objects 和 Fields 进行虚拟定义的,也清楚的知道了系统以及用户表的数据是作为一条条记录存储在 Data 表中的,那么我们下面来看下不同的数据类型如何在 Data 中进行存储的呢?

在 Fields 表中,可以采用任何一种标准的结构化的数据类型,如 text,number,date,以及 date/time 对用户表字段进行定义,也可以采用特殊结构的数据类型对字段类型进行定义,如下拉框 picklist,系统自增字段 autonumber,公式列(只读的公式推导列),布尔多选框,email,URL 以及其他的类型,当然也可以通过系统应用来对 Fields 中的自定义字段进行强制约束包括是否必须非空以及掐校验规则(如符合特定格式,符合特定值范围等)。

上述的各种不同字段格式数据都是存储在 Data 表中的 ValueX 列中的,Data 表中包含 500 个数据列,称为弹性列,用来存储用户数据和系统数据,也就是对应到 Objects 表和 Fields 表对应的虚拟表结构所要承载的数据。

特别的,所有弹性列都用了一个可变长度的字符串类型,以便于他们可以存储任何结构化类型的应用和用户数据(字符串,数字,日期等)。

正是因为弹性列把所有不同的数据类型拉平来存储,所以任一弹性列可以对存储任何对象的任何类型的属性来存储,用户可以指定不同的对象的不同属性对应的不同的存储弹性列,当然同属于相同对象的实例的属性对应的弹性列是一致的。一个弹性列可以存储来不同的格式的数据,前提条件是这些数据属于不同的对象的不同属性。例如:上一节示例中,Data 表的 Value2 列可以存储 Order 表的日期格式的 OrderTime 数据,也可以存储 OrderItem 表的格式为字符串的 OrderID 数据。

 

image.png

如上所述,弹性列用通用数据类型暨可变长字符串来存储所有类型的数据,这样就可以在不同的用户表字段间共享相同弹性列,即便它们的数据类型各异。

既然所有的数据全部用通用的可变长字符串来存储,那么应用逻辑处理需要不同的数据格式时候怎么办呢?具体做法如下:

当应用系统需要从弹性列读取和写入数据时候,UDD(Universal Data Dictionary) 层暨元数据运行引擎会用底层数据库系统数据转换函数(如 Oracle 数据库的TONUMBER,TODATE,TO_CHAR 函数)按需对数据格式进行转换,将字符串格式转换成对应的数据格式(数字,日期等)。

如果存储非结构化的大文本块数据怎么办呢?模型支持对Clob大字段的定义,对于在 Data 表中具有 CLob 数据的每一行数据,系统将其存储在 Clobs 透视表中,并按照需要同 Data 表的对应数据对象实例记录进行关联。

8. 多租户索引透视表 (Pivot Tables)

1)Indexes 透视表

大多数结构化的数据存储在 Data 表内,如前面提到的,所有这些不同类型数据都是以可变字符串的形式存在 ValueX 列里面如各种数字以及日期等全部都是以可变字符存储的,这样虽然对于对象实例各种字段的存储确实非常灵活,不同的列可以存储不同类型的数据,即使同一 ValueX 列不同的对象也可以存储类型的数据,但是这样带来一个巨大的问题,由于不同的数据类型以可变字符串的方式存储在同一列内,你没办法利用底层数据库索引的能力对其进行排序,ValueX 列的数据都是一种按照离散的顺序来存储的。传统的数据库依赖原生的数据库索引来快速在数据表内定位到符合查询条件的记录。而按照 Data 表ValueX列的数据存储情况,在 Data 表建立 ValueX 列的索引来支撑数据快速查询是不现实的。

所以解决办法就是建立另外的透视表叫做 Indexes 索引表,并把数据拷贝出数据表并转换成原始的的数据类型,并存储到Indexes索引表列内,如原来是整形的数据以可变字符串的格式存储 在ValueX 列中,拷贝到 Indexes 表之前通过函数将其转换为原始的数据类型,在存储到 Indexes 对应的 NumValue 列内,以方便建立索引,Indexes 表包含强类型的索引类,像 StringValue,NumValue,DataValue,用来定位对应数据类型的字段数据。

 

image.png

Indexes透视表的字段说明如下:

  • OrgID:其所归属的应用对象所归属的租户OrgID
  • ObjID:字段所属应用对象唯一标识
  • FieldNum:对象字段存储位置
  • ObjInstanceGUID:对象实例唯一标识
  • StringValue:强类型的字符串列
  • NumValue:强类型的数字列
  • DateValue:强类型的日期列

下面的 Indexes 表示例包含对字符、数字和日期性数据的索引需求支持,数据来源于前面的 Data 表数据。

 

image.png

 

image.png

 

image.png

Indexes 表的底层索引是标准的,采用非唯一性的数据库索引。当做对象检索查询的时候,实际上不是在Data数据表上做查询,而是在 Indexes 索引表上做的查询,获取到OrgID,ObjectID 以及 GUID,然后再返回数据表获取数据。也就是当系统查询条件包含对象实例的结构化的字段时,系统查询优化器采用 MT_Indexes 来帮助优化相关的数据访问操作。

2)Unique Indexes透视表

由于 Data 数据表的多数据类型的无差别存储,无法在 Data 数据表建唯一性的索引供用户来使用对对象字段值进行唯一性校验。为了支持用户对象自定义字段的唯一性校验,解决办法是采用了 UniqueIndexes 透视表;这个表非常类似于 Indexes 表,不过 Uniqueindexes 采用底层原生的数据库索引来强制唯一性校验。当一个用户尝试来插入一个重复的值到具有唯一性约束的对象字段时,或者当用户尝试去在一个现存的包含唯一性的字段进行强制唯一性时,系统会给出唯一性校验失败的提示,阻止用户的下一步操作。

 

image.png

  • Unique Indexes 透视表的核心字段说明如下:
  • UniqueStringValue:唯一的字符串列
  • UniqueNumValue:唯一的数字列
  • UniqueDateValue:唯一的日期列
  • 其他字段定义请参考 Indexes 透视表

3)Relationships 索引透视表

在元数据驱动的多租户模型中,提到了在 Objects 表以及 Fields 表中保存了用户对象结构和对象关系的定义,对象关系的定义是通过元数据模型 Fields 表字段数据类型提供了一个特殊的数据类型:“关系” (Relationship), 来给用户用于声明不同的用户应用对象之间的关系,也就是我们通常说引用完整性。

对象之间的引用关系定义以及对象实例间的引用关系存储在元数据表 Objects、Fields 中和 Data 表中,关联查询关系复杂,为了提升对象之间查询的效率,特别是通过对象相互引用关系对对象实例数据进行检索,系统提供关系索引透视表 Relationship 来优化对象引用关联查询。

 

image.png

Relationships 索引透视表的字段说明如下:

  • OrgID:其所归属的应用对象所归属的租户 OrgID
  • ObjID:子对象的对象标识
  • GUID:子对象实例的唯一标识
  • RelationID:子对象内关系字段定义的标识
  • TargetObjInstanceID:父对象实例的唯一标识

关系透视表 Relationship 定义了两个底层数据库复合索引:

  • 第一个索引字段:OrgID + GUID,用于从子对象到父对象的关联查询。
  • 第二个索引字段:OrgID + ObjID + RelationID + TargetObjInstanceID,用于父对象到子对象的关联查询。

Relationships 索引透视表会在后面 SOQL 章节进行进一步描述验证。

4)其他索引透视表

其他索引透视表的逻辑类似,都是为了满足特定检索和查询需要,将数据同步到索引表,供应用系统使用。此处不再赘述,如确实有需要再补充。

五、SOQL 与关系 Relationships

SOQL 是 Salesforce Object Query Language 的简称,具有 SQL 类似的语法结构,就像前面提到的一样,Salesforce 是以应用对象(Salesforce Object,简称 SObject)的视角管理业务数据和功能,SOQL 类似对用于对应有对象数据进行查询的 API。

1. 从SQL 到 SOQL

SOQL 也是采用类似表查询的结构,同 SQL 非常相似,也通过底层数据库索引来提供查询优化支撑。不同点如下:

  • 没有 select *
  • 没有视图概念
  • SOQL 是只读的
  • 由于底层元数据驱动的多租户数据模型的限制,索引是受限制的,没有原生数据库物理结构丰富的索引支持。
  • 对象到关系的映射 (Object-Relational Mapping) 是自动完成的。
  • SObjects 在多租户环境中并不是对应实际的物理数据表。
  • SObjects 包括 SObjects 之间的关系都是以元数据的方式存储在多租户环境中的。

2. SOQL 示例&语法

下面我用示例来说明一下 SOQL 的用法,同时引出SOQL的特殊语法说明,SOQL 大小写不敏感。

1)单个对象的查询及语法说明

select id,productno__c,name,productprice__c,productstatus__c from product__c

 

image.png

前面提到过系统提供了标准应用对象和标准字段定义,更大的优势在于支持用户自行自定义对象和字段。这里c 代表的使用户自定义的含义, productc 代表的用户自定义对象 Product,而非系统标准对象和字段,系统标准对象和字段在 SOQL 无需c 后缀,如ID,Name,CreatedBy 等字段则为系统提供给每个对象的标准字段,而字段 ProductNo 为用户自定义字段,则 SOQL 中的语法表示为 productnoc。这样的好处是讲标准和用户自定义对象和字段很容易区分开,系统可以定义标准 Product 对象,以 product 表示,用户也可以同样定义一个 Product 对象,不过 SOQL 用 product__c 表示用于区分。

2)子对象关联父对象 (Child to Parent) 查询及语法说明

select id,name,orderno__c,
customer__c,
customer__r.customerno__c,customer__r.name,
orderstatus__c,ordertime__c
from order__c order by orderno__c

 

image.png

select id,name,orderno__c,
​
customer__c,
customer__r.customerno__c,customer__r.name,
orderstatus__c,ordertime__c
from order__c
where customer__r.name='Cheng Yan'
order by orderno__c

 

image.png

这里是从子对象 Order 关联到父对象 Customer 进行查询,其中:

  • from 后面的对象 order__c 表示 Order 为用于自定义对象
  • Id,name 为 Order 对象内系统定义的标准字段
  • Ordernoc,customerc,orderstatusc,ordertimec 为用户自定义字段,这里需要说明的是 customer__c 自定义字段存储的是父对象实例 ID
  • customerr 就特别有意思,其中r 部分代表父对象关系引用,customer 部分对应关系字段名,customerr 代表从 Order 对象到 Customer 对象的一个应用关系,并通过 customerr.customernoc,customerr.name 获取到 Customer 对象的字段值。

3)父对象关联子对象 (Parent to Child) 查询及语法说明

select id,orderno__c,customer__r.name,ordertime__c,orderstatus__c,
(
select id,
product__r.productno__c,product__r.name,product__r.productprice__c
from orderitem__r
)
from order__c
order by orderno__c

 

image.png

这个语句稍微有些复杂,从 Order 对象关联到 OrderItem 对象,又从 OrderItem 关联到 Product,同时还包含了 Order 对象到 Customer 对象的关联。

这里着重说一下从父对象到子对象的关联,父到子的关联是在父对象的主查询语句中在查询字段中用()来封装到子对象的关联,其中

  • 子句中 from orderitemr 的 orderitemr 代表的是对子对象 OrderItem 的引用,orderitem 对应的为前文关系字段中提到的 ChildRelationshipName,并且同一个父对象的子方的关系名称唯一(父对象 Name+ChildRelationshipName 必须唯一),用作父对象到子对象的查询关联。
  • 子句中 id,productr.productnoc,productr.name,productr.productpricec 的上下文为 orderitemr 代表的子对象。

3. Relationships 索引透视表

Relationships 是为了 SOQL 的快速对象关联查询所定义的,子对象关联父对象( Child to Parent) 查询,复合索引(OrgID+GUID)在 Join 中起到较大作用,而需要从父对象关联子对象 (Parent to Child) 查询,则复合索引 (OrgID + ObjID + RelationID + TargetObjInstanceID) 在 Join 中起到较大作用。

六、如何支撑多租户巨大数据量

前面我们提到 Salesforce 一个共享数据库的概念,那一个共享数据库怎么来支撑如此巨大的多租户数据库呢,同时不仅需要支持巨量数据,并且还可以支撑租户间的数据物理隔离,保证各租户的数据稳定性、可用性和数据安全?

Salesforce 的做法是:分区。所有的 Force.com 的数据,元数据,透视表结构,包含底层数据库索引,都是通过对 OrgID 进行物理分区的,采用的是原生的数据库分区机制。所有的数据以及元数据通过你的 OrgID(16digits)进行分片 Hash。

数据分区是数据库系统提供的被验证过的技术,用以物理划分较大的逻辑数据结构到较小的可以管理的区块中。分区也可以帮助提升性能和扩展性,贴别是在多租户环境下一个巨大的数据系统的扩展性。根据定义,每一个 SOQL 的查询对应一个特别的租户信息,因此查询优化器,仅仅需要考虑访问包含对应租户的数据分区访问,而不是整个表或者索引。

七、无感的对象结构变更(No DDL)

当一个应用系统或者服务组件需要对其数据模型进行升级的时候,通常会通过数据库 DDL 语言对数据库物理结构进行操作,如果涉及的数据量较大,则可能会造成较长时间的数据库变更时效,造成对应时间内的系统不可用,如果是多租户系统还会可能其他租户的可用性造成影响,抑或造成诸多的底层模型不一致产生。

在元数据驱动的数据架构中,所有的 DDL 语言操作对应的使元数据层的元数据的记录的更新,不涉及数据库物理结构的更新,不会造成变更期间的数据库物理结构耗时调整造成的不可用,同时系统平台提供了一个高效的机制来减少对平台多租户应用总体性能影响。

当用户修改了一个表字段列的数据结构,从一种数据类型改成另外一种不同存储格式的数据类型时候,系统会重新分派一个新的弹性列给到这个字段列的数据,将数据从原来的存储弹性列批量拷贝到新的弹性列,然后才会更新此字段列的元数据,暨在 Fields 表中更新这个字段列的元数据,将数据类型更改为新的数据类型,并将 FieldNum 更新为新的 ValueX 列对应的X值。

同时,在如上对用户逻辑表结构调整生效过程中,原来的数据结构和对应的数据访问正常进行,直到逻辑表结构变更生效,对应用系统可用性不会造成影响,用户对此无感知。

八、多租户架构对于研发人员意味着什么

对于研发人员来说,多租户结构最多意味着两个版本:当前版本,以及下一个版本。没有遗留版本需要维护。所有人不用操心旧的技术,旧的版本,所有只有最新的版本,只需要关心最新的版本。

这样就给敏捷开发带来极大的好处,每年做个位的发布,每次发布几百个新的特性新的版本也不会改变用户的体验,新的特性可以根据用户需要开启,通过特性管理来开关。

新版本发布前,提供沙箱环境来允许用户提前试用新版本的系统。如果做 bug 修复,则是在所有租户层面上进行统一修复的。

对于用户应用的发布进行严格管理,防止对其他租户产生影响,通过提供沙箱环境来让用户验证新应用发布,并通过成千上万的自动化测试保证用户的正常功能。

在运行期间,不作任何底层 DDL 操作,不会做表的创建,也不会做表的变更,只可能在极少数的更新周期时候进行。

作者:程彦,曾就职于阿里数字供应链事业部担任多年供应链计划域研发,目前在阿里数据中台负责相关商业化产品开发。

原文链接 

本文为阿里云原创内容,未经允许不得转载

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/514469.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对 SolarWinds 事件更深的思考:如何防御供应链攻击

简介: 消灭企业安全体系中“隐秘的角落” ———— APT攻击愈演愈烈,与SolarWinds相关的安全反思已持续半月,阿里云安全带来了面向供应链攻击特征属性的全面攻防观察,以飨从业者。 ———— 后期精彩的APT内网对抗往往依赖于「先…

DTCC 2020 | 阿里云李飞飞:云原生分布式数据库与数据仓库系统点亮数据上云之路

简介: 数据库将面临怎样的变革?云原生数据库与数据仓库有哪些独特优势?在日前的 DTCC 2020大会上,阿里巴巴集团副总裁、阿里云数据库产品事业部总裁、ACM杰出科学家李飞飞就《云原生分布式数据库与数据仓库系统点亮数据上云之路》…

Serverless 架构到底要不要服务器?

简介: Serverless 架构是不是就不要服务器了?回答这个问题,我们需要了解下 Serverless 是什么。 Serverless 是什么? Serverless 架构是不是就不要服务器了?回答这个问题,我们需要了解下 Serverless 是什…

腾讯开源之道:基于Apache之道的开源实践与探索

8月6日,腾讯开源联盟主席、腾讯云开源生态总经理单致豪在2021 ApacheCon Asia上分享了腾讯对Apache之道的思考、探索与实践的历程。 作为开源界备受关注的会议之一,今年的ApacheCon Asia将持续3天,开设14分论坛,内容覆盖从大数据…

Linux上的js解码,使用JavaScript实现Base64编码与解码

我们知道,浏览器的window对象提供有window.atob()和window.btoa()方法可以对字符串进行Base64编码和解码。console.log(window.btoa(window.atob(yanggb)));但是有些运行环境,比如nuxt的服务端环境没法使用window对象(window对象只有在浏览器的运行环境中…

​如何让技术想法更容易被理解?

简介: 沟通说起来简单,要做好却很难。如何把复杂的技术问题通俗易懂地表达出来,让别人听懂,是每个技术人都会面临的难题。本文作者以自身经历为背景,总结技术人员在日常技术交流过程中,遇到的一些低效的技术…

大数据,凉了?

大数据被誉为“新石油”,如何管理并洞悉数据的价值,是企业未来发展的核心竞争力。进入大数据时代,数据规模与日俱增。另一方面,数据仓库的市场份额被其他技术蚕食,比如大数据、机器学习和人工智能。这种趋势给我们造成…

2021 年前端趋势预测

简介: 2021 哪些前端技术值得关注?来听听狼叔的分享。 知乎上,有人提问《2021前端会有什么新的变化?》 狼叔的回答二天超过6.1万阅读量,目前444个赞同,2个专业徽章,整体上看,这篇回答…

详解 Flink 容器化环境下的 OOM Killed

简介: 本文将解析 JVM 和 Flink 的内存模型,并总结在工作中遇到和在社区交流中了解到的造成 Flink 内存使用超出容器限制的常见原因。由于 Flink 内存使用与用户代码、部署环境、各种依赖版本等因素都有紧密关系,本文主要讨论 on YARN 部署、…

哈哈!TCP泄露了操作系统信息···

作者:轩辕之风O来源: 编程技术宇宙前言大家好,我是轩辕。前几天,我在读者群里提了一个问题:这一下,大家总算停止了灌水(这群人都不用上班的,天天划水摸鱼),开…

android 自定义view控件,Android 自定义View——自定义View控件

Android给我们提供了大量的View控件,但这还是远远满足不了我们的要求,有时候开发所需要的控件形式是在Android提供的控件中是不存在,这就需要我们自己去定义一个。那么如何自定义控件?学习自定义控件,首先要先掌握Canv…

解读容器的 2020:寻找云原生的下一站

简介: “云原生”到底是什么?它就是容器和 Kubernetes 吗?虚拟机是云原生的吗?…… 2020 年注定是不凡的。它在阴霾中开始,在惊叹中结束,也让未来变得更加扑朔迷离。那么,容器与云原生的 2020 年…

如何用好云的弹性

简介: 如何用好云的弹性 1. 弹性为什么这么重要 做好弹性让IT能力轻松跟上用户的业务发展,做到多、快、好、省。 多:选择多,可以全球建站、机型选择也多、配套云服务也多。 快:部署快,自建IDC的建设时长以…

android笔试添加自定义服务,Android之Listview(item为单选题)自定义adapter,像考试时前面的10几道单选题的实现...

用于展现重复性的东西,Listview比较好用,看了别人的自定义Adapter(item是EditText,能够很好地获取到每一个item的EditText值)。又由于在做项目的需要,故特制了一个item包含RadioGroup的Listview的自定义Adapter。主要功能&#xf…

实现工具自由!开源的桌面工具箱

来源: HelloGitHubRubick,因为开源所有更自由在一切开始之前,首先要致敬 uTools!如果没有它就没有 Rubick。大家好,我是“拉比克”(Rubick)项目的作者木偶。我做的 Rubick 是一款基于 Electron 的开源桌面工具箱&#…

测试一年多,上线就崩溃!微服务到底应该怎么测试?

简介: 只有了解风险,才能及时应对,保障服务高可用。 不久前,也就是11月16日,澳大利亚交易所(Australian Securities Exchange, ASX)上线了一个新的交易系统,但因为出现故障而被迫关闭…

阿里云熊鹰:基于融合、协同系统的边缘云原生架构演进和实践

简介: 云原生和边缘计算是近两年都非常火的技术话题了,在第十届云计算标准和应用大会上,阿里云高级技术专家熊鹰分享了《基于融合、协同系统的边缘云原生架构演进和实践》,希望通过介绍现在阿里云在边缘计算和边缘云原生这些技术领…

漫画:什么是 “建造者模式” ?

作者&#xff1a;东风玖哥来源&#xff1a; 程序员小灰————— 第二天 —————————————————首先&#xff0c;我们来定义一个Product类&#xff1a;public class Product {ArrayList<String> parts new ArrayList<String>();public void add(S…

阿里云云效何勉:云原生是“精益实践”的最佳助力

简介&#xff1a; 1月15日&#xff0c;国内知名“精益产品开发”研究和实践者、阿里云云效资深技术专家何勉在阿里云《云计算情报局》线上直播栏目中&#xff0c;分享其对研发新模式的最新思考&#xff0c;提出“下一代精益开发方法”&#xff0c;助力企业在研发效能上提升10倍…

开发效率提升15倍!批流融合实时平台在好未来的应用实践

简介&#xff1a; 本文由好未来资深数据平台工程师毛祥溢分享&#xff0c;主要介绍批流融合在教育行业的实践。内容包括两部分&#xff0c;第一部分是好未来在做实时平台中的几点思考&#xff0c;第二部分主要分享教育行业中特有数据分析场景。 1.背景介绍 好未来介绍 好未来是…