Flink 新场景:OLAP 引擎性能优化及应用案例

摘要:本文由阿里巴巴技术专家贺小令(晓令)分享,主要介绍 Apache Flink 新场景 OLAP 引擎,内容分为以下四部分:

  1. 背景介绍
  2. Flink OLAP 引擎
  3. 案例介绍
  4. 未来计划

一、背景介绍

1.OLAP 及其分类

640.png

OLAP 是一种让用户可以用从不同视角方便快捷的分析数据的计算方法。主流的 OLAP 可以分为3类:多维 OLAP ( Multi-dimensional OLAP )、关系型 OLAP ( Relational OLAP ) 和混合 OLAP ( Hybrid OLAP ) 三大类。

(1)多维 OLAP ( MOLAP )

传统的 OLAP 分析方式
数据存储在多维数据集中

(2)关系型 OLAP ( ROLAP )

以关系数据库为核心,以关系型结构进行多维数据的表示
通过 SQL 的 where 条件以呈现传统 OLAP 的切片、切块功能

(3)混合 OLAP ( HOLAP )

将 MOLAP 和 ROLPA 的优势结合起来,以获得更快的性能

以下将详细介绍每种分类的具体特征。

■ 多维 OLAP ( MOLAP )

MOLAP 的典型代表是 Kylin 和 Druid。

640 1.png

  • MOLAP 处理流程

首先,对原始数据做数据预处理;然后,将预处理后的数据存至数据仓库,用户的请求通过 OLAP server 即可查询数据仓库中的数据。

640 2.png

  • MOLAP 的优点和缺点

MOLAP 的优点和缺点都来自于其数据预处理 ( pre-processing ) 环节。数据预处理,将原始数据按照指定的计算规则预先做聚合计算,这样避免了查询过程中出现大量的临时计算,提升了查询性能,同时也为很多复杂的计算提供了支持。

但是这样的预聚合处理,需要预先定义维度,会限制后期数据查询的灵活性;如果查询工作涉及新的指标,需要重新增加预处理流程,损失了灵活度,存储成本也很高;同时,这种方式不支持明细数据的查询。

因此,MOLAP 适用于对性能要求非常高的场景。

■ 关系型 OLAP ( ROLAP )

ROLAP 的典型代表是 Presto 和 Impala。

640 3.png

  • 处理流程

ROLAP 的处理流程上,用户的请求直接发送给 OLAP server,然后 OLAP server 将用户的请求转换成关系型操作算子,再通过 SCAN 扫描原始数据,在原始数据基础上做过滤、聚合、关联等处理,最后将计算结果返回给用户。

640 4.png

  • ROLAP 的优点和缺点

ROLAP 不需要进行数据预处理 ( pre-processing ),因此查询灵活,可扩展性好。这类引擎使用 MPP 架构 ( 与Hadoop相似的大型并行处理架构,可以通过扩大并发来增加计算资源 ),可以高效处理大量数据。

但是当数据量较大或 query 较为复杂时,查询性能也无法像 MOLAP 那样稳定。所有计算都是临时发生 ( 没有预处理 ),因此会耗费更多的计算资源。

因此,ROLAP 适用于对查询灵活性高的场景。

■ 混合 OLAP ( HOLAP )

混合 OLAP,是 MOLAP 和 ROLAP 的一种融合。当查询聚合性数据的时候,使用MOLAP 技术;当查询明细数据时,使用 ROLAP 技术。在给定使用场景的前提下,以达到查询性能的最优化。

2.Apache Flink 介绍

■ Flink 支持的应用场景

640 5.png

Apache Flink 支持的3种典型应用场景:

(1)事件驱动的应用

  • 反欺诈
  • 基于规则的监控报警

(2)流式 Pipeline

  • 数据 ETL
  • 实时搜索引擎的索引

(3)批处理 & 流处理分析

  • 网络质量监控
  • 消费者实时数据分析

■ Flink 架构及优势

640 6.png

Flink 的整体架构如上图所示,在此架构下,Flink 的优势也十分突出,主要分为6个方面:

(1)统一框架 ( 不区分流处理和批处理 )

  • 用户 API 统一
  • 执行引擎统一

(2)多层次 API

  • 标准 SQL APL
  • Table API
  • DataStream API ( 灵活,无 schema 限制 )

(3)高性能

  • 支持内存计算
  • 支持代价模型优化
  • 支持代码动态生成

(4)方便集成

  • 支持丰富的 Connectors
  • 方便对接现有 Catalog

(5)灵活的 Failover 策略

  • 在 Pipeline 下支持快速 failover
  • 类似 MapReduce、Spark 一样支持 shuffle 数据落盘

(6)易部署维护

  • 灵活部署方案
  • 支持高可用

二、Apache Flink OLAP 引擎

1.为什么 Flink 可以做 ROLAP 引擎?

640 7.png

  • Flink 的核心和基础是流计算,支持高性能、低延迟的大规模计算。
  • Blink 将批看作有限流,批处理是针对有限数据集的优化,因此批处理引擎也是构建在流引擎上 ( 已开源 )。
  • OLAP 是响应时间要求更短的批处理,因此 OLAP 可以看作是一种特殊的批。OLAP 引擎也可以构建在现有的批引擎上。

注:Flink OLAP 引擎目前不带存储,只是一个计算框架。

2.Flink 做 OLAP 引擎的优势

640 8.png

(1)统一引擎:流处理、批处理、OLAP 统一使用 Flink 引擎。

降低学习成本,仅需要学习一个引擎
提高开发效率,很多 SQL 是流批通用
提高维护效率,可以更集中维护好一个引擎

(2)既有优势:利用 Flink 已有的很多特性,使 OLAP 使用场景更为广泛。

使用流处理的内存计算、Pipeline
支持代码动态生成
也可以支持批处理数据落盘能力

(3)相互增强:OLAP 能享有现有引擎的优势,同时也能增强引擎能力

  • 无统计信息场景的优化
  • 开发更高效的算子
  • 使 Flink 同时兼备流、批、OLAP 处理的能力,成为更通用的框架

3.性能优化

OLAP 对查询时间非常敏感,当前很多组件的性能不满足要求,因此我们对 Flink 做了很多相关优化。

■ 服务架构的优化

  • 客户端服务化

下图介绍了一条 SQL 怎么在客户端一步一步变为 JobGraph,最终提交给 JM:

640 9.png

在改动之前,每次接受一个 query 时会启动一个新的 JVM 进程来进行作业的编译。其中 JVM 的启动、Class 的加载、代码的动态编译 ( 如 Optimizer 模块由于需要通过 Janino 动态编译进行 cost 计算 ) 等操作都非常耗时 ( 需要约3~5s )。因此,我们将客户端进行服务化,将整个 Client 做成 Service,当接收到用户的 query 时,无需重复各项加载工作,可将延时降低至 100ms 左右。

  • 自定义 CollectionTableSink
    640 10.png

这部分优化,源于 OLAP 的一个特性:OLAP 会将最终计算结果发给客户端,通过JobManager 转发给 Client。假如某个 query 的结果数据量很大,会让 JobManager OOM ( OutOfMemory );如果同时执行多个 query,也会相互影响。

因此,我们从新实现了一个 CollectionTableSink,限制数据的条数和数据大小,避免出现 OOM,保证多个 Query 同时运行时的稳定性。

  • 调度优化

640 11.png

在 Batch 模式下的调度存在以下问题:

  • 使用 Lazy_from_sources 模式调度,会导致整体运行时间较长,也可能造成死锁。
  • RM ( Resource Manager ) 按 OnDemand 方式分配 Slot 需求,也会造成死锁。
  • RM 以单线程同步模式向 TM ( Transaction Manager ) 分配 Slot 请求,会造成等待时间更长。

注:调度死锁是指在资源有限的情况下,多个 Job 同时运行时,如果多个 Job都只申请到了部分资源并没有剩余资源可以申请,导致 Job 没法继续执行,新的 Job 也没法提交。

针对上述问题,我们提出了以下几点改动:

  • 采用 Eager 调度模式 ( 确保所有的资源都申请到后才开始运行 )。
  • 使用 FIFO ( 先进先出队 ) 模式申请资源 ( 确保当前 Job 的资源分配结束后才开始下一个 Job 的资源分配 )。
  • 将单线程同步模式改为多线程异步模式,减少任务启动时间和执行时间。

■ 针对 source 的优化

在 ROLAP 的执行场景中,所有数据都是通过扫描原始数据表后进行处理;因此,基于 Source 的读取性能非常关键,直接影响 Job 的执行效率。

  • Project&Filter 下堆

640 12.png

像 Parquet 这类的列存文件格式,支持按需读取相所需列,同时支持 RowGroup 级别的过滤。利用该特性,可以将 Project 和 Filter 下推到 TableSource,从而只需要扫描 Query 中涉及的字段和满足条件的 RowGroup,大大提升读取效率。

  • Aggregate 下堆

640 13.png

这个优化也是充分利用了 TableSource 的特性:例如 Parquet 文件的 metadata 中已经存储了每个 RowGroup 的统计信息 ( 如 max、min等 ),因此在做 max、min 这类聚合统计时,可直接读取 metadata 信息,而不需要先读取所有原始数据再计算。

■ 在没有统计信息场景下做的优化

  • 消除 CrossJoin

640 14.png

CrossJoin 是没有任何 Join 条件,将 Join 的两张表的数据做笛卡尔积,导致 Join 的结果膨胀非常厉害,这类 Join 应该尽量避免。我们对含有 CrossJoin 的 Plan 进行改写:将有 join 条件的表格先做 join ( 通常会因为一些数据 Join 不上而减少数据 ),从而提高执行效率。这是一个确定性的改写,即使在没有统计信息的情况下,也可以使用该优化。

  • 自适应的 Local Aggregate

640 15.png

通常情况下,两阶段的 Aggregate 是非常高效的,因为 LocalAggregate 能聚合大量数据,导致 Shuffle 的数据量会变少。但是当 LocalAggregate 的聚合度很低的时候, Local 聚合操作的意义不大,反而会浪费 CPU。

在没有任何统计信息的情况下,优化器没法决定是否要产生 LocalAggregate 算子;因此,我们采用运行时采样的方式来判断聚合度,如果聚合度低于设定的阈值,我们将关闭聚合操作,改为仅做数据转发;经我们测试,部分场景有 30% 的性能提升。

4.测试结果

640 16.png

上图是 Flink 和 Presto基于 1T 数据做的 SSB ( Star Schema Benchmark ) 测试,从图中可以看出 Flink 和 Presto 整体上不相上下,甚至有些 Query Flink 性能优于Presto。

注:Flink OLAP 从开始到嘉宾分享时,只有3个月时间。

案例介绍

1.Flink OLAP 在数据探查上的应用

640 17.png

上图描述了一个数据湖应用的完整架构,Flink OLAP 主要用于"数据探查"。

数据探查是对数据结构做智能判断,给出数据的探查结果,快速了解数据的信息和质量情况。即用户可以在管控平台上了解数据湖中任意一份数据的数据特性。用户通过 Web 交互操作选择相应的表和指标后立即展示相关结果指标,因此要求低延迟、实时反馈。而且数据湖中很多数据没有任何统计信息;前述的各种查询、聚合层面的优化,主要为这类场景服务。

2.整体架构

640 18.png

上图是这类应用的整体架构。整套服务托管到 Kubernetes 上,最终访问的数据是OSS。

未来计划

当前,Flink OLAP 引擎性能优化及应用主要是基于内部 Flink,后续工作主要分为以下三块:

  1. 推回社区:目前所有工作都是基于内部 Flink,希望推回社区;
  2. 资源隔离:后期很多功能的开发和优化会围绕多 Query 运行时的"资源隔离";
  3. 优化&性能:围绕 OLAP 的特性,在此场景下会进一步做优化和性能提升等方面的工作。

原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何评估一项技术是否值得长期投入

“每个人的时间都是有限的,在有限的时间里选择一项值得投入的技术会变得尤为重要。” 笔者从 2008 年开始工作到现在也有 12 个年头了,一路走来都在和数据打交道,做过很多大数据底层框架内核的开发(Hadoop,Pig&#x…

绝了,项目内部源码资源被爆出!网友:请收下我的膝盖!

你好,程序员。多少个清晨,你让阳光肆无忌惮地穿透你精心搭配的格子衬衫;多少个白天,你在疯狂体会需求和 bug ;多少个午夜,你任凭无法止步的代码,收割着你的头发在忙碌焦虑中自我否定变成了常态&…

dubbo-go 中如何实现路由策略功能

可在控制面对服务的路由进行精细控制,是一个成熟 RPC 系统必备的能力之一。作为一个逐步走向成熟的 RPC 系统,Apache/dubbo-go(以下简称 dubbo-go )的最新版本 v1.4 中已经实现了 Condition Router 和 Health Instance First Rout…

独家对话谢宝友:做一款类似于 Linux 的国产操作系统 | 人物志

作者 | 郑丽媛来源 | CSDN(ID:CSDNnews)从国外操作系统的长期垄断到中国自主研发操作系统数十年的起落浮沉,技术自主创新独立已成为国产基础软件的主要突破口。近几年间,随着物联网时代的到来,以 Linux 为主…

RebatesMe:返利网站DDOS防护

公司介绍 上海途美网络科技有限公司旗下的RebatesMe海淘返利网是一家新兴的专注海淘和海淘返利信息的服务性网站。RebatesMe海淘返利网合作的美国商家接近1000家,包括eBay、亚马逊、沃尔玛、健安喜等等美国线上销售综合商品的商家,为全球用户提供高比例…

言图科技:GPU服务器选型

公司简介 言图科技总部位于武汉光谷,致力于人工智能领域的自然语言处理、图像处理基础算法、软件、平台与设备研发。目前,公司拥有成熟的自然语言处理基础软件集、语义理解工具集、知识图谱工具集、智能陪练机器人、聊天机器人、情感与专注度分析工具、…

H5 微信公众号 授权登录 前后端分离篇(前后端联调_03)

文章目录1. 获取code2. 返回报文解析3. 源码1. 获取code 前端请求微信获取code 回调信息 https://open.weixin.qq.com/connect/oauth2/authorize?appidwxd1f5b7f23b72428a&redirect_urihttp%3A%2F%2F192.168.43.122%3A80&response_typecode&scopesnsapi_userin…

集群e家:O2O电商服务平台上云

公司简介 陕西集群物联网服务管理股份有限公司旗下的“集群e家”是专注于社区商圈O2O服务的平台,为社区(乡村)家庭提供创新的家庭消费服务及消费体验。集群e家智慧生活是以社区(乡村)为中心,以“互联网”的…

大数据给教育带来怎样的可能?

来源 | 人民数字 Fintech责编 | 晋兆雨头图 | CSDN下载自视觉中国当下,数据成为教学改进最为显著的指标。学生的成绩不好是由于周围环境而分心了吗?期末考试不及格是学生请了太多病假的缘故吗?这些以往不太好回答的问题,如今通过大…

才博教育:AI口语学习平台上云

公司简介 北京才博教育科技有限公司自主开发了一套基于AI技术的口语学习工具,服务与英语教育机构。这套口语学习工具旨在于解决英语培训机构在传统英语教学中存在的会看、会写、不会说的问题,基于自主研发的AI人工智能技术,清晰的分辨学习者…

H5 微信公众号 授权登录 前后端分离篇(资料准备+前端01)

实现微信公众号授权登录,很简单,但是注意的地方要细心,小伙伴们跟着我的思路一起实现吧! 文章目录一、帐号申请1. 正式账号2. 测试帐号二、微信文档2.1. 文档主页2.2. 授权流程2.3. 授权回调三、前端部分3.1. 登录校验3.2. code获…

SQL分页查询方案的性能对比

作者 | 中国农业银行 吴海存责编 | 晋兆雨头图 | CSDN下载自视觉中国导读本文主要介绍了基于ROWNUM、主键列/非空唯一性列、分析函数、OFFSET-FETCH NEXT机制的几种SQL分页查询方案的性能对比。分页查询可分为逻辑分页和物理分页两种。逻辑分页是应用代码级别实现的分页&#x…

阿里云HBase增强版全文索引功能技术解析

新用户9.9元即可使用6个月云数据库HBase,更有低至1元包年的入门规格供广大HBase爱好者学习研究,更多内容请参考链接 阿里云HBase增强版(Lindorm)简介 阿里云数据库HBase增强版,是基于阿里集团内部使用的Lindorm产品研发的、完全兼容HBase的云…

ECMAScript 2015~2020 语法全解析

ECMAScript 2015~2020 语法全解析 ( ES6 ~ ES11 ).快速上手 > es.xiecheng.live

架构师技术文档:Redis+Nginx+Dubbo+Spring+架构师精选视频

最近花了很长的时间去搜罗整理Java核心技术好文,我把每个Java核心技术的优选文章都整理成了一个又一个的文档。今天就把这些东西分享给老铁们,也能为老铁们省去不少麻烦,想学什么技能了,遇到哪方面的问题了 直接打开文档学一学就好…

大分区表高并发性能提升100倍?阿里云 RDS PostgreSQL 12 解读

1. 问题 阿里云某客户发现自己使用读写分离实例,master的cpu特别高,而读写分离中承担读流量的slave节点却相对空闲。用户CPU打满后,访问到主节点的的线上服务受到了较大影响。 1.1 读写分离原理 Redis读写分离实例的原理是:key…

vue vant Area组件使用详解

文章目录1. 下载areaList.js2. 组件注册3. 封装组件4. 使用组件5. 效果图6. 项目源码1. 下载areaList.js 见文章末尾 2. 组件注册 main.js引入并注册(一般与Popup一起使用) 全局注册 //全局导入所有组件 import Vant from vant; import vant/lib/index.css;Vue.use(Vant)局…

微软KV Store Faster如何巧妙实现1.6亿ops

作者:叶提 Faster实现主要分为三部分: Epoch Protection框架,实现并发系统下全局修改,延迟同步到所有线程,简化并发设计。faster线程在大多时候不需要同步,完全独立执行。 支持高并发的无锁hash 索引&…

当飞猪遇上 Serverless | 云原生 Talk

来源 | 阿里巴巴中间件责编 | 晋兆雨头图 | CSDN付费下载于视觉中国前言2019 年 3 月,我们跟随着集团的步伐,将 Serverless FaaS 引入到飞猪,并取得了一定的阶段性成果:这一年,我们参与共建了 Node FaaS 研发平台和稳定…

vue ui 面板创建项目安装 axios 时,浏览器卡死的解决办法

目录 踩坑记1. 问题场景2. 解决办法踩坑记 Vue UI 可视化面板创建新项目,当安装完插件,再安装 axios 依赖时,点击 “ 安装 axios ” 按钮居然毫无响应,此时浏览器卡死、cmd 终端无法关闭,更杯具的是,CPU 占用率 100%,也无法关机或重启电脑 😂 。 1. 问题场景 2. 解决…