【大数据】Flink 内存管理（二）：JobManager 内存分配（含实际计算案例）

Flink 内存管理（二）：JobManager 内存分配

1.分配 Total Process Size
2.分配 Total Flink Size
3.单独分配 Heap Size
4.分配 Total Process Size 和 Heap Size
5.分配 Total Flink Size 和 Heap Size

JobManager 是 Flink 集群的控制元素。它由三个不同的组件组成：资源管理器（Resource Manager）、调度器（Dispatcher）和每个运行中的 Flink 作业的一个作业管理器（JobMaster）。

JobManager 的内存模型如下：
在这里插入图片描述
以上 Total Process Memory 的模型图可以分为以下的 4 个内存组件，如果在分配内存的时候，显示的指定了组件其中的 $1$ 个或者多个，那么 JVM Overhead 的值就是在其它组件确定的情况下，用 Total Process Size - 其它获取的值，必须在 min - max 之间，如果没有指定组件的值，那么就按照 $0.1$ 的比例进行计算得到，如果计算出的值小于 min 取 min，如果大于 max 取 max，如果 min、max 指定的相等，那么这个 JVM Overhead 就是一个确定的值！

内存组件	配置选项	内存组件的功能
JVM Heap	`jobmanager.memory.heap.size`	JobManager 的 JVM 堆内存大小。这个大小取决于提交的作业个数和作业的结构以及用户代码的要求。主要用来运行 Flink 框架，执行作业提交时的用户代码以及 Checkpoint 的回调代码。
Off-Heap Memory	`jobmanager.memory.off-heap.size`	JM 的对外内存的大小。涵盖了所有 Direct 和 Native 的内存分配。用来执行 `akka` 等外部依赖，同时也负责运行 Checkpoint 回调及作业提交时的用户代码，有默认值 $128 M$ 。
JVM Metaspace	`jobmanager.memory.jvm-metaspace.size`	JM 的元空间大小，有默认值 $256 M$ ，属于 Native Memory。
JVM Overhead	`jobmanager.memory.jvm-overhead.min` `jobmanager.memory.jvm-overhead.max` `jobmanager.memory.jvm-overhead.fraction`	JVM 额外开销。为 Thread Stacks，Code Cache，Garbage Collection Space 预留的 Native Memory，有默认的 `faction of total process size`，但是必须在其 `min` & `max` 之间。

在《Flink 内存管理（一）：设置 Flink 进程内存》中我们提到，必须使用下述三种方法之一配置 Flink 的内存（本地执行除外），否则 Flink 启动将失败。这意味着必须明确配置以下选项子集之一，这些子集没有默认值。

序号	for TaskManager	for JobManager
1️⃣	`taskmanager.memory.flink.size`	`jobmanager.memory.flink.size`
2️⃣	`taskmanager.memory.process.size`	`jobmanager.memory.process.size`
3️⃣	`taskmanager.memory.task.heap.size` 和 `taskmanager.memory.managed.size`	`jobmanager.memory.heap.size`

1.分配 Total Process Size

jobmanager.memory.process.size

在这里插入图片描述

此时我们只显示指定了 jobmanager.memory.process.size 的值，没有指定其它组件，此时整个 JobManager 的 JVM 进程能占用的内存为 $2000 M$ 。

Total Process Size $= 2000 M$ （这是分配的基准值）
JVM Overhead 因为没有指定其它组件内存，所以被按照 $0.1$ 的比例推断成： $2000 M \times 0.1 \times 1024 \times 1024 = 209715203 B = 200 M$
JVM Metaspace 默认值为 $256 M$
Off-Heap Memeory 默认值为 $128 M$
JVM Heap 最终被推断为 $2000 M - 200 M - 256 M - 128 M = 1.38 G$

为啥 JVM Heap 只有 $1.33 GB$ 而不是 $1.38 GB$ 呢？

在这里插入图片描述
其实这个取决于你使用的 GC 算法会占用其中很小一部分固定内存作为 Non-Heap，该占用部分大小为： $1.38 - 1.33 = 0.05 GB$ 。

2.分配 Total Flink Size

jobmanager.memory.flink.size

在这里插入图片描述

此时我们只显示指定了 jobmanager.memory.flink.size 的值，也没有指定其它组件如 Heap Size，此时整个 JobManager 的 JVM 进程除了 JVM Overhead 及 JVM Metaspace 之外能占用的内存为 $2000 M$ 。

Total Flink Size $= 2000 M = 1.95 G$ （这属于 Total Process Size 的组件之一，Overhead 只能最后按剩余的内存来被推断）
JVM Metaspace 默认值为 $256 M$ （固定默认值）
Off-Heap Memeory 默认值为 $128 M$ （固定默认值）
JVM Heap $= 2000 M - 128 M - 80 MB （ GC 算法占用） = 1.75 GB$
根据 JVM Overhead $=$ (JVM Overhead + Metaspace $256 M$ + Flink Size $×\ 0.1$ ，计算可得：
- Total Process Size $= 2.448 GB$
- JVM Overhead $= 2.448 GB \times 0.1 = 262843055 B = 250.667 MB$ ，在 $192 M ～ 1 GB$ ，为有效

最终资源的分配如以下日志所示：

在这里插入图片描述

3.单独分配 Heap Size

jobmanager.memory.heap.size

在这里插入图片描述

此时我们只显示指定了 jobmanager.memory.heap.size 的值，相当于显示配置了组件的值，此时整个 JobManager 的 JVM Heap 被指定为最大内存为 $1000 M$ 。

JVM Heap 被指定为 $1000 M$ ，但是得从 GC 算法中扣除 $41 MB$ ，实际 JVM Heap $= 959 MB$
JVM Metaspace 默认值为 $256 M$
Off-Heap Memeory 默认值为 $128 M$
Total Flink Size $= 1128 MB = 1.102 GB$
JVM Overhead $= (1128 MB + 256 M +$ JVM Overhead $) \times 0.1$
- JVM Overhead $= 153.778 < 192 MB$ （默认的 min），所以 JVM Overhead $= 192 MB$
Total Process Size $= 1128 MB + 256 M +$ JVM Overhead $= 1576 MB = 1.5390625 GB = 1.539 GB$

在这里插入图片描述

4.分配 Total Process Size 和 Heap Size

在这里插入图片描述
由于指定了 heap.size 内存组件的的大小，那么 JVM Overhead 就是取剩余的 Total Process Size 的内存空间。

Total Process Size $= 2000 MB$ && JVM Heap $= 1000 MB$ ，实际只有 $959 MB$ ，因为减去了 $41 MB$ 的 GC 算法占用空间
JVM Metaspace 默认值为 $256 M$
Off-Heap Memeory 默认值为 $128 M$
Total Flink Size $= 1000 MB + 128 MB = 1128 MB$
JVM Overhead $= 2000 MB - 1128 MB - 256 MB = 616 MB$

在这里插入图片描述

5.分配 Total Flink Size 和 Heap Size

在这里插入图片描述

由于指定了 head.size 组件的大小，那么 Overhead 就按照剩余 Total Process Size 的内存空间分配。

Total Flink Size $= 2000 MB$ && JVM Heap $= 1000 MB$ ，实际 $959 MB$ ，减去了 GC 算法的占用空间
JVM Off-Heap $= 2000 MB - 1000 MB = 1000 MB$
JVM Metaspace $= 256 MB$
首先根据 JVM Overhead $= ($ JVM Overhead $+$ Metaspace $256 M$ $+$ Flink Size $2000 M) \times 0.1$
- Total Process Size $= 2.448 GB$
- JVM Overhead $= 2.448 GB \times 0.1 = 262843055 B = 250.667 MB$ ，在 $192 M ～ 1 GB$ ，为有效
最终确定 Total Process Size $= 2.448 GB$ && JVM Overhead $= 250.667 MB$