数仓建模—数据生命周期管理
数据生命周期管理 (DLM) 是一种在从数据输入到数据销毁的整个生命周期内管理数据的方法。 数据根据不同的条件分处不同的阶段,随着其完成不同的任务或满足特定要求而逐次经历这些阶段。 一个出色的 DLM 流程提供针对企业数据的结构和组织,帮助实现流程中的关键目标,包括数据安全性和数据可用性。
这些目标对于企业成功非常关键,而且随着时间的推移越来越凸显出其重要性。 DLM 策略和流程帮助企业做好准备应对因数据泄露、数据丢失或系统故障而带来的灾难性后果。 出色的 DLM 战略会划分数据保护和灾难恢复任务的优先顺序,尤其是在越来越多的恶意行为实施者利用快速增长的数据进入市场的形势下。 这样,当发生灾难时,企业可借助业已实施的有效的数据恢复计划从容应对,减轻对企业品牌的利润和总体声誉的灾难性影响
数据生命周期管理与信息生命周期管理之对比
信息生命周期管理 (ILM) 通常可与数据生命周期管理互换使用,虽然它也是数据管理实践的一部分,但与 DLM 并不相同。
数据生命周期管理主要监管文件级数据;也就是说,它根据类型、大小和存在时间长度来管理文件。 而 ILM 负责管理文件中的各种数据,确保数据准确性和及时更新。 这包括用户信息,例如电子邮件地址或账户余额。
数据生命周期管理的各个阶段
数据生命周期由覆盖其有用生命周期的一系列阶段构成。 每个阶段都由一组策略管理,目的是在生命周期的每个阶段最大程度发挥数据的价值。 随着进入企业工作流的数据量不断增长,DLM 也变得越来越重要。
基于⼤数据环境下数据在组织机构业务中的流转情况,定义了数据⽣命周期的6个阶段,具体各阶段的定义如下:
- 数据采集:指新的数据产⽣或现有数据内容发⽣