DAMA考试知识点

数据管理的定义:

  数据管理是为了交付、控制、保护并提升数据和信息资产的价值,在其整个生命周期中制定计划、制度、规程和实践活动,并执行和监督的过程

数据管理专业人员的定义:

  是指从事数据管理各方面的工作(从数据全生命周期的技术管理工作,到确保数据的合理利用及发挥作用),并通过其工作发挥数据管理价值。

业务驱动因素:

  数据管理的主要驱动力:使组织能够从其数据资产中获取价值。

数据管理目标:

1理解并支撑企业机器利益相关方的信息需求得到满足

2获取、存储、保护数据和确保数据资产的完整性

3确保数据和信息的质量

4确保利益相关方的数据隐私和保密性

5防止数据和信息未经授权或被不当访问、操作及使用

6确保数据能有效地服务于企业增值的目标

数据基本概念:

什么是数据?

数据既是对其所代表的对象的解释,也是必须解释的对象

数据代表事实,是这个世界中与某个事实结合在一起的一种真实表达。

什么是语境?

语境可被视为数据的表示系统,该系统包括一个公共词汇表和一系列组件之间的关系,如果知道这样一个系统的约定,就可解释其中的数据。这些数据通常记录在一种特殊类型的数据——元数据中。

数据是一种资产

资产是一种经济资源,能被拥有或控制、持有或产生价值,资产可以转化为货币,数据是一种组织资产。

数据和信息

1、关于数据的几个异议

1)基于数据是简单存在的假设。(错误)但数据并不是简单存在,而是要被创造出来的。

2)将数据到智慧描述为一个自下而上的逐级序列(错误),未认识到创建数据需要知识。

3)金字塔模型意味着数据和信息是分开的(错误),但数据和信息是相互交织并相互依赖的,数据是信息的一种形式,反之也是。

2、要为不同目的准备数据和信息,使得数据管理形成一个核心原则:数据和信息都需要被管理;

如果再将两者的使用和客户的需求结合在一起进行管理,则两者应具有更高的质量。

数据管理原则

(1)数据是有独特属性的资产

数据是一种资产,但相比其他类型资产,其在管理方式的某些方面有很大差异,对比金融和实物资产,其中最明显的一个特点是数据资产在使用过程中不会产生消耗

(2)数据的价值可以用经济术语来表示

将数据视为资产意味着它有价值,虽然有技术手段可以测量数据的数量和质量,但还未形成这样做的标准来衡量其价值。

(3)管理数据意味着对数据的质量管理

首要目标是确保数据符合应用的要求,为了管理质量,组织必须确保他们了解利益相关者对质量的要求,并根据这些要求度量数据

(4)管理数据需要元数据

用于管理和如何使用的数据都称为元数据,元数据源于与数据创建、处理和使用相关的一系列流程,包括架构、建模、管理、治理、质量管理、系统开发、IT和业务运营以及分析

(5)数据管理需要规划

数据在多个地方被创建,但因为使用需要在很多存储位置间移动,需要一些协调工作来保持最终结果的一致,需要从架构和流程的角度进行规划

(6)数据管理须驱动信息技术决策

数据和数据管理与信息技术和信息技术管理紧密结合,管理数据需要一种方法,确保技术服务于而不是驱动组织的战略数据需求。

(7)数据管理是跨职能的工作

需要一系列的技能和专业知识、因此单个团队无法管理组织的所有数据。数据管理需要技术能力、非技术能力以及写作能力

(8)数据管理需要企业级视角

虽然数据管理存在很多本地应用程序,但它必须能够有效地应用于整个企业,这就是为什么数据管理和数据治理是交织在一起的原因之一。

(9)数据管理需要多角度思考

数据是流动的,数据管理必须不断发展演进,以跟上数据创建的方式、应用的方式和消费者的变化。

(10)数据管理需要全生命周期的管理,不同类型数据有不同的生命周期特征

不同类型数据有不同的生命周期特征,因此它们有不同的管理需求、数据管理实践需要基于这些差异,保持足够的灵活性来满足不同类型数据的生命需求。

(11)数据管理需要纳入与数据相关的风险

数据除了是一种资产外,还代表着组织的风险。数据可能丢失、被盗或误用。组织必须考虑其使用数据的伦理影响,数据相关风险必须作为数据生命周期的一部分进行管理

(12)有效的数据管理需要领导层承担责任

数据管理涉及一组复杂的过程,需要协调、协作和承诺。为了达到目标,不仅需要管理技巧,还需要来自领导层的愿景和使命。

数据管理的挑战

1、数据与其他资产的区别

1)定义数据所有权

2)列出组织拥有的数据量

3)防止数据滥用

4)管理与数据几余相关的风险

5)定义和实施数据质量标准

2、数据价值

是一件事物的成本和从中获得利益的差额;

评估数据的价值需要在组织内部持续付出的一般性成本和各类收益:

1)获取和存储数据的成本

2)如果丢失,更换数据需要的成本

3)数据丢失对组织的影响

4)风险缓解成本和与数据相关的潜在风险成本

5)改进数据的成本

6)高质量数据的优势

7)竞争对手为数据付出的费用

8)数据潜在的销售价格

9)创新性应用数据的预期收入

主要挑战是:数据的价值是上下文相关的。在一个组织中,某些类型的数据可能会随着时间的推移而具有一致的价值。

3、数据质量

确保高质最数据是数据管理的核心低质量数据的成本主要来源于:

1)报废和返工

2)解决方法和隐藏的纠正过程

3)组织效率低下或生产力低下

4)组织冲突

5)工作满意度低

6)客户不满意

7)机会成本,包括无法创新

8)合规成本或罚款

9)声誉成本

高质量数据的作用包括:

1)改善客户体验

2)提高生产力

3)降低风险

4)快速响应商机

5)增加收入

6)洞察客户、产品、流程和商机,获得竞争优势

4、数据优化计划

决策需要系统思考,因为涉及:

1)数据也许被视为独立于业务流程存在2)业务流程与支持它们的技术之间的关系

3)系统的设计和架构及其所生成和存储的数据

4)使用数据的方式可能被用于推动组织战略

5、元数据和数据管理

元数据描述了一个组织拥有什么数据,它代表什么、如何被分类、它来自哪里、在组织之内如何移动、如何在使用中演进、谁可以使用它以及是否为高质量数据。元数据是全面改进数据管理的起点。

6、数据管理是跨职能的工作

数据管理需要系统规划的设计技能、管理硬件和构建软件的高技术技能、利用数据分析理解问题和揭示数据的技能、通过定义和模型达成共识的语言技能、发现客户服务商机和实现目标的战略思维。

挑战在于让具备这一系列技能的人认识到各部分是如何结合在一起的。

7、建立企业的视角

管理数据需要理解一个组织中的机会和数据范围。

重要的原因之一是帮助组织跨垂直领域作出决策。

8、数据管理需要多角度思考

自有和外购数据,以及外国法律法规,以及误用风险

9、数据生命周期

数据生命周期基于产品生命周期,不应该与系统开发生命周期混淆。它包括创建或获取、移动、转换和存储数据并使其得以维护和共享的过程,使用数据的过程,以及处理数据的过程在整个生命周期中,可以清理、转换、合并、增强或聚合数据。随着数据的使用或增强,通常会生成新的数据,因此其生命周期具有内部迭代,而这些选代没有显示在图表上。

数据管理对生命周期的关注有几个重要影响:

1)创建和使用是数据生命周期中的关键点

2)数据质最管理必须贯穿整个数据生命周期

3)元数据质量管理必须贯穿整个数据生命周期

4)数据管理还包括确保数据安全,并降低与数据相关的风险

5)数据管理工作应聚焦于关键数据,将数据ROT降至最低

10、不同种类的数据

按数据类型分类,如交易数据、参考数据、主数据、元数据,或者类别数据、源头数据、事件数据、详细交易数据:

也可以按数据内容、数据所需格式或保护级别、存储或访问的方式和位置进行分类

11、数据和风险

数据的风险在于,它可能被误解和误用:

最高质量的数据带给组织最大的价值--可获得、相互关联、完整、准确、一致、及时、适用、有意义和易于理解。

12、数据管理和技术

管理技术和管理数据不同。组织需要了解技术对数据的影响,以防止技术诱惑推动他们对数据的决策。相反,与业务战略一致的数据应该推动有关技术的决策。

13、高效的数据管理需要领导力和承诺

《领导者的数据宣言》:组织有机增长的最佳机会在于数据:

倡导首席数据官(CD0)的作用源于认识到管理数据会带来独特的挑战,成功的数据管理必须由业务驱动,而不是由IT驱动。

数据管理战略

战略是一组选择和决策,它们共同构成了实现高水平目标的高水平行动过程。

战略计划是为实现高水平目标而采取的高水平行动。

数据战略应该包括使用信息以获得竞争优势和支持企业目标的业务计划。

数据战略需要一个支持性的数据管理战略——

一个维护和改进数据质量、数据完整性、访问和安全性的规划,同时降低已知和隐含的风险。该战略还必须解决与数据管理相关的已知挑战。数据管理战略的组成应包括:

1)令人信服的数据管理愿景

2)数据管理的商业案例总结

3)指导原则、价值观和管理观点

4)数据管理的使命和长期目标

5)数据管理成功的建议措施

6)符合SMART原则(具体、可衡量、可操作性、现实、有时间限制)的短期数据管理计划目标7)对数据管理角色和组织的描述,以及对其职责和决策权的总结

8)数据管理程序组件和初始化任务

9)具体明确范围的优先工作计划

10)一份包含项目和行动任务的实施路线图草案

数据管理战略规划的可交付成果

1)数据管理章程

包括总体愿景、业务案例、目标、指导原则、成功衡量标准、关键成功因素、可识别的风险、运营模式等

2)数据管理范围声明

包括规划目的和目标,以及负责实现这些目标的角色、组织和领导

3)数据管理实施路线图

确定特定计划、项目、任务分配和交付里程碑。

数据管理主要框架:战略一致性,阿姆斯特丹,DAMA车轮图,环境因素六边形,语境图、金字塔

战略一致性模型:

抽象了各种数据管理方法的基本驱动因素,模型的中心是数据和信息之间的关系。

信息通常与业务战略和数据的操作相关,数据与信息技术和流程相关。

围绕这一概念是战略选择的4个基本领域:业务战略、IT战略、组织和流程以及信息系统。

阿姆斯特丹信息模型:

与战略一致性模型一样,从战略角度看待业务和IT的一致性。共有9个单元,它抽象出一个关注结构(包括规划和架构)和策略的中间层。此外,还要认识到信息通信的必要性。

SAM(战略一致性模型)和AIM(阿姆斯特丹信息模型)框架动横轴和纵轴两个维度详细描述组件之间的关系

1)DAMA车轮图

车轮图定义了数据管理知识领域,将数据治理放在中心,其他知识领域围绕车轮平衡

2)环境因素六边形图

显示了人、过程和技术之间的关系,是理解DMBOK语境关系图的关键。它将目标和原则放在中心,因为这些目标和原则为人们如何执行活动及有效地使用工具成功进行数据管理提供了指导。

3)知识领域语境关系图

描述了知识领域的细节,包括与人员、流程和技术相关的细节。他们基于产品管理的SIPOC图的概念。每个语境关系图都以知识领域的定义和目标开始。目标驱动的活动分为四个阶段:计划(P)、控制(C)、开发(D)、运营(O)

组成部分包括:

1)定义

2)目标

3)活动:①计划活动P ②控制活动C ③开发活动D ④运营活动O

4)输入

5)交付成果

6)角色和职责

7)供给者 负责提供或允许访问活动输入的人员

8)消费者 直接受益于数据管理互动产生主要交付成果的消费方

9)参与者 执行、管理或批准知识领域活动的人员

10)工具 它是实现知识领域目标的应用程序和其他技术

11)方法 它是用于在知识领域内执行活动和产生可交付成果的方法和程序。它还包括共同约定、最佳实践建议、标准和协议以及新出现的一些合适的替代方法。

12)度量指标 它是衡量或评估绩效、进度、质量、效率或其他影响的标准。这些指标用于定义每个知识领域内完成工作的可量化事实。

DMBOK金字塔(Aiken)

第一阶段

组织购买包含数据库功能的应用程序

第二阶段

一旦组织开始使用应用程序,他们将面临数据质量方面的挑战,但获得更高质量的数据还取决于可靠的元数据和一致的数据结构,它们说明了来自不同系统的数据是如何协同工作的。

第三阶段

管理数据质量、元数据和架构需要严格地实践数据治理,为数据管理活动提供体系性支持。

第四阶段

该组织充分利用了良好管理数据的好处,并提高了其分析能力

DAMA数据管理框架的进化

  该框架从数据管理的指导目标开始:使组织能够像从其他资产中获取价值那样,从其数据资产中获取价值。

  与数据生命周期相关的数据管理功能在图的中心进行了描述,包括:为可靠、高质量的数据进行规划和设计:建立过程和功能来使用和维护数据;在各种类型的分析活动以及这些过程中使用数据,以提高价值。

  DAMA数据管理框架也被描述为另一种形式的DAMA车轮图,数据治理范围内的应用活动围绕着数据管理生命周期内的各项核心活动进行。

  核心活动位于框架中心,包括元数据管理、数据质量管理和数据结构定义

  生命周期管理活动可以从多个方面定义,如计划的角度(风险管理、建、数据涉及、参考数据管理),实现的角度(数据仓库、主数据管理、数据存储和操作、数据集成和互操作、数据开发技术)

  生命周期管理活动源于数据的使用:主数据使用、文件和内容管理、商务智能、数据科学、预测分析、数据可视化。

(1)数据治理

通过建立一个能够满足企业需求的数据决策体系,为数据管理提供指导和监督

(2)数据架构

定义了组织战略协调的管理数据资产蓝图,以建立战略性数据需求及满足需求的总体设计

(3)数据建模和设计

以数据模型的精确形式,进行发现、分析、展示和沟通数据需求

(4)数据存储和操作

以数据价值最大化为目标,包括存储数据的设计、实现和支持活动以及在整个数据生命周期中,从计划到销毁的各种操作活动。

(5)数据安全

确保数据隐私和机密性得到维护,数据不被破坏,数据被适当访问

(6)数据集成和互操作

包括与数据存储、应用程序和组织之间的数据移动和整合相关的过程

(7)文件和内容管理

用于管理非结构化媒体数据和信息的生命周期过程,包括计划、实施和控制活动,尤其是指支持法律法规遵从性要求所需的文档

(8)参考数据和主数据

包括核心共享数据的持续协调和维护,使关键业务实体的真实信息以准确、及时和相关联的方式在各系统间得到一致使用。

(9)数据仓库和商务智能

包括计划、实施和控制流程来管理决策支持数据,并使知识工作者通过分析报告从数据中获得价值。

(10)元数据

包含规划、实施和控制活动,以便能够访问高质量的集成元数据,包括定义、模型、数据流和其他至关重要的信息

(11)数据质量

包括规划和实施质量管理技术,以测量评估和提高数据在组织内的适用性。

数据处理伦理

描述数据伦理规范在促进信息透明、社会责任决策中的核心作用。数据采集、分析和使用过程中的伦理意识对所有数据管理专业人员有指导作用。

大数据和数据科学

描述了针对大型的、多样化数据集收集和分析能力的提高而出现的技术和业务流程。

数据管理成熟度评估

概述了评估和改进组织数据管理能力的方法

数据管理组织和角色期望

为组建数据管理团队、实现成功的数据管理活动提供了实践指导和参考。

数据管理和组织变革管理

描述了如何计划和成功地推动企业文化变革。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/739600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【科研必备教程】ChatGPT、气象、生态、遥感、水文、洪水、语言、地质、AI人工智能等领域模型应用

针对ChatGPT、遥感、ArcGIS、无人机、水文模型、大气科学、生态系统模型、地下水土壤、数据语言、生物信息、AI人工智能、碳排放等科研领域教程。 ChatGPT专栏1最新ChatGPT支持下的PyTorch机器学习与深度学习实践技术应用2基于ChatGPT4Python近红外光谱数据分析及机器学习与深…

智海Mo 平台与 Datawhale 携手浙江大学,共襄 AI+X 高校行!

2024年3月9日,一场以"AIX 高校行"为主题的活动在浙江大学成功举办。本次活动由 Datawhale 与杭州市人工智能学会主办,浙江大学人工智能研究所、浙江大学控制科学与工程学院联合主办,浙江大学学生人工智能协会承办,趋动云…

工业智能网关的网关模式和交换机模式有哪些区别

工业智能网关主要用以实现工业物联网络中不同设备和系统之间的通信,工业智能网关常见的两种工作模式是网关模式和交换机模式,在功能和应用场景上存在显著差异,本篇就为大家简单介绍一下两者之间的主要区别: 1、网关模式 工业智能…

利用百度竞价排名推广增加转化率-华媒舍

在数字营销领域,提高网站转化率是一个重要的目标。百度竞价排名是一种有效的推广方式,通过提高网站在搜索结果中的排名,能够吸引更多的用户点击,并且增加转化率。本文将介绍如何利用百度竞价排名来推广,并且提供一些最…

week06 day04 (数据库高级函数 procedure 、sql写函数)

一. ER模型 矩形: 代表实体椭圆:代表实体的属性菱形:relation 代表实体之间的关系 二. 存储过程(procedure) 1. 语法 语法: create procedure 存储过程名(参数,…) begin//代码 end// 注意: 因为在存储…

Java中 常见的开源图库介绍

阅读本文之前请参阅------Java中 图的基础知识介绍 在 Java 中,有几种流行的开源图库,它们提供了丰富的图算法和高级操作,可以帮助开发者更高效地处理图相关的问题。以下是几种常见的 Java 图库及其特点和区别: JGraphT …

阳光保险MySQL数据库平稳迁移OceanBase,稳定运营超700天

作者简介: 车东兴:于阳光保险就职,深耕保险行业的 IT 领域长达12 年,对保险领域的基础架构实践有深刻的理解与掌握。熟悉多款数据库,具有丰富的数据库运维经验。 王华城:于阳光保险就职,10多年一…

红帽认证RHCE好考吗?多长时间能考下来?报名费多少一门?哪些人适合考红帽认证?

一、红帽认证等级 红帽认证考试有三个等级,分别是RHCSA(红帽认证系统管理员),RHCE(红帽认证工程师),RHCA(红帽认证架构师)。RHCA是最高级别的认证。 二、RHCE考试 1、考…

C语言数据结构之堆排序

青衿之志 履践致远 堆排序(Heapsort) 是指利用 堆 这种数据结构所设计的一种排序算法,它是 选择排序 的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。 🎥二叉堆 🎥二叉树 🔥期待小伙伴们…

惰性删除、定期删除和Redis的淘汰策略有什么区别?

惰性删除(Lazy Expiration)和定期删除(Periodic Expiration)是Redis处理键过期的两种策略,它们共同作用以确保过期数据能够被有效地清理,但主要针对的是带有过期时间的键。 惰性删除: 当客户端尝…

sql面试题21:营销带货销量分析

题目大概意思: 找出网红带来的订单号和销售额(销售额是该订单的,比如凑单),满足是优惠码是1的,B类商品 数据表两个,分别是订单和品类 CREATE TABLE 订单 (订单号 VARCHAR(512),商品号 VARCH…

常用的gpt网站

ChatGPT是一款基于人工智能技术的对话型AI助手,能够进行自然语言交互并提供个性化的对话服务。通过先进的深度学习模型,ChatGPT能够理解用户输入的文本,并生成有逻辑、连贯性的回复。它可以回答各种问题、提供建议、分享知识,还能…

如何使用US Domain Center和WordPress搭建非营利组织网站的详细指南

在今天的数字化时代,拥有一个专业、易于管理和更新的网站对于非营利组织(例如慈善机构、NGO等)至关重要。WordPress是一个功能强大且易于使用的网站构建平台,而美国域名中心 US Domain Center:US Domain Center 则是一…

如果需要在Log4j中记录特定的异常信息,应该如何实现?如何动态地更改Log4j的日志级别?

如果需要在Log4j中记录特定的异常信息,应该如何实现? 在Log4j中记录特定的异常信息,你可以使用Logger类的error、warn、info等方法,这些方法通常接受一个字符串消息和一个Throwable对象(如异常)作为参数。下…

嵌入式学习37-TCP并发模型

TCP并发模型: 1.TCP多线程模型: 缺点: 1.创建线程会带来 资源开销 2.能够实现的 并发量 比较有限 2.IO模型: 1.阻塞IO: 没有…

群晖NAS使用Docker安装WPS Office并结合内网穿透实现公网远程办公

文章目录 推荐1. 拉取WPS Office镜像2. 运行WPS Office镜像容器3. 本地访问WPS Office4. 群晖安装Cpolar5. 配置WPS Office远程地址6. 远程访问WPS Office小结 7. 固定公网地址 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默&#xff…

optee默认安全配置

OP-TEE(Open Portable Trusted Execution Environment)是一个开源的可移植的可信执行环境(TEE),用于提供安全和受保护的执行环境。它旨在为基于 ARM 架构的设备提供强大的安全性和隔离能力。 OP-TEE 主要由两部分组成…

社交创新的先锋:探秘Facebook背后的故事与智慧

起源与初创阶段 Facebook的故事始于2004年,由马克扎克伯格(Mark Zuckerberg)、埃迪华索伦(Eduardo Saverin)、安德鲁麦克卡拉姆(Andrew McCollum)、克里斯休斯(Chris Hughes&#x…

如何保证消息的顺序性

先看看顺序会错乱的场景:RabbitMQ:一个 queue,多个 consumer,这不明显乱了: 解决方案:

Qt/QML编程之路:openglwidget和倒车影像的切换(43)

关于如何实现一个基于OpenGL的3d 图形,这个有很多专门的介绍,我在开发中遇到了这么一个问题: 如何实现一个倒车影像的video显示与一个3D物体显示的切换,因为开窗在同样的一个位置,如果车子倒车启动,则需要将原本显示3D的地方切换为视频图像的显示。 class testOpenGl : …