什么是数据资产管理?数据资产管理包括了哪些内容?

数据资产管理包括数据模型管理、数据标准管理、数据质量管理等 10 个活动职能,覆盖数据资源化、数据资产化两个阶段。本章参考 PDCA 方法,从计划、执行、检查、改进四个环节着手,阐述数据资产管理活动职能的核心理念与实践要点。

一、数据模型管理

数据模型是指现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型管理是指在企业架构管理和信息系统设计时,参考逻辑模型,使用标准化用语、单词等数据要素设计数据模型,并在企业架构管理、信息系统建设和运行维护过程中,严格按照数据模型管理制度,审核和管理新建和存量的数据模型。

数据模型管理的关键活动包括:

 数据模型计划:确认数据模型管理的相关利益方;采集、定义和分析组织级数据模型需求;确定遵循数据模型标准与要求,设计企业级数据模型(包括主题域数据模型、概念数据模型、逻辑数据模型);

数据模型执行:参考逻辑数据模型开发物理数据模型,保留开发过程记录;根据数据模型评审准则与测试结果,由数据模型管理的参与方进行模型评审,评审无异议后发布并上线模型;

数据模型检查:确定数据模型检查标准,定期开展数据模型检查,以确保数据模型与组织级业务架构、数据架构、IT 架构的一致性;保留数据模型检查结果,建立数据模型检查基线;

数据模型改进:根据数据模型检查结果,召集数据模型管理的相关利益方,明确数据模型优化方案;持续改进数据模型设计方法、模型架构、开发技术、管理流程、维护机制等。

采用企业架构指导建立企业级数据模型,并采用一体化建模的方法,是提升数据模型业务指导性和模型质量的有效方式。例如,华为成立了 EAC(企业架构委员会),参考企业架构设计了企业级数据模型(包括主题域数据模型、概念数据模型、逻辑数据模型),较好的描述和展示了业务流程与业务关系,同时,在一定时间内企业级数据模型保持稳定性,有效指导了新业务的方向探索与 IT 建设。

此外,通过引入一体化建模的方法,从技术和机制上支持企业级数据模型与 IT 开发的协同,使物理数据模型与逻辑数据模型保持一致,要求物理数据模型的实体属性来自于数据标准池,并通过元数据对该开发过程进行记录与监控,提升了数据模型的一致性、规范性、可控性。

二、数据标准管理

数据标准是指保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准管理的目标是通过制定和发布由数据利益相关方确认的数据标准,结合制度约束、过程管控、技术工具等手段,推动数据的标准化,进一步提升数据质量。

数据标准管理的关键活动包括:

• 数据标准管理计划:确定数据标准管理相关负责人与参与人,开展数据标准需求采集与现状调研,构建组织级数据标准分类框架;制定并发布数据标准管理规划与实施路线;

• 数据标准管理执行:在数据标准分类框架的基础上,定义数据标准;依据数据资产管理认责体系,组织相关人员进行数据标准评审并发布;依托平台工具,应用数据标准(包括数据模型设计与开发、数据质量稽核等);

• 数据标准管理检查:对数据标准的适用性、全面性进行及时检查;依托平台工具,检查并记录数据标准应用程度;

• 数据标准管理改进:通过制定数据标准维护与优化的路线图,遵循数据标准管理工作的组织结构与策略流程,各参与方共同配合进行数据标准维护与管理过程优化。

推动数据标准应用于数据开发、数据质量管理,提升数据标准管理效果。例如,交通银行一方面以新建系统或重构系统为契机,实施数据标准的“强管控”,基于数据建模工具打通 IT 开发需求与数据标准,要求IT 人员应用统一建模工具实施开发,推动数据标准有效落地,另一方面以数据标准管理促进数据质量提升,基于数据标准编制数据质量规则,聚焦关键业务领域与关键质量问题,并对数据标准应用情况进行持续监控。

业务术语是统一数据业务含义的关键,业务术语管理是数据标准管理的基础性工作。管理方面,企业已逐步形成统一管理的意识,重点关注业务术语的建设和应用,包括建立管理制度、管理流程并发布业务术语标准,并积极推广业务术语的宣贯和应用,促进业务术语的规范化、便捷化应用。技术方面,通过数据管理平台对业务术语进行统一归集、发布、查询和应用,确保在企业全局形成对核心业务概念的统一定义和使用。以中国工商银行为例,该行通过编制企业级的业务术语标准管理办法明确业务术语的命名规范、相关人员的职责以及应用原则等,建立集团信息标准系统对全行数据标准进行统一管理,定期组织相关培训以确保相关人员对组织内业务术语的理解一致。

三、数据质量管理

数据质量指在特定的业务环境下,数据满足业务运行、管理与决策的程度,是保证数据应用效果的基础。数据质量管理是指运用相关技术来衡量、提高和确保数据质量的规划、实施与控制等一系列活动。衡量数据质量的指标体系包括完整性、规范性、一致性、准确性、唯一性、及时性等。

数据质量管理的关键活动包括:

• 数据质量管理计划:确定数据质量管理相关负责人,明确数据质量的内部需求与外部要求;参考数据标准体系,定义数据质量规则库,构建数据质量评价指标体系;制定数据质量管理策略和管理计划;

• 数据质量管理执行:依托平台工具,管理数据质量内外部要求、规则库、评价指标体系等;确定数据质量管理的业务、项目、数据范畴,开展数据质量稽核和数据质量差异化管理;

•数据质量管理检查 / 分析:记录数据质量稽核结果,分析问题数据产生原因,确定数据质量检查责任人,出具质量评估报告和整改建议;持续测量全流程数据质量,监控数据质量管理操作程序和绩效;确定与评估数据质量服务水平;

• 数据质量管理改进:建立数据质量管理知识库,完善数据质量管理流程,提升数据质量管理效率;确定数据质量服务水平,持续优化数据质量管理策略。

数据质量管理遵循源头治理、闭环管理的原则。源头治理方面,主要是指在新建业务或 IT 系统过程中,明确数据标准或质量规则,采用“一数一源”原则,与数据生产方和数据使用方确认,常见于对于数据时效性要求不高或核心业务增量数据等场景。闭环管理方面,主要是指形成覆盖数据质量需求、问题发现、问题检查、问题整改的良性闭环,对数据采集、流转、加工、使用全流程进行质量校验管控(如图 6 所示),持续根据业务部门数据质量需求优化质量管理方案、调整质量规则库,构建数据质量和管理过程的度量指标体系,不断改进数据质量管理策略。

织信Informat低代码开发平台的客户(某汽车零部件上市企业)以“管理可度量”、“问题可闭环” 以及“质量标签化”三大原则建立质量管理体系。在管理度量方面,着重“以单为锚、量化反映”,建设以质量问题单为中心的线上化流程,支持解决时效等关键信息的量化统计,实现审批流转耗时降低 50%;在闭环管理方面,依托数据质量管理系统搭建企业级质量规则库,结合各类数据应用场景的质量需求,已编制质量规则 20000 余条,集中覆盖公司板块、财管领域、EAST5.0 等多个领域,同时针对数据湖历史数据和主题模型层开展常态化监控;在质量标签化方面,推进质量问题单与数据资产目录的联动,将质检信息同步至数据资产界面,方便业务人员基于质量状态标签前置判断数据资产可用性,加快数据资产应用价值释放。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/19794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python操作Git

大家好,当谈及版本控制系统时,Git是最为广泛使用的一种,而Python作为一门多用途的编程语言,在处理Git仓库时也展现了其强大的能力。通过Python,我们可以轻松地与Git仓库进行交互,执行各种操作,从…

Java 中的字符串转义

Java 中的字符串转义 在 Java 中,字符串是用双引号括起来的字符序列。反斜杠 (\) 是转义字符,用于表示一些特殊字符,如换行符 (\n)、制表符 (\t) 等。如果你需要在字符串中表示一个实际的反斜杠字符,则必须使用双反斜杠 (\\)。 …

2024全新交友盲盒+付费进群二合一源码 包含全套源码+视频教程

2024全新交友盲盒付费进群二合一源码 包含全套源码视频教程39同校 三九同校 最高版本,纸条,交友,源码,搭建包上线运营,防封红,独家唯一版本盲盒交友脱单系统源码,带教程,免授权这套源…

Golang | Leetcode Golang题解之第119题杨辉三角II

题目&#xff1a; 题解&#xff1a; func getRow(rowIndex int) []int {row : make([]int, rowIndex1)row[0] 1for i : 1; i < rowIndex; i {row[i] row[i-1] * (rowIndex - i 1) / i}return row }

分布式任务队列系统 celery 原理及入门

基本 Celery 是一个简单、灵活且可靠的分布式任务队列系统&#xff0c;用于在后台执行异步任务处理大量消息。支持任务调度、任务分发和结果存储&#xff0c;并且可以与消息代理&#xff08;如 RabbitMQ、Redis 等&#xff09;一起工作&#xff0c;以实现任务的队列管理和执行…

[Linux系统编程]文件IO

一.系统调用 什么是系统调用? 只有系统调用(系统函数)才能进入内核空间&#xff0c;库函数也是调用系统函数&#xff0c;才得以访问底层。 系统调用由操作系统实现并提供给外部应用程序的编程接口。是应用程序同系统之间数据交互的桥梁。 换句话说&#xff0c;系统调用就是操…

解决迁移到AWS的关键挑战

迁移到AWS云平台是许多出海企业的重要战略之一&#xff0c;但迁移过程中常常面临各种挑战。作为AWS官方合作伙伴&#xff0c;九河云深知客户在迁移过程中所面临的困难&#xff0c;并通过提供全面的支持和解决方案&#xff0c;帮助客户克服各种挑战&#xff0c;实现顺利迁移到AW…

graph Conv介绍

2. Graph Conv 的作用 The multiplication of the adjacency matrix A \textbf{A} A with the feature matrix X \textbf{X} X in the GraphConv layer is a crucial operation in Graph Convolutional Networks (GCNs). This operation performs a localized, weighted agg…

node依赖安装的bug汇总

1.npm仓库 首先要获取npm仓库的地址&#xff1a; registryhttp://11.11.111.1:1111/abcdefg/adsfadsf 类似这种的地址 然后设置npm仓库&#xff1a; npm config set registryhttp://11.11.111.1:1111/abcdefg/adsfadsf (地址要带等号) 接着安装依赖&#xff1a; npm i…

Golang中的 defer 关键字和Python中的上下文管理with关键字

defer&#xff0c;中文意思是&#xff1a;推迟 常用用于关闭文件操作&#xff0c;简而言之&#xff0c;就是try/finally的一种替代方案 使用示例 package mainimport "fmt"func main() {defer fmt.Println("执行延迟的函数")fmt.Println("执行外层…

【计算Nei遗传距离】

报错 Warning message: In adegenet::df2genind(t(x), sep sep, ...) : Markers with no scored alleles have been removed 原因&#xff1a; 直接用plink转换为VCF&#xff0c;丢失了等位基因分型&#xff08;REF ALT&#xff09; &#xff08;plink编码的规则&…

Centos7对比Ubuntu一些常用操作差异点

Centos7对比Ubuntu一些常用操作差异点 CentOS 7将于2024年6月30日停止维护&#xff0c;CentOS8已经转为Rhel的上游项目。同时Centos7的软件仓库中&#xff0c;部分软件版本较老。后续使用过程中可以考虑切换到Ubuntu。 下面总结了一些两个系统的常见差异点&#xff0c;包括软…

优选算法一:双指针算法与练习(移动0)

目录 双指针算法讲解 移动零 双指针算法讲解 常见的双指针有两种形式&#xff0c;一种是对撞指针&#xff0c;一种是快慢指针。 对撞指针&#xff1a;一般用于顺序结构中&#xff0c;也称左右指针。 对撞指针从两端向中间移动。一个指针从最左端开始&#xff0c;另一个从最…

【Linux】进程(2):进程状态

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家了解Linux进程&#xff08;1&#xff09;&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 &#xff08;A&#xff09;R/S/D/T/t状态1. R&#xff1a;程序运…

在Spring Boot中集成H2数据库:完整指南

引言 Spring Boot是一个简化企业级Java应用程序开发的强大框架。H2数据库是一个轻量级的、开源的SQL数据库&#xff0c;非常适合用于开发和测试。本文将指导您如何在Spring Boot应用程序中集成H2数据库&#xff0c;并探索一些高级配置选项。 依赖关系 首先&#xff0c;我们需…

windows打开工程文件是顺序读写吗

在 Windows 操作系统中&#xff0c;打开和读写工程文件的过程可以是顺序读写&#xff0c;也可以是随机读写&#xff0c;具体取决于使用的软件和文件的性质。以下是一些详细解释&#xff1a; 顺序读写 顺序读写&#xff08;sequential access&#xff09;是指按文件中数据的顺…

C/C++覆盖率收集

linux下C/C++代码覆盖度检查工具:BullseyeCoverage 主要作用: a.识别在测试过程中没有完全执行的代码; b.获取测试完整性相关的一些度量,来帮助判断是否已经充分测试。 BullseyeCoverage 使用步骤一般是: 1)安装BullseyeCoverage

ThreadLocal详解,与 HashMap 对比

ThreadLocal原理&#xff0c;使用注意事项&#xff0c;解决哈希冲突方式->和HashMap对比 ThreadLocal 原理&#xff1a; ThreadLocal 是 Java 中的一个线程级别的变量&#xff0c;它允许您在不同线程之间存储和访问相同变量的不同副本&#xff0c;每个线程都拥有自己的副本&…

单片机的自动化编程语言:深度探索与未来展望

单片机的自动化编程语言&#xff1a;深度探索与未来展望 单片机作为现代电子设备的核心控制单元&#xff0c;其自动化编程语言的发展与应用&#xff0c;对提升设备性能、简化编程流程具有重大意义。本文将从四个方面、五个方面、六个方面和七个方面&#xff0c;对单片机的自动…

Day-04python模块

一、模块 1-1 Python 自带模块 Json模块 处理json数据 {"key":"value"} json不是字典 本质是一个有引号的字符串数据 json注意点 {} 中的数据是字符串引号必须是双引号 使用json模块可以实现将json转为字典&#xff0c;使用字典的方法操作数据 。 或者将…