【华为数据之道学习笔记】4-1信息架构的四个组件

        企业在运作过程中,首先需要管理好人和物等“资源”,然后管理好各类资源之间的联系,即各类业务交易“事件”,再对各类事件的执行效果进行“整体描述和评估”,最终实现组织目标和价值。以一个通用的工业企业运营为例(如图4-1所示),企业要管理关键的“员工、组织、产品、客户、供应商”等资源。在企业价值实现的过程中,企业会与客户签订销售合同,与供应商签订采购合同,组建各种交付项目,制定供应计划,财务部门会对成本、费用、收入进行核算,记录客户的应收、供应商的应付,建立合法合规的会计记账体系。然后,通过报告体系按月度、季度、年度发布各种经营、考核报告用于企业决策。
图 信息架构示例
信息架构的目的就是定义好整个运作过程中涉及的各种人、事、 物资源,并实施有效的治理,从而确保各类数据在企业各业务单元间高效、准确地传递,上下游流程快速地执行和运作。
华为在实践中构建了一套对业务运作数据进行有效管理的信息架构方法论,用于指导企业内部各部门的信息架构建设工作,让管理者、专家和员工之间有共同语言。
华为的企业级信息架构(Information Architecture)是指以结构化的方式描述在业务运作和管理决策中所需要的各类信息及其关系的一套整体组件规范,包括数据资产目录、数据标准、企业级数据模型和数据分布四个组件,如图所示。

4.1.1 数据资产目录

数据资产目录形成完善的企业资产地图,也在一定程度上为企业数据治理、业务变革提供了指引。基于数据资产目录可以识别数据管理责任,解决数据问题争议,帮助企业更好地对业务变革进行规划设计,避免重复建设。
数据资产目录分为5层,涵盖华为公司的所有业务数据资产,如图所示。
L1为主题域分组,是描述公司数据管理的最高层级分类。业界通 常有两种数据资产分类方式:基于数据自身特征边界进行分类和基于业务管理边界进行分类。华为公司为了强化企业内业务部门的数据管理责任,更好地推进数据资产建设、数据治理和数据消费建设,采用业务管理边界划分方式,即将L1主题域分组与流程架构L1相匹配,数据资产和华为业务GPO(全球流程责任人)相匹配,有利于更好地推进各项数据工作。
L2为主题域,是互不重叠的数据分类,管辖一组密切相关的业务对象,通常同一个主题域有相同的数据Owner。
L3为业务对象,是信息架构的核心层,用于定义业务领域重要的人、事、物,架构建设和治理主要围绕业务对象开展。同时,在企业架构(EA)的范畴内,信息架构(IA)也主要通过业务对象实现与业务架构(BA)、应用架构(AA)、技术架构(TA)的架构集成。
L4是逻辑数据实体,是指描述一个业务对象在某方面特征的一组属性集合。
L5为属性,是信息架构的最小颗粒,用于客观描述业务对象在某方面的性质和特征。

4.1.2 数据标准

数据标准是在企业范围内确保数据一致的关键,因此有必要多花一些篇幅来详细介绍。
数据标准定义公司层面需共同遵守的属性层数据含义和业务规 则,是公司层面对某个数据的共同理解,这些理解一旦确定下来,就 应作为企业层面的标准在企业内被共同遵守。
例如,合同是公司最重要的数据之一,因此有必要对合同编号制订统一的数据标准,包括编号的位数、具体的编码规则等,一旦合同编号数据标准制订下来,那么整个公司所有业务部门都必须共同遵守,除了数据Owner以外,任何部门都不允许自定义合同编号。如果随着业务发展需要对合同编号进行变更,那么相关需求也应该统一由数据Owner受理,统一制订变更方案。一旦不同业务环节各自定义,那么数据就无法在上下游业务之间快速流转,往往需要额外的人工转换和翻译,这会极大地增加不必要的人工成本、延长业务执行周期、降低业务效率。
华为公司对业务数据标准有严格的限定,每个数据标准应该覆盖以下三方面。
  • 业务视角要求: 用于统一业务侧语言和理解,明确定义每个属性所遵从的业务定义和用途、业务规则、同义词,并对名称进行统一定义,避免重复。
  • 技术视角要求: 对IT实施形成必要的指引和约束,包括数据类型、长度,如果存在多个允许值,则应对每个允许值进行明确的限定。
  • 管理视角要求: 明确各业务部门在贯彻数据标准管理方面应承担的责任,包括业务规则责任主体、数据维护责任主体、数据监控责任主体,因为很多情况下这些责任并不是由同一个业务部门来负责,所以必须在标准制订时就约定清楚。例如,“客户合同”中某些条款的规则制订者可能是财经部门,负责与客户达成约定并在系统中录入的可能是销售业务部门,而对整个客户合同数据质量进行跟踪、监控的可能是数据专业部门。
但是,企业的每个业务数据标准的定义和维护都需要一定的成本,很多大型企业的IT系统中可能存在上百万、上千万属性,即使去掉冗余、重复的部分,数据量也相当大,因此其实并不需要对IT系统内所有字段都进行定义。为了实现在统一定义的必要性和成本之间取得平衡,华为公司制订了数据标准规范,明确了在不同情况下哪些数据应该制订统一的标准。
描述业务对象的特有属性应作为本业务对象的属性进行定义,并明确业务数据标准。引用其他业务对象的属性,如果属性值可随本业务对象确定和更改,就应作为本业务对象的属性进行定义,并明确业务数据标准。
引用其他业务对象的属性,如果属性值取自引用业务对象相应时点的数值且后续不变更,就应纳入本业务对象的数据标准范围,并明确相应取值规则。
引用其他业务对象的属性,如果属性值与引用业务对象同步,就不需要重新定义数据标准。
引用其他业务对象/逻辑数据实体的身份标识属性,应作为本业务对象的属性进行定义,但只能在业务数据标准中定义出处及引用规则,而不允许修改或重新定义该属性本身的业务含义及业务规则。

4.1.3 数据模型

数据模型是从数据视角对现实世界特征的模拟和抽象,根据业务 需求抽取信息的主要特征,反映业务信息(对象)之间的关联关系。
数据模型不仅能比较真实地模拟业务(场景),同时也是对重要业务模式和规则的固化。例如在某个物流业务数据模型中,“运输申付单”与“运输委托”建立一对一关系,而“运输委托”与“派送任务”建立多对多关系,那么这意味着业务部门可以根据发货效率和成本的考虑将“运输委托”拆成分多个“派送任务”,但“派送任务”必须在将一个运输委托完整执行后,才能申请向供应商付款。

4.1.4 数据分布

如果说前三个组件主要是从静态角度对数据、数据关系进行定义,那么数据分布则定义了数据产生的源头及在各流程和IT系统间的流动情况。 数据分布组件的核心是数据源,指业务上首次正式发布某 项数据的应用系统,并经过数据管理专业组织认证,作为企业范围内 唯一数据源头被周边系统调用。华为公司规定所有业务数据必须认证数据源,并在公司范围内统一发布。为了更好地识别、管理数据在流程和IT系统间的流动,可以通过信息链、数据流来进行描述,体现某一 数 据 在 流 程 或 应 用 系 统 中 是 如 何 被 创 建 ( Create ) 、 读 取(Read)、更新(Update)、删除(Delete)的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/217464.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[NAND Flash 3.2] 3D NAND 工艺与发展前沿

依公知及经验整理,原创保护,禁止转载。 专栏 《深入理解NAND Flash》 全文 6200 字,​2023.12.12 更新 1. 导论 1.1 何为 3D NAND? 3D NAND, 也叫做 Sumsung V-NAND, 是一种高密度闪存。 以前,把NAND闪存颗粒,直接…

Java键值对Pair的使用方式和操作流程

Java键值对Pair的使用方式和操作流程 什么是键值对 键值对是一种常见的数据结构,它由一个唯一的键(key)和与之关联的值(value)组成。键和值之间存在一种映射关系,通过键可以查找或访问对应的值。 在键值对…

nodejs微信小程序+python+PHP健身服务应用APP-计算机毕业设计推荐 android

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…

『App自动化测试之Appium基础篇』| Desired Capabilities详解与使用

App自动化测试之Appium基础篇』| Desired Capabilities详解与使用 1 关于appium driver2 安装appium driver3 安装Appium Python Client4 安装测试对象5 获取测试对象信息5.1 使用dumpsys5.2 使用AndroidKiller5.3 使用aapt 6 Capabilities详解6.1 Capabilities介绍6.2 automat…

复旦微在线调试DDR

模式介绍 Jtag模式 Jtag模式用于在线调试,烧写,红色箭头所示拨码开关,拨上为jtag模式 Qspi模式 Qspi模式用于独立运行,红色箭头所示拨码开关,拨下为Qspi模式 级联模式 当PL侧代码不用修改时可以用级联模式&#xff0c…

ROS2 LifecycleNode讲解及实例

LifecycleNode讲解及实例 文章目录 前言LifecycleNode是什么背景生命周期状态定义UnconfiguredInactiveActiveFinalized 转换逻辑图示标准接口 代码实现&测试代码测试 总结 前言 本文用来记录什么是LifecycleNode,做背景介绍及基本原理的介绍及分析如何使用。1…

【大数据】Doris 架构

Doris 架构 Doris 的架构很简洁,只设 FE(Frontend)、BE(Backend)两种角色、两个进程,不依赖于外部组件,方便部署和运维,FE、BE 都可线性扩展。 ✅ Frontend(FE&#xff0…

十六 动手学深度学习v2计算机视觉 ——样式迁移

文章目录 基于CNN的样式迁移 基于CNN的样式迁移 我们通过前向传播(实线箭头方向)计算风格迁移的损失函数,并通过反向传播(虚线箭头方向)迭代模型参数,即不断更新合成图像。 风格迁移常用的损失函数由3部分组…

Linux - 进程间通信(中)- 管道的应用场景

前言 在上篇博客当中,对Linux 当中的进程通信,做了详细阐述,主要是针对父子进程的通信来阐述的同时,也进行了模拟实现。 对于管道也有了初步了解,但是这仅仅是 进程间通信的一部分,Linux 当中关于进程间通…

golang 操作Jenkins

1.創建Agent/Node func CreateAgent(username string, password string, nodeName string, nodeDescription string, numExecutors string, remoteFS string, labelString string, host string) {var obj stringobj "{name:" nodeName ",nodeDescription:&q…

YOLOv4 学习笔记

文章目录 前言一、YOLOv4贡献和改进二、YOLOv4核心概念三、YOLOv4网络架构四、YOLOv4数据增强五、YOLOv4的损失函数总结 前言 在近年来的目标检测领域,YOLOv4的出现标志着一个重要的技术突破。YOLOv4不仅继承了YOLO系列快速、高效的特点,还引入了一系列…

【启扬方案】启扬储能管理平板助力储能电站实现智能且高效化运行

在储能领域,储能电站扮演着重要角色,储能电站技术的应用贯穿于电力系统发电、输电、配电、用电的各个环节。实现电力系统削峰填谷、可再生能源发电波动平滑与跟踪计划处理、高效系统调频,增加供电的可靠性。 但随着储能电⼒系统建设发展得越来…

Java网络编程,使用UDP实现TCP(三), 基本实现四次挥手

简介 四次挥手示意图 在四次挥手过程中,第一次挥手中的Seq为本次挥手的ISN, ACK为 上一次挥手的 Seq1,即最后一次数据传输的Seq1。挥手信息由客户端首先发起。 实现步骤: 下面是TCP四次挥手的步骤: 第一次挥手&…

记录一下如何使用python生成二维码 并简单练习命令行参数供初学者参考

主代码main.py 后面是演示效果图: import argparse import sysimport qrcode import os qr qrcode.QRCode(version1,error_correctionqrcode.constants.ERROR_CORRECT_L,box_size10,border4, ) fileList[] fileName[]parserargparse.ArgumentParser(description生…

Ubuntu20.04降低linux版本到5.4.0-26-generic

前言 试用ubuntu20.04安装昇腾的驱动和cann的时,出现如下问题: (base) rootubuntu:/home/work# ./Ascend-hdk-910-npu-driver_23.0.rc3_linux-aarch64.run --full Verifying archive integrity... 100% SHA256 checksums are OK. All good. Uncompr…

基于Python+WaveNet+MFCC+Tensorflow智能方言分类—深度学习算法应用(含全部工程源码)(三)

目录 前言引言总体设计系统整体结构图系统流程图 运行环境模块实现1. 数据预处理2. 模型构建1)定义模型结构2)优化损失函数 3. 模型训练及保存1)模型训练2)模型保存3)映射保存 相关其它博客工程源代码下载其它资料下载…

“百里挑一”AI原生应用亮相,百度智能云千帆AI加速器首个Demo Day来了!

作者简介: 辭七七,目前大二,正在学习C/C,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: 七七的闲谈 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖&#x1f…

亚马逊云科技:向量数据存储在生成式人工智能应用程序中的作用

生成式人工智能深受大众喜爱,并且由于具备回答问题、写故事、创作艺术品甚至生成代码的功能,推动了行业的转变,那么如何才能在自己的企业中充分地利用生成式人工智能等应运而生问题。许多客户已经积累了大量特定领域的数据(财务记…

LangChain学习二:提示-实战(下半部分)

文章目录 上一节内容:LangChain学习二:提示-实战(上半部分)学习目标:提示词中的示例选择器和输出解释器学习内容一:示例选择器1.1 LangChain自定义示例选择器1.2 实现自定义示例选择器1.2.1实战&#xff1a…

静态路由的原理和配置

一.路由器的工作原理 首先我们知道路由器是工作在网络层的,那就是三层设备。网络层的功能主要为:不同网段之间通信、最佳路径选择也就是逻辑地址(ip地址)寻址、转发数据。 1.路由器是什么 路由器是能将数据包转发到正确的目的地…