赠书 | 华为数据底座的整体架构与建设策略

作者 | 华为公司数据管理
责编 | 晋兆雨
头图 | 付费下载于视觉中国

*文末有赠书

在从信息化向数字化转型的过程中,企业积累了海量的数据,并且还在爆发式地增长。数据很多,但真正能产生价值的数据却很少。数据普遍存在分散、不拉通的问题,缺乏统一的定义和架构,找到想要的、能用的数据越来越难。

本文将讲述华为数据底座的总体架构和建设策略。

非数字原生企业数字化转型的数据底座建设框架

华为通过建设数据底座,将公司内外部的数据汇聚在一起,对数据进行重新组织和联接,让数据有清晰的定义和统一的结构,并在尊重数据安全与隐私的前提下,让数据更易获取,最终打破数据孤岛和垄断。通过数据底座,主要可以实现如下目标。

  1. 统一管理结构化、非结构化数据。将数据视为资产, 能够追溯数据的产生者、业务源头以及数据的需求方和消费者等。

  2. 打通数据供应通道,为数据消费提供丰富的数据原材料、半成品以及成品,满足公司自助分析、数字化运营等不同场景的数据消费需求。

  3. 确保公司数据完整、一致、共享。监控数据全链路下的各个环节的数据情况,从底层数据存储的角度,诊断数据冗余、重复以及“僵尸”问题,降低数据维护和使用成本。

  4. 保障数据安全可控。基于数据安全管理策略,利用数据权限控制,通过数据服务封装等技术手段,实现对涉密数据和隐私数据的合法、合规地消费。


华为数据底座的总体架构

华为数据底座由数据湖、数据主题联接两层组成,将公司内外部的数据汇聚到一起,并对数据进行重新的组织和联接,为业务可视化、分析、决策等提供数据服务,如图1 所示。

图1 华为数据底座总体架构

数据湖是逻辑上各种原始数据的集合,除了“原始”这一特征外,还具有“海量”和“多样”(包含结构化、非结构化数据)的特征。数据湖保留数据的原格式,原则上不对数据进行清洗、加工,但对于数据资产多源异构的场景需要整合处理,并进行数据资产注册。

数据入湖必须要遵循 6 项标准,共同满足数据联接和用户数据消费需求。具体细节本文将不展开,感兴趣的读者可以阅读华为官方出版的《华为数据之道》。

数据主题联接是对数据湖的数据按业务流 / 事件、对象 / 主体进行联接和规则计算等处理,形成面向数据消费的主题数据,具有多角度、多层次、多粒度等特征,支撑业务分析、决策与执行。基于不同的数据消费诉求,主要有多维模型、图模型、指标、标签、算法模型 5 种数据联接方式。

 

华为数据底座的建设策略

数据底座建设不能一蹴而就,要从业务出发,因势利导,持续进行。具体来说,华为数据底座采取“统筹推动、以用促建、急用先行”的建设策略,根据公司数字化运营的需要,由公司数据管理部统一规划,各领域分别建设,以满足本领域和跨领域的数据需求。其中,数据 Owner 是各领域数据底座建设的第一责任人,各领域数据部负责执行。数据底座资产建设遵从下面四项原则。

1)数据安全原则

数据底座数据资产应遵循用户权限、数据密级、隐私级别等管理要求,以确保数据在存储、传输、消费等全过程中的数据安全。技术手段包括但不限于授权管理、权限控制、数据加密、数据脱敏。

2)需求、规划双轮驱动原则

数据底座数据资产基于业务规划和需求触发双驱动的原则进行建设,对核心数据资产优先建设。

3)数据供应多场景原则

数据底座资产供应需根据业务需求提供离线 / 实时、物理 /虚拟等不同的数据供应通道,满足不同的数据消费场景。

4)信息架构遵从原则

数据底座数据资产应遵从公司的信息架构,必须经 IA-SAG(信息架构专家组)发布并完成注册。

本文只是提纲挈领地讲述了华为数据底座建设的架构与策略,具体实施时,数据湖的建设以及数据主题的联接是重中之重,关于这两点内容,本文不展开讲,如果您对其中的细节感兴趣,推荐您详细阅读华为官方出版的《华为数据之道》。

#欢迎留言在评论区和我们讨论#

看完本文,对于数据底座建设你有什么想说的?

欢迎在评论区留言

我们将在 11 月 25 日精选出 3 条优质留言

赠送华为官方出品《华为数据之道》纸质书籍一本哦

更多阅读推荐

  • 大神们都是如何在时间序列中进行特征提取的?看完就懂了!

  • 如何破解“中国开源拿来主义”?包云岗的几点分析

  • 打钱!我的数据库被黑客勒索了!

  • 赠书 | 图像分类问题建模方案探索实践

  • Value DeFi遭黑客攻击始末,闪电贷这次又带走了700万美元

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/516044.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Serverless 服务选型

综述 近两年来,Serverless 概念在开发者中交流的越来越多,实践、服务、产品层出不穷。 Serverless 的主题分享呈现爆发趋势,如在云原生领域颇具影响力的 KubeCon&CloudNativeCon 会议中,关于 Serverless 的主题,20…

移动端uniapp 语言国际化vue-i18n

https://gitee.com/gblfy/uniapp-i18n

一文读懂阿里云通信的产品体系、技术架构与智能化应用场景实践

云通信作为通信基础设施,具有很强的行业普适性和刚需性,其业务场景涵盖了用户整个生命周期。然而,在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕…

VBA 利用API 测试计算机网络连通性

目录 1. 模块常量声明2. 自定义函数3. 函数调用示例一. 测试指定 URL 的连通性示例二. 测试计算机网络连通性1. 模块常量声明 声明 NetworkAlive API 函数常量。 Private Const NETWORK_ALIVE_LAN = &H1 Private Const NETWORK_ALIVE_WAN = &H2声明

10个工程师,9个不合格!!

如果你想问最近这些年什么编程语言最值得学习,我会毫不犹豫的告诉你是Python。无论是刚入门的程序员,还是年薪BATJ的技术大牛,都无可否认现在Python对于一个程序员职业发展的重要性。所以不仅是开发小白,甚至很多开发老手&#xf…

Dragonfly成为CNCF孵化项目,我们与基金会首位华人TOC聊了聊

本文转载自开源中国。 推荐阅读:《重磅 | Dragonfly 晋升成为 CNCF 孵化项目》 4 月 10 日,由云原生计算基金会(CNCF)技术监督委员会投票决议,来自中国的开源项目 Dragonfly 正式晋升为 CNCF 孵化级别的托管项目&…

uniapp中配置语言切换功能(vue-i18n的安装以及使用)

1.安装 npm install vue-i18n --save2. 新建lang文件以及en.json和zh.json文件,其他语言参考创建即可 3. 在main.js中配置    4. 在页面中使用

BAT新风向标:程序员有福利了!

人工智能已成为新时代的风向标,如果你是对人工智能感兴趣的互联网工作者、大学生、研究生并期望在 AI 方向发展,建议你一定要深入学习一下人工智能。因为,未来将是人工智能的时代!为什么会有这个判断呢?第一&#xff0…

VBA SQL查询-记录集转数组

目录 1 建立连接和查询2. Recordset 对象(记录集)转数组1 建立连接和查询 Sub 查询()Dim Cnn As Object, Rst As Object, i&, j&,

开源应用诊断利器 Arthas GitHub Star 突破两万

一、Arthas Star突破2万啦 https://github.com/alibaba/arthas随着微服务的流行,应用更加轻量和开发效率不断提升,但是带来的困境是线上问题排查越来越复杂困难。传统的Java排查问题,需要重启应用再进行调试,但是重启应用之后现场…

uniapp使用vue-i18n实现语言国际化

1.需要去vue-i18n官网下载js文件 https://unpkg.com/vue-i18n8.21.0/dist/vue-i18n.js 2.将js文件下载后放置在创建的lang文件夹中 3.紧接着创建需要翻译的配置文件如zh.js(中文)、en.js(英文)、tcc.js(繁体&#xf…

亿级大表分库分表实战总结(万字干货,实战复盘)

来源 | 阿丸笔记责编 | 晋兆雨头图 | 付费下载于视觉中国分库分表的文章网上非常多,但是大多内容比较零散,以讲解知识点为主,没有完整地说明一个大表的切分、新架构设计、上线的完整过程。因此,我结合去年做的一个大型分库分表项目…

VBA各种查询方法介绍和应用举例

目录前言1 Range对象的Find方法2. Range 对象的 Filter 方法2.1 AutoFilte自动筛选2.2 AdvancedFilter 高级筛选3.Instr 函数4.Like 运算符5.SQL 查询语句6. ADO Recordset 对象 Find 方法和 Filter 属性6.1 Find 方法6.2 Filter 属性7. 正则表达式8.字典和哈希表8.1 字典8.2 哈…

官宣 | 首届云原生编程挑战赛报名通道正式开启

“云原生编程挑战赛”是“中间件性能挑战赛”的全新升级!自 2015 年开始,大赛已经成功举办了五届,共吸引超过 12000 支队伍,15000 名顶尖选手参加,覆盖 10 余个国家和地区。 往届大赛毕业生是这样说的:视频…

移动端 uniapp 国际化一站式解决方案

菜单、表单、tabbar顶部文字均实现国际化,语言种类一次设置,全局生效,支持几十种,也支持私人定制。 文章目录一、效果图开源项目1. 默认中文2. 切换English3. 切换韩语4. 中文繁体5. 开源项目一、效果图开源项目 1. 默认中文 2. 切换English…

阿里云推出全新内存增强型实例re6,性能提升30%

5月7日,国内最大云计算厂商阿里云宣布推出全新一代内存增强型实例,提供1:14.8超大内存比内存容量,满足内存型数据库如SAP HANA、Redis等应用,充分释放技术红利,帮助线下企业快速上云,完成数字化…

浪潮商用机器亮相金博会 夯实新常态下金融科技发展基石

2020年11月2日~4日,第十四届深圳国际金融博览会(简称:金博会)在深圳会展中心1展馆盛大进行。金博会是国内金融业界最大规模的会展活动之一,浪潮商用机器携全新Power产品亮相金博会,与近两百家金融机构、金融…

附加路径中的所有文件并通过电子邮件发送

从指定路径发送所有文件,并删除此路径下的文件。 示例代码如下: Option Explicit Sub Attach_all_files()Dim mess_body As StringDim OutApp As ObjectDim OutMail As ObjectDim MyPath As String

可编程CDN – EdgeScript应用场景、语言速览和实操演示

5月8日下午15:00,CDN云课堂的第二期,阿里云CDN团队技术专家拓山为大家带来了《可编程CDN – EdgeScript实践》主题技术分享。本次分享通过对阿里云CDN成长到当前体量的挑战以及对应的解法,阐述EdgeScript为何而生,同时…

Serverless 工作流给人工智能带来了哪些变化?

4月,阿里云 Serverless 工作流正式商业化,这是一款用于协调多个分布式任务执行的全托管 Serverless 云服务。产品致力于简化开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,让用户聚焦业务逻辑开发。 精准打造云上自动…