阿里云数据治理系列(一):治理项目启动前的必答三问

简介:近一年以来,越来越多的企业在考虑或正在启动数据治理的项目。作为在该领域从业多年的人士,也常会被咨询:数据治理不是很多年前就有的概念么?为什么忽然很多企业都在提及?是不是新瓶装旧酒?和数据中台之间是什么关系?本文中,小编将通过三个核心问题,帮助大家清晰上述疑问,更重要的是,这三个问题,也是一家企业启动数据治理项目前必须要想清楚的三个问题。

一问:目的,为什么要治理

这是一个数据治理项目启动前必须要拉齐认知的问题。并不是为了治理而治理,治理本身并无价值。

我们认为:治理的价值在于构建企业内一份质量可靠、安全可控、服务便捷的好数据,让数据价值得以释放。也就是说:数据治理的终极目的是为了释放数据价值,奠定数据价值释放的基础。

随着各行各业数字化转型进程的加速,业务数字化的基础日渐扎实,数据驱动业务或数据化运营,不再是传统头部企业及大型互联网公司的专利,越来越多的企业也在拥抱数据、消费数据。因此,数据治理的诉求呈现出日渐强烈的趋势。

在数据资产治理的强烈诉求之下,启动项目前,自上而下,企业必须达成一个统一的认知:数据治理的终极目的是为了驱动数据消费、释放数据价值。

二问:目标,治理实现什么

这是数据治理项目启动前,需要细化和明确答案的一个问题。数据治理并非一蹴而就,我们需要明确长期目标是什么,但同时也要明确短期项目范围和目标又是什么。

从数据治理的目的不难理解,制定数据治理项目的阶段性目标可以从终极目的的数据价值释放出发,也可以从数据体系的完善度出发。一般来说,后者是常见的直接目标。

当然,在数据领域摸爬多年的领域人士都知道,数据治理并非一蹴而就。一般围绕四大关键领域“成本、质量、安全、服务”开展工作,进行目标设定。目标设定的可以借鉴以下思路。

  1. 生产经济即成本方面,以控制甚至节约成本为目标,实际运作则需要拆解到业务线或者不同领域范围的成本控制,比如销售业务线、市场投放线等,再比如基础数据线、流量日志数据线等;
  2. 质量可靠即质量方面,以减少数据质量问题、收窄数据质量风险敞口为目标,实际运作则需要拆解到应用场景或不同数据等级,如商品数据、销售数据等,再如优先保障高管数据看板、驱动业务运行涉及的数据质量等;
  3. 安全可控即安全方面,以满足合规要求、防止数据泄漏为目标,实际运作则需要拆解到不同的数据类型或流程环节,如隐私数据、监管报送数据等,往往安全体系能力建设是其中重要的工作;
  4. 服务便捷即服务方面,以盘点供给丰富的数据、驱动数据消费为目标,实际运作则需要拆解到不同的业务线、数据类型及服务场景,如营销推广、业务决策等。

从具体的工作开展来看,成本是数据到一定体量再重点关注的领域,质量是其中最重点也是最具挑战的领域,安全是基础,服务则是需要高度重视并投入打造数据价值的关键领域。

因此,在项目启动之前,必须明确本次项目范围重点的是哪个或哪几个领域(如:成本、质量)、治理范围是什么(如:客户数据、监管报送场景、流量日志线数据)、核心目标是什么(如:3个月项目上线、XXX成本的节约、6个月P0级数据质量故障数为0、完成XXX数据的上架、数据服务体系能力建设形成XXX、XXX用户的服务)。总而言之,启动治理项目前,必须对领域、范围、核心目标进行选择和设定。

三问:方法,怎么实施治理

目的目标明确,具体的数据治理应该如何实施呢?这是保障数据治理项目成功的关键问题,涉及到人员组织及权责的设计、流程规范的设计、工具选型三方面的基础工作,同时还要围绕目标设定的领域、范围及核心目标进行工作开展。

  1. 由于数据质量出现问题引发的原因很多,可能有技术层面的数据建设开发不规范,可能有业务层面的填报输入有纰漏,可能有管理层面的组织机制不健全导致无人推进等,所以要对数据质量及管理进行摸底,确定质量的水位线及风险敞口,并制定事前事中事后全链路的数据质量治理方案。
  2. 数据价值释放是数据治理项目的终极目标,所以一方面通过对企业所有数据盘点及管理,在数据供给侧汇聚全域数据,体系化地组织数据,并丰富数据信息,另一方面强化数据运营培训及推广,建立良好的资产检索和确信体验,并和取数、分析等数据服务链接,实现数据资产在需求侧消费扩大。与此同时,体系化呈现资产能力大图及资产价值评估也是必不可少的。
  3. 数据安全方面,重点是数据识别后对数据的分类分级,同时对隐私及不同安全等级的数据采取不同的授权策略。不论从源头的数据采集、授权,还是从外部引入合作,合规性都是今天数据安全范畴内非常重要的命题,因此相关流程机制及能力建设也可以是实施中的重要组成部分。
  4. 数据成本方面,重点对数据存储及计算的浪费问题进行发现和处理,通过分析、设定治理项、启动治理,实现成本的节约。

因此,启动治理项目前,必须对基本的治理实施路径进行定义,包括组织保障、流程规范、工具提效,并对涉及的领域,如质量:进行全面评估、用全链路的视角对项目范围内的数据建设进行质量风险控制、建立数据质量故障体系提升响应能力,同时重点关注价值出口,对数据资产进行盘点和运营推广,让数据被用起来。

写在最后

作为从业多年的数据人,也一直在反思,为什么数据治理提了那么多年,以前做治理项目成功的案例并不多见。而如今再次被提起,项目成功的可能性却有了很大提升,主要原因在以下几方面:

  • 数字化转型浪潮下,对数据治理都有了更客观的认知,是长期能力建设而非运动式项目;
  • 数据中台和数据治理结合,数据的统一汇聚为数据治理提供了基础,体系规范地数据建设又让数据治理前置到事前事中,全链路式的数据治理而非点状、事后的数据治理
  • 一批真正懂数据、实践过大规模数据建设和数据运营的人员为数据治理提供服务,实战沉淀而非纸上谈兵

阿里云数据资产治理解决方案,是在数据中台基础上的延展,用中台方法论,让所有的企业拥有一份企业级好数据!

阿里云数据中台是阿里巴巴数据中台唯一商业化输出,以数据中台方法论为内核,构建起”快、准、全、统、通“的智能大数据体系。

阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入:

  • - Dataphin,智能数据建设与治理
  • - Quick BI,数据可视化分析
  • - Quick Audience,一站式消费者运营和管理
  • - Quick Tracking,全域行为洞察
  • - Quick Stock, 智能货品运营
  • - Quick Decision,风控决策数字引擎

目前正对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案等。

原文链接

本文为阿里云原创内容,未经允许不得转载。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/511720.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

揭晓远程证明架构EAA:机密容器安全部署的最后一环 | 龙蜥技术

简介:如果需要在云上 HW-TEE 环境里启动一个加密容器,如何在启动过程中获取容器的解密密钥? 文 / 周亮, 云原生机密计算 SIG 核心成员。 在云原生场景下,基于HW-TEE(如Intel SGX, Intel TDX 和 AMD SEV&am…

java哪个城市的需求量大_4大互联网热门城市Java薪资情况,看完你想去哪个城市发展呢?...

程序员作为薪资最高的行业之一,一直是很多人转行的热门首选行业。Java程序员又在所有程序员中占比最大, 因此,Java程序员的薪资就能够很好的代表行业的薪资水准。今天就为大家整理一下4大热门城市的Java薪资情况,看看你还差多少&a…

Gartner:上云步伐加速,中国公有云部署最佳实践

作者 | Gartner高级研究总监 周玲 供稿 | Gartner 在数字化转型需求的驱动下,中国的上云步伐持续加速。Gartner预测,到2024年,中国40%的IT基础设施支出将用于云服务(参见图1)。 图1:中国云基础设施和平台服…

kubernetes pv-controller 解析

简介:pv controller是 kcm 的组件之一,它负责处理集群中的pvc/pv对象,对pvc/pv 对象进行状态转换。本文将基于 kubernetes 1.23进行解析。 作者 | 牧琦 来源 | 阿里技术公众号 基于 kubernetes 1.23 一 简介 pv controller是 kcm 的组件之…

Apsara Stack 技术百科 | 标准化的云时代:一云多芯

简介:随着今年云栖大会现场平头哥的自研云芯片倚天710发布,以及众多新兴厂商的芯片发布,将有越来越多的类型芯片进入到主流市场,“多芯”的架构将在数据中心中越来越常见,阿里云混合云在安全和稳定的基础上&#xff0c…

用户态 tcpdump 如何实现抓到内核网络包的?

作者 | 张彦飞allen来源 | 开发内功修炼今天聊聊大家工作中经常用到的 tcpdump。在网络包的发送和接收过程中,绝大部分的工作都是在内核态完成的。那么问题来了,我们常用的运行在用户态的程序 tcpdump 是那如何实现抓到内核态的包的呢?有的同…

技术实践第三期|HashTag在Redis集群环境下的使用

简介:欢迎了解友盟技术干货第三期内容:Redis集群环境如何按照前缀批量删除缓存。希望能对开发者们在实际应用中有所帮助。 一、背景 数据源列表添加缓存支持,types字段可传多值,如app, mini, web等,会构建如下缓存ke…

android java加密_Android Java字符串加密

Java字符串加密学习笔记Java字节码字节码生成Java2bitcode由Java源代码生成字节码的过程如下图(图片来源于网络)JVM执行不是热代码直接走字节码解释器热代码:多次调用,多次执行的循环体,会被JIT优化成机器码字节码执行方法调用在JVM中即是字节…

数据质量漫谈

简介: 数据质量问题无处不在,本文尝试找到一种方法,能够尽可能的发现数据质量问题并解决之。 作者 | 茂才 来源 | 阿里技术公众号 一 概述 1 数据质量问题无处不在 基本上每个用数据的同学,都遇到过以下类似的问题。 表没有按…

7招,实现安全高效的流水线管理

简介:云效团队多年来为阿里巴巴内部(Aone)和云上企业用户(云效)分别提供研发运维工具,并致力于打造企业级一站式的 DevOps 平台,更多关注不同类型的企业用户在使用过程中的管理与协作场景&#…

字节跳动最新音乐检索系统ByteCover2,检索速度提高八倍

翻唱识别(CSI)是音乐信息检索(MIR)领域的一项重要任务,在歌曲搜索,音乐分发,曲库整理,智能推荐等场景下有着重要作用,被誉为下一代音乐识别技术。 近期,字节…

Serverless 场景排查问题利器 : 函数实例命令行操作

简介:实例命令行功能的推出希望能消除用户使用 Serverless 的“最后一公里”,直接将真实的函数运行环境展现给用户。 背景介绍 全托管的 Serverless 计算平台能给用户带来更少的运维代价、更强的稳定性和更快的弹性能力,在 Serverless 落地…

从运维域看 Serverless 真的就是万能银弹吗?

简介:极客时间《Serverless 入门课》作者秦粤最新文章: 再次讨论正当时的 Serverless。文章分为三个部分,分别是 复杂化for 云开发商; 简化 for 开发者,以及团队使用 Serverless 的最佳场景。 作者说 在开始本篇内容前我想与各位开发者达成几…

多任务学习模型之ESMM介绍与实现

简介:本文介绍的是阿里巴巴团队发表在 SIGIR’2018 的论文《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》。文章基于 Multi-Task Learning (MTL) 的思路,提出一种名为ESMM的CVR预估模型&#xff…

java pinyin4j 首字母_通讯录之按汉字首字母排序 --java--pinyin4J

最近开发手机端OA系统通讯录时遇到了用汉字首字母排序的问题,各种谷歌后发现了一个轮子pinyin4J,这个轮子是可以将汉字转换成字母拼音,个人觉得很好用,完美的解决了排序的问题,分享一下。一.工具介绍pinyin4j是一个支持…

助力开源生态繁荣,统信软件建设中国桌面操作系统根社区

继 React、SUSE、RedHat 宣布对俄罗斯停服后,近日 Ubuntu 开发商 Canonical 在俄乌冲突下也宣布对俄罗斯企业停止支持和专业服务。 这给我们敲醒了警钟:因为Ubuntu 事件瞄准桌面操作系统,桌面操作系统用户庞大,其安全性属于系统级…

一文详解 | 开放搜索兼容Elasticsearch做召回引擎

简介:开放搜索发布开源兼容版,支持阿里云Elasticsearch做搜索召回引擎,本文详细介绍阿里云ES用户如何通过接入开放搜索兼容版丰富行业分词库,提升查询语义理解能力,无需开发、算法投入,即可获得淘系同款搜索…

人人都是 Serverless 架构师 | 现代化 Web 应用开发实战

简介:本篇实战将介绍如何以超低成本构建动态的 Web 站点,并且实现灵活扩展,限流等效果,最后再跟大家聊一聊“现代应用”的相关概念。 相信很多同学都有过想要拥有自己的 Web 站点的想法,但是如果想要搭建动态的站点&a…

Gartner:如何在中国成功应用多云模式

作者 | Gartner研究总监 杜勇 供稿 | Gartner 当前,中国政府鼓励行业企业通过云计算技术来实施数字化转型,从而加速经济增长。许多企业机构已部署了私有云和单一供应商混合云,以实现这一目标。为了满足全球业务和本地业务需要分别部署在不同的…

java socket 线程池_程序员:java使用线程池和TCP实现简单多轮聊天系统

最近在做物联网项目,需要使用TCP和传感器进行双向交互,通过这种渠道,找到了下面的代码,写成博客主要也是为了记录一下,以后用到随时可以看。代码实现服务端package com.tcp;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.…