数据治理项目——深铁集团数据治理规划

目录

一、前言

二、数据治理内容与主要措施

2.1 实施背景

2.2 主要举措

2.2.1 制定数据战略目标

2.2.2 绘制数据治理蓝图

2.2.3 绘制数据治理制度

2.2.4 梳理数据资产目录

三、 应用效果

3.1 数据资产可视化管理

3.2 数据标准治理

3.3 集团大数据平台优化建设


一、前言

   深铁集团成立于1998年7月31日,是深圳市国资委直管的国有独资大型企业,承担着深圳90%以上的轨道交通建设和运营任务。为落实深圳市地铁集团有限公司(下文简称“深铁集团”或“集团”)数字化转型战略,摸清数据资产,统一数据标准,建立数据管控体系,形成数据管理的“深铁法典”,探索出一套具有深铁集团特色的数据标准体系,2021年,深铁集团启动数据治理专项(下文简称“项目”)。项目明确了深铁集团数据治理目标及愿景,绘制了1套覆盖13个核心业务领域的数据治理蓝图,编制了14个数据管理办法、7个数据管理规范以及6个数据设计报告,并盘点梳理出一份接近2万字段的数据资产目录,为后续持续推进深铁集团数据治理工作奠定坚实基础。

二、数据治理内容与主要措施

2.1 实施背景

  随着深铁集团业务的不断发展,信息系统对业务的涵盖不断扩大,应用逐步深入,企业数据规模快速增长,各业务板块积累了丰富的数据资源并打下部分数据管理基础。但是各类业务统计口径不统一,数据质量不高,数据孤岛严重等问题也逐步凸显,难以实现基于数据支撑的业务决策以及运营优化。

   为满足深铁集团经营管理精细化的需求、支持业务数据的分析及应用、促进企业数字化转型发展,亟需构建集团统一数据治理体系,建立相应的管理组织、制度、流程与保障体系,明确数据管控范围,拉通整合数据,以纲领化的要求指导、监督与管理各IT项目中涉及数据领域工作的建设与运维,实现对全集团数据资产管理的指导、监督和管理,确保数据规范、及时、准确和安全,为全面盘活企业数据资产奠定基础。

2.2 主要举措

  项目围绕数据治理工作方法论,建设内容包括:(1)基于现状梳理及对标分析,厘清数据治理战略目标;(2)结合行业经验及深铁集团实际需求,绘制数据治理整体框架及蓝图;(3)通过发布制度流程及技术规范为数据治理工作建章立制;(4)深度盘点各业务领域数据资产,编制跨业务,全链条的数据资产目录。

                              图1:数据治理项目工作方法论

2.2.1 制定数据战略目标

   项目通过问卷调研、现场访谈了解深铁集团业务、数据和数据治理的实际情况以及当前存在的数据问题,根据DCMM数据治理方法论,从内容建设,技术支撑与保障机制层面收集与发现当前深铁集团数据治理领域的现状和主要问题。同时参考同业实践情况,对深铁集团各数据治理领域的成熟度进行评估。

    项目分析发现,深铁集团数据治理问题主要集中在数据问题体现在数据壁垒多,数据共享和追溯困难,主数据管理薄弱,数据质量不高,数据应用处于起步阶段,综合数据治理水平接近于受管理级。虽然具备一定基础,但与行业领先者存在着一定差距,未来具备较大的提升空间,还需进一步提升和完善。

    为应对集团数据治理及共享应用诉求,解决当前面临的数据质量等问题,项目明确了“看的清”、“管的住”、“用的好”的数据治理目标。(1)对深铁数据资产进行盘点,识别核心资产,建立企业级数据资产目录,实现企业级数据能够“看得清”;(2)建立数据治理的组织,制度, 流程和评价考核机制,对数据标准,数据质量,数据安全的核心领域进行管理,实现企业数据能够“管得住”;(3)建立数据应用,利用集团统建的数据平台及相关工具,进行数据分析,展示和共享,实现企业数据能够“用得好”

   基于深铁集团未来业务发展及战略要求,项目明确了集团数据治理的愿景,即应实现对业务运营、业务创新、业务转型的数据赋能。(1)依托大量历史数据的积累,梳理、整合具有分析价值的数据资产,服务于企业经营持续优化,形成数据驱动业务质效提升的新格局,“赋能运营”;(2)依托乘客数据、运行数据的积累,借助客户画像、数据挖掘等技术,深入了解乘客偏好和迫切需求,服务于深铁集团技术服务体系创新,形成数据引领的业务创新的新模式,“赋能创新”;(3)依托行业数据洞察和生态合作伙伴数据共享,分析轨交行业发展趋势,服务于深铁集团业务转型和运营模式升级,形成数据决策业态转型的新体制,“赋能转型”。

                              图2:深铁集团数据治理目标及愿景

2.2.2 绘制数据治理蓝图

  项目以深铁集团数据治理目标为导向,围绕数据全生命周期管理,从数据管理和服务能力的整体角度出发,设计了深铁集团“1+3+1”的数据治理蓝图框架,即1份目录、3套体系、1组平台

1份目录:即深铁集团数据资产盘点及数据资产目录。

  在充分理解数据资产概念的基础上明确全集团的数据资产,梳理数据对象及属性(包括业务属性、技术属性和管理属性等),形成一套可快速准确检索的企业级数据资产目录。

3套体系:

  • (1)数据管理体系,对数据管理和服务行使权力及其控制的活动集合,在数据管理和服务层面之上进行规划、监督和控制,为数据技术体系、数据应用与服务体系提供保障;
  • (2)数据技术体系,涵盖数据治理过程中的各项具体举措,是数据治理框架的核心内容,包含数据架构管理,数据标准管理,数据质量管理,主数据管理,元数据管理、数据安全管理、数据生命周期管理、数据需求管理、数据运维管理和数据应用绩效管理十个领域的内容;
  • (3)数据应用与服务体系,即涵盖数据运用与数据资产价值实现的各项活动,数据应用与服务从数据采集服务、报表查询服务、数据分析挖掘服务以及数据应用体系建设等领域进行数据应用与服务能力的提升和改进

1组平台:即数据支撑平台

   平台是数据治理工作的技术支撑,实现数据资产管理与数据治理、基于数据的业务决策支持、精细化运营分析等相关要求,主要包括数据资产管理平台、数据服务共享平台和数据智能分析平台

   基于“1+3+1”的数据治理框架指引以及集团数据应用与服务体系,全面绘制了深铁集团未来数据治理的工作蓝图。在平台建设层面,项目基于“一切业务数据化,一切数据业务化”的理念,采用“集数据、建标准、创平台、拓应用”四步法进行深铁集团数据平台设计,规划了深铁集团三大数据平台的核心能力及系统边界,为后续深铁集团数据平台建设指明方向。

                    图3:深铁集团数据治理蓝图框架

2.2.3 绘制数据治理制度

    项目编制了包括《深铁集团数据资产管理总纲》、《深铁集团数据定义管理办法》等在内的15个数据管控制度流程,以及包括《深铁集团数据安全规范》、《深铁集团数据资产规范》等在内的7个数据标准管理规范,从制度流程层面,全面搭建深铁集团数据治理框架,为各类数据治理工作建章立制,支持后续集团数据治理工作的有序开展。

2.2.4 梳理数据资产目录

    数据资产是开展数据治理的关键对象,数据资产目录是数据架构设计的重要基础,而数据资产盘点是数据资产管理的前提。通过对数据资产进行规范化、系统化的归并、整理、分类等操作,编制了深铁集团企业级数据资产目录,充分厘清集团数据情况,逐步推进数据资产应用。

   数据资产盘点主要分为业务属性盘点,即将业务过程产生的数据与业务流程进行匹配,梳理企业经营过程产生的全部数据资产,明确“数据有哪些”技术属性盘点,即明确数据在业务系统的分布情况,同时,梳理各数据的技术规则,明确“数据在哪里”管理属性盘点,即明确各盘点数据的部门及岗位归属,梳理企业数据管理现状,明确“数据谁在管”。

    项目深入调研并全面盘点了从L1(主题域分组)到L5级(字段级)的集团数据资产清单,为数据资产目录的梳理奠定基础。基于数据资产盘点成果以及深铁集团全业务能力框架梳理核心端到端流程,提取了核心流程共性数据对象,完成包含5个L1级主题域分组、34个L2级主题域、405个L3级业务对象、2503个L4级逻辑数据实体、19107个L5级数据资产项的集团首个数据资产目录编制,覆盖了深铁集团所有核心业务环节。针对各板块共性的采购,人力,财务管理等业务领域,实现了数据对象的归纳合并,规避了系统孤岛下造成的数据资产割裂等问题。同时制定了数据认责方案,明确了各类数据资产,数据责任部门,支持未来长效化、常态化数据资产盘点、维护及更新的工作要求。

                    图4:深铁集团数据资产目录结构

三、 应用效果

    深铁集团通过数据管理办法及数据管理规范为抓手,全面推进各类业务部门对数据治理蓝图的实施落地,并结合集团信息项目管理要求,落实各类系统建设及运维优化过程中的数据治理工作。此外,深铁集团着重考虑从数据资产可视化管理、数据标准治理、集团大数据平台优化建设等方面专项推进数据治理蓝图实施落地工作,逐步实现基础数据的可视、可用、可管理,为后续多场景、多维度数据应用奠定基础。

3.1 数据资产可视化管理

   承接项目盘点梳理的数据资产目录成果,深铁集团同步建设了数据资产目录管理系统,承载了集团的数据资产目录管理要求并对外提供查询服务,规范集团各单位对数据资产目录的管理维护操作,使数据资产目录的管理条理化,可视化,规范化,流程化,实现数据资产在各单位及部门间的共享,融合及使用。目前系统已正式上线投入使用,支持全集团级员工对数据资产、数据标准的浏览及管理。

                    图5:深铁集团数据资产目录管理系统

3.2 数据标准治理

    承接项目设计并正式发布的《数据标准规范》及《数据标准管理办法》,统一各单位数据语言,推进跨部门数据的互通与共享。

   目前已完成“员工”、“合同”、“会计科目”、“线路”、“站点”、“枢纽”等核心主数据的数据标准编制。其中着重统一了相关数据对象的编码规则及分类标准,同时梳理了集团通用属性字段及各业务的业务自有字段,针对相关字段明确定义了其业务属性、技术属性、管理属性,从业务口径层面(包括字段名称、业务定义等)、技术口径层面(数据类型、数据长度、数据精度等)、管理口径层面(标准责任部门等)实现了全集团的统一。此外,以相关标准为法则,各业务及系统也在逐步推进落标、贯标及历史数据质量清洗工作,持续落实集团“赋能运营”、“赋能创新”、“赋能转型”的数据治理工作愿景。

3.3 集团大数据平台优化建设

    结合项目技术平台规划方案,深铁集团持续优化大数据平台技术能力及应用范围,对内实现关键系统数据采集、数据共享,实现互联互通,提高应用系统部署效率,节约部署成本对外提供统一的数据接口服务,实现与外部市国资委和政数局等单位数据共享。同时,集团大数据平台作为资源管理抓手的一部分,将数据集成标准作为新建IT项目的竣工验收标准之一,对新建或改造信息化系统制定了统一数据集成、入湖标准,实现了数据集成的统一管理,不断提升集团整体数据质量,为跨单位、跨平台的数据共享及多元化数据分析应用奠定基础。

参考文章:

深铁集团数据治理规划项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/818311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Windows10为Git Bash添加文件传输命令rsync(详细图文配置)

文章目录 1. 安装git bash2. 下载所需要的4个包3. 下载解压包的软件4. 复制每个包下面的usr到git安装目录下4.1 所遇问题4.2 解决 5. 安装完成6. 需要注意 Windows上要使用 rsync命令上传或下载文件,需要使用git bash,git bash没有rsync,需要…

zabbix监控服务

一、监控软件的作用 作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果和网站的健康状态 利用一个优秀的监控软件,我们可以: 对系统不间断实时监控实时反馈系统当前状态保…

游戏实践:扫雷

一.游戏介绍 虽然很多人玩过这个游戏,但还是介绍一下。在下面的格子里,埋的有10颗雷,我们通过鼠标点击的方式,点出你认为不是雷的地方,等到把所有没有雷的格子点完之后,及视为游戏胜利。 上面的数字的意思…

华院计算参编《金融业人工智能平台技术要求》标准

随着人工智能技术的迅猛发展,金融机构正在从业务场景化向企业智能化演进,金融业对智能化的需求愈加迫切。为引导产业有序发展、规范行业自律、加快金融行业智能化转型,中国信通院依托中国人工智能产业发展联盟(AIIA)及…

CommunityToolkit.Mvvm笔记---Ioc

使用MVVM模式提高应用程序代码库中的模块化程度的最常用模式是使用某种形式的反转控制(Ioc)。其中最常见的解决方案是使用依赖关系注入,该解决方案存在于创建多个注入后端类的服务(即以参数的形式传递给 viewmodel 构造函数&#…

ELK+Filebeat日志分析系统

一、ELK基本介绍: 1.ELK 简介: ELK平台是一套完整的日志集中处理解决方案(日志系统)。 将 ElasticSearch、Logstash 和 Kiabana 三个开源工具配合使用, 完成更强大的用户对日志的查询、排序、统计需求。 ELK --> ELFK --> ELFKMQ2.ELK组件介绍…

IDEA创建jsp文件具体步骤

1. 创建普通项目 2.文件->项目结构->模块,点击号,选择web 点击确认 3.配置工件 4.配置tomcat 点击确定 5.创建jsp文件,注意创建位置 6.然后换调试位置 注意此时不能有其他的web项目运行,否则就选不了路径 完成后运行即可

Python代码打包成exe程序

国内镜像源 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple阿里云 https://mirrors.aliyun.com/pypi/simple/豆瓣 https://pypi.douban.com/simple/ 百度云 https://mirror.baidu.com/pypi/simple/中科大 https://pypi.mirrors.ustc.edu.cn/simple/华为云 https://mirror…

MySQL 使用C语言

一般使用MySQL很少用命令行,一般都是通过程序内部使用,MySQL也为不同的语言定制了不同的头文件和库函数,可以在自己的程序中通过包含头文件和编译时候链接库函数来使用MySQL。 现在一般安装MySQL的时候就会自动给你安装库函数和头文件。 可…

数据资产管理制度探索——浙江篇

在行政事业单位数据资产管理领域,浙江省以创新性思维与高质量发展的战略眼光,积极探索并构建了具有前瞻性和实效性的数据资产管理制度。作为财政部数据资产管理试点省份,浙江省财政厅与省标准化研究院强强联合,充分运用数据溯源、…

【报错】TypeError: Cannot read property ‘meta‘ of undefined

😈解决思路 首先这里很明显我们能看到是缺少该参数:meta。 但是经过查找后发现和该参数无关。 😈解决方法 后来我上网搜了下,网上的回答大部分偏向于是package.json这个文件中的tabBar.list数组对象只有一条的问题。 网上的大…

基于SpringBoot + Vue实现的租房管理系统设计与实现+毕业论文+开题报告​(包运行成功)

介绍 管理员的主要功能设计为:密码信息管理、注册用户管理、区域管理、出租管理等模块。 房主的主要功能设计为:密码信息管理、个人信息管理、订单管理等模块。 用户的主要功能设计为:用户登录、密码管理、出租管理、收藏管理等模块。 源码论…

数据结构---线性表

1&#xff0c;顺序表实现---动态分配 #include<stdlib.h> #define InitSize 10 typedef struct {int *data;//静态分配int length;int MaxSize; }SqList; void InitList(SqList& L) {L.data (int*)malloc(InitSize * sizeof(int));//分配空间L.length 0;L.MaxSize…

关于SpringCloud,你了解多少?

Why SpringCloud&#xff1f; Spring cloud 是一系列框架的有序集合。它利用 spring boot 的开发便利性巧妙地简化了分布式系统基础设施的开发&#xff0c;如服务发现注册、配置中心、消息总线、负载均衡、断路器、数据监控等&#xff0c;都可以用 spring boot 的开发风格做到一…

论坛直击|发展新质生产力,高校怎么做?

新质生产力浪潮涌动 三大议题聚焦高校人才培养 今年全国两会的政府工作报告将“大力推进现代化产业体系建设&#xff0c;加快发展新质生产力”列在2024年政府工作任务首位&#xff0c;发展新质生产力的先导是培养拔尖创新人才&#xff0c;高等教育改革必须以立德树人为根本任…

带你从BIOS 小工到年薪百万 之 sense amplifier 的作用以及MRC 如何初始化它

做过BIOS 的同学&#xff0c;肯定看过这张图片 对世界充满好奇心的你&#xff0c;是否想过 其中 Sense amplifier 是做什么用的&#xff1f; 是如何工作的&#xff1f; BIOS 又是如何训练它的&#xff1f; 明天接着写

分布式的计算框架之Spark(python第三方库视角学习PySpark)

基本介绍 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎 。现在形成一个高速发展应用广泛的生态系统。 特点介绍 Spark 主要有三个特点&#xff1a; 首先&#xff0c;高级 API 剥离了对集群本身的关注&#xff0c;Spark 应用开发者可以专注于应用所要做的计…

transformer在生物基因DNA的应用:DNABERT、DNABERT-2

参考&#xff1a; https://www.youtube.com/watch?vmk-Se29QPBA&t1388s 写明这些训练模型可以最终训练好可以进行DNA特征向量的提取&#xff0c;应用与后续1、DNABERT https://github.com/jerryji1993/DNABERT 主要思路就是把DNA序列当成连续文本数据&#xff0c;直接用…

ES11-12

1-ES11-Promise.allSettled Promise.allSettled0)方法返回一个在所有给定的promise都已经fulfilled或rejected后的promise,并带有一个对象数组,每个对象表示对应的promise结果。 简单来说不管成功失败都会调用.then()&#xff0c;然后处理成功和失败的结果 const promises [ …

项目4-图书管理系统2+统一功能处理

1. 拦截器&#xff08;Interceptor&#xff09; 我们完成了强制登录的功能, 后端程序根据Session来判断用户是否登录, 但是实现⽅法是比较麻烦的。 所需要处理的内容&#xff1a; • 需要修改每个接⼝的处理逻辑 • 需要修改每个接⼝的返回结果 • 接⼝定义修改, 前端代码也需…