作者 | 宋慧
出品 | CSDN云计算(ID:CSDNcloud)
关于数据中台的问题,CSDN 在一年前采访了 Gartner 研究总监孙鑫,采访中,孙鑫提到 数据分析将是改变“游戏规则”的技术、企业的中台需要可组装的架构 。经过一年的发展,Gartner 再次分享了数据中台的最新进展与其分析观点。
Gartner研究总监孙鑫
从 2019 年起,Gartner 开始关注与研究数据中台,到 2020 年首次发布中台市场的“技术成熟度曲线”,Gartner 认为数据中台在“技术成熟度曲线”的“炒作顶峰”。孙鑫看到,中国有众多的数据库、商业智能 BI、数据科学的厂商,但现在的数据仍是孤岛式,企业已有的数据投入,并没有产出理想的业务价值。而中国企业对数据整合的需求非常旺盛,做数据整合的厂商并不多。因此孙鑫提到,数据整合将成为数据中台最核心的解决方案,也是用户真实所需。
数据中台在技术成熟度曲线的炒作顶峰
数据与业务鸿沟下,Gartner 以分析模型分解数据中台
针对数据和业务问题存在价值鸿沟的痛点,孙鑫认为首先在数据中台的团队中,除 IT 人员,也需要业务端的人员加入,一同完成数据分析,确保企业级数据一致性,共享最佳实践。
另外,在以往数据中台的建设中,通常存在的问题是业务侧团队不了解数据在哪里,用户需要花费时间去寻找数据而不是分析数据,数据资产的定义并未在业务侧团队之间共享。Gartner 认为,需要针对这些问题,中台应实现自动发现元数据,通过元数据智能搜索,找到数据源,让各系统中的数据可以直观传递到用户(业务侧使用者)手中。另外,孙鑫提到,数据资产不应以 IT 团队维护单个项目的形式运行,而应由业务侧团队参与(或众筹的形式),去演进优化与共享数据资产。
Gartner 也建立了一个重要的分析模型——数据和分析基础设施模型DAIM,去分解数据中台建设中遇到的各类问题。模型将各类数据投入分为IT与业务两个维度,将数据分为“已知的数据”和“未知的数据”,业务问题分为“已知的问题”和“未知的问题”,依据模型对中台所需的基础产品进行剖析。
重要模型:数据和分析基础设施模型 DAIM
数据中台组件均可归类在模型中
数据中台的核心产品化组件,都可以归类到模型的四个象限中,其中,孙鑫提到,在中国市场中,数据虚拟化产品目前仍几乎是空白。
数据中台建设重点:数据编织、数据治理、平衡采集与连接
针对数据中台建设,Gartner 给出了三个重点关注的方向。首先是 Gartner 早先提出的数据编织。现在企业已有交易型数据库、数据仓库、数据湖、云端数据存储等众多数据源,Gartner 提出了数据编织,为企业“织”起一张虚拟的网,对企业所有数据虚拟化,在场景中利用知识图谱处理元数据。孙鑫提到,数据编织不是将数据收集于一处,而是对数据进行更优关联,以服务不同用户,帮助用户在合适的时间获得合适大小的数据。同时数据编织也涵盖数据消费的信息,将之定义为企业元数据。
Gartner 提出数据编织 Data Fabric
第二,数据中台应涵盖数据治理。随着《数据安全法》、《个人信息保护法》的颁布和实施,以及“上云”的安全性问题,Gartner 认为数据分析平台应处于企业数字化平台的中心位置,所以也应涵盖治理相关的工作。数据治理不仅由软性标准或治理委员会等执行,之后也将通过技术手段完成政策设置、执法和执行,如数据中台可对数据质量、安全性、隐私、道德的掌控,对数据的定义,以及数据留存条约、条款的制定等。
第三,数据收集与连接实现平衡。数据管理不应只注重数据的收集,导致数据分析和生产价值的延后。采用数据虚拟化,数据中台可依据元数据(数据消费行为)判断应采集还是连接,以及资产化的处理。
对于中台演进的技术,孙鑫也总结其中一些重要的方向。Gartner 看到,现在的数据语义层工具已经在用知识图谱对数据完成关联和建模,从用户自助式分析转变为组装式分析,以业务的视角做业务价值导向的分析,企业应该构建起可以复用的数据分析能力以让用户可以在价值流(Value Stream)上组装分析型应用。
数据分析应用的未来
数据中台未来技术方向:DataOps
未来,孙鑫认为,组装式的数据中台将发展成为“组装式的能力创新平台”,并将塑造数据分析应用的未来。已有的报表平台、分析工作站、自助式分析平台或数据科学平台等,将走向容器化和微服务化。另外,数据分析也将借助 DevOps 加速数据和分析应用上线,Gartner 称其为 DataOps,最终让数据管理与分析的用户从测试更快转入数据生产应用。
往期推荐
5G 落地进入爆发期,是时候让毫米波登场了
Github王炸功能!Copilot替代打工人编程?
边缘应用增长800%,听听Akamai边缘部署的经验
Mendix 发布全球低代码报告
点分享
点收藏
点点赞
点在看