智能数据构建与管理平台Dataphin的前世今生:缘起

简介: 阿里巴巴提出的OneData方法论帮助企业捋清了数据全生命周期的管理思路,更将其植入到产品Dataphin(智能数据构建与管理)中,通过阿里云为企业提供服务。

Dataphin 智能数据构建与管理平台

面向各行各业大数据建设、管理及应用诉求,一站式提供从数据接入到数据消费全链路的智能数据构建与管理的大数据能力,包括产品、技术和方法论等,助力打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系,以驱动创新。

Dataphin产品直达:https://www.aliyun.com/product/dataphin

 

困难是最好的教练

 

阿里巴巴从2008年开始建设自有的大数据体系,致力于构建好数据服务多样的业务。一路上,经历了各种各样的困难。

技术陷在临时取数不可知:阿里内部曾经通过建设专门的“临时取数需求管理系统”,给每个业务线分配临时取数的时间额度,每次还没到月底,额度已经为零,业务同学追着数据技术同学加班取数的情况时有发生......为了改变这一局面,专门建立了“业务人员SQL技能培训”,希望用这样的方式让业务人员自己掌握临时取数技能,美其名曰“赋能”。而这背后的本质是:资源。

数据口径定义有差别:曾经就因为数据口径差异,差点造成商家损失。商家在后台看到的数据预测,显示可以达到活动报名要求,于是提前备货,准备大干一场,但是最终报名却没有通过,原因是小二侧的数据口径与商家侧的数据口径不一致,小二系统评估商家的数据未达标,导致不通过。虽然最终通过协调解决了问题。但这背后的本质是:标准

加班做报表,汇报还被骂加班取数是常态,通常取数花费2-3小时,而之后的核对差异则要花费巨大精力,动辄1-2天;最后的汇报环节,也会因为一些口径差异及数据质量问题造成尴尬,甚至会出现错误数据导致决策失误的情况。这背后的本质是:质量

除了上述这几个典型的场景,阿里巴巴也曾因业务增长而出现数据量爆发增长,对数据不治理不管理,意味着数据的存储和计算成本不断攀升。成本,也是大数据领域面临的困难之一

探索中前行,实战中沉淀带着克服困难的决心,阿里巴巴开始了B2B业务数据建设、电商业务数据建设、阿里系业务数据建设。过程中,边探索、边沉淀、边前行,通过更体系化的数据建设提升数据质量,降低数据重构的风险,提升数据服务的效率。经历近十年的打磨,基于实战,阿里巴巴沉淀了OneData大数据建设的方法论(OneModel+OneID+OneService)。OneModel通过对数据体系化架构、数据元素规范定义、数据指标结构化拆解,对数据进行统一的构建及管理;OneID通过建立实体对象、对象相关的行为数据及标签构建方法,对企业的核心商业要素进行资产化;对数据资产进行统一的主题式数据单元构建,配置构建数据API并提供API服务,以提升数据资产消费的便捷性,提升数据资产价值。


克服痛点 创造领先的大数据能力

 

随着全球数字化进程的加速,企业面临着更加严峻的市场竞争,而数智化转型所遇到的困境也曾是阿里巴巴最初之痛。于是,阿里云数据中台应运而生,与各行各业的企业在数据领域开展了合作,解决企业凸显的数据问题:

●数据标准问题:烟囱式开发及局部业务服务支撑,导致指标同名不同口径问题频发;历史上不同业务系统逐步迭代上线,相同对象属性编码不一致等问题突出;

数据质量问题:重复建设导致任务链冗长、任务繁多,计算资源紧张,数据时效性不好;口径梳理定义的文档沉淀到开发代码实现之间存在脱节,数据准确性保障风险高;

需求响应问题:烟囱式开发周期长、效率低,面向应用的服务化不足,导致业务响应速度慢,业务不满意的同时技术又觉得没有沉淀与成长;既懂业务又懂数据的人才不足,需求理解到开发实现涉及大量沟通,服务效率较差;

成本资源问题:烟囱式开发的重复建设浪费技术资源;上线难下线更难,源系统或业务变更不能及时反映到数据上,加之数据不标准,研发维护难上加难的同时,大量无用计算和存储造成资源浪费。

阿里巴巴提出的OneData方法论帮助企业捋清了数据全生命周期的管理思路,更将其植入到产品Dataphin(智能数据构建与管理)中,通过阿里云为企业提供服务。 Dataphin除了大数据处理全链路涉及到的数据集成、开发、发布、调度、运维能力,同时提供了数据规范定义、逻辑模型定义、代码自动化生成、数据主题式服务能力,高效地完成好数据的构建。

 

Dataphin产品核心模块



Dataphin自2018年问世以来,已发展出了丰满的大图,到目前为止经历了多轮大版本升级,产品核心的能力模块清晰显现。
1、环境适配
最底层为Dataphin的环境适配能力。Dataphin支持不同的云环境,为不同规模以及不同部署要求的客户提供不同的选择,包括公共云多租户、公共云VPC、专有云企业版及敏捷版,以及本地IDC部署。
2、引擎支持
在云环境之上,根据不同的云环境可以支持不同的计算引擎。离线的计算引擎包括阿里云MaxCompute,Hadoop生态引擎包括阿里云E-MapReduce、CDH5、CDH6、以及即将支持的FusionInsight、CDP等。实时计算引擎支持阿里云Blink和Flinkvvp。开源版本的Flink也即将支持。
3、数据构建
基于不同的云环境和计算引擎,Dataphin提供了大数据处理全链路涉及的数据集成、开发、发布、调度、运维能力,提供了数据规范定义、逻辑模型定义、代码自动化生成、主题是查询的数据构建能力。
4、资产
Dataphin提供了配套的资产地图、资产血缘、资产质量管理和监控、资源成本管理和提效的资产管理能力,并提供了配置化的资产服务研发和管理能力,可将数据资产快速服务业务、反哺业务。

原文链接
本文为阿里云原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/513374.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

缓存和数据库一致性问题,看这篇就够了

作者 | Magic Kaito来源 | 水滴与银弹如何保证缓存和数据库一致性,这是一个老生常谈的话题了。但很多人对这个问题,依旧有很多疑惑:到底是更新缓存还是删缓存?到底选择先更新数据库,再删除缓存,还是先删除缓…

并联串联混合的电压和电流_高考物理常考实验之电流表改装电压表怎么串联电阻...

​高中物理学习问题与王尚老师答疑​电流表改装电压表怎么串联电阻【问:电流表改装电压表怎么串联电阻?】王尚老师:基本理论是欧姆定律,我举个例子来说这个问题吧。如果是0.3A量程的电流表,改装为最大量程15V的电压表&…

走近Quick Audience,了解消费者运营产品的发展和演变

简介: Quick Audience产品是一款云原生面向消费者的营销产品,自诞生以来,经历了三个发展阶段。每个阶段的转变,都与互联网环境和消费者行为的变迁有着极大的关联。 Quick Audience是云原生的面向消费者的营销平台,涵盖…

php图形验证码接口,php生成图形验证码

[php]代码库<?php session_start();// main$vcodes ;//generate Number 4srand((double) microtime() * 1000000);for ($i 0; $i < 4; $i) {$vcodes . rand(1, 9);}$_SESSION[eifr_checkvcode] $vcodes;if (function_exists(imagecreate)) {//generate picture valid…

边缘应用增长 800%,听听 Akamai 边缘部署的经验

作者 | 宋慧出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;全球权威研究机构都在研究边缘计算的发展进程&#xff0c;并一致认为&#xff0c;企业IT的边缘部署正在加速。其中&#xff0c;IDC研究显示&#xff0c;2023年超过50%的企业新增IT基础设施会部署在…

308 permanent redirect怎么解决_赵县308国道一路口发生一起大货车与电动三轮车碰撞事故,电动三轮车驾驶人受伤。...

原标题&#xff1a;赵县308国道一路口发生一起大货车与电动三轮车碰撞事故&#xff0c;电动三轮车驾驶人受伤。2020年11月4日上午&#xff0c;赵县308国道一路口发生一起大货车与电动三轮车碰撞事故&#xff0c;造成电动三轮车驾驶人受伤。大货车驾驶人驾驶一辆重型货车&#x…

一文带你了解企业上云数据分析首选产品Quick BI

简介&#xff1a; 阿里云Quick BI再度入选&#xff0c;并继续成为该领域唯一入选魔力象限的中国企业&#xff0c;文章将为大家详细介绍上云数据分析首选产品 Quick BI的核心能力。 日前,国际权威分析机构Gartner发布2021年商业智能和分析平台魔力象限报告&#xff0c;阿里云Qu…

如何实现事务原子性?PolarDB原子性深度剖析

简介&#xff1a; 在巍峨的数据库大厦体系中&#xff0c;查询优化器和事务体系是两堵重要的承重墙&#xff0c;二者是如此重要以至于整个数据库体系结构设计中大量的数据结构、机制和特性都是围绕着二者搭建起来的。他们一个负责如何更快的查询到数据&#xff0c;更有效的组织起…

Redis 分布式锁没这么简单,网上大多数都有 bug

作者 | 码哥字节来源 | 码哥字节Redis 分布式锁这个话题似乎烂大街了&#xff0c;不管你是面试还是工作&#xff0c;随处可见&#xff0c;为啥还写&#xff1f;因为看过很多文章没有将分布式锁的各种问题讲明白&#xff0c;所以准备写一篇&#xff0c;也当做自己的学习总结。在…

php 商品展示html,HTML5和CSS3实现3D展示商品信息的代码

这篇文章介绍的是关于html5商品展示导购特效是一款3D立体样式的商品信息&#xff0c;非常具有实用价值&#xff0c;需要的朋友可以参考下。强化下perspective和transform:translateZ的用法。传统的商品展示或许并不能很好的吸引用户的注意力&#xff0c;但是如果在展示中添加适…

asp.net程序涉及案例_定制小程序 | 企业在开发小程序前需要满足哪些条件?

目前深圳小程序开发行业发展愈发迅速&#xff0c;小程序开发已成为目前的潮流趋势&#xff0c;制作属于自己的小程序刻不容缓。那么在开发小程序前&#xff0c;企业需要满足什么条件呢&#xff1f;1、注册账号万纵联小编告诉你&#xff0c;要想开发小程序&#xff0c;申请账号是…

封神-核心功能 | 钉钉告警+数据网关

简介&#xff1a; 封神-核心功能 | 钉钉告警数据网关1. 开发背景 1.1 用户痛点 ①租户侧运维能力弱 问题&#xff1a;租户侧&#xff0c;客户没有有效途径&#xff0c;及时地获取实例级的状态、性能、容量的数据。 现状&#xff1a;每日固定时间&#xff0c;驻场需要人肉收集数…

usleep延时0.毫秒_【进阶】用swoole实现订单的延时处理(自动取消,还原库存等)...

文章正文一、业务场景&#xff1a;当客户下单在指定的时间内如果没有付款&#xff0c;那我们需要将这笔订单取消掉&#xff0c;比如好的处理方法是运用延时取消&#xff0c;很多人首先想到的当然是crontab&#xff0c;这个也行&#xff0c;不过这里我们运用swoole的异步毫秒定时…

中国电信天翼云进入4.0阶段,打造一朵无处不在的分布式云

11月12日&#xff0c;天翼云在2021国际数字科技展暨天翼智能生态博览会天翼云论坛上&#xff0c;发布并解读了全新升级的天翼云4.0分布式云&#xff0c;同时还推出了以红色为主色调的天翼云全新品牌形象。 天翼云新品牌形象 中国电信集团有限公司副总经理唐珂在致辞中表示&am…

软件开发中 前台、中台、后台英文_最近处处惹人爱的中台到底是什么

在当下互联网圈子里要问什么最火莫过于中台这一概念了&#xff0c;各大公司都开始了一轮跑马圈地似的中台建设&#xff0c;那么到底中台是什么呢&#xff1f;本文我们就来谈谈这个话题。一、什么是前台&#xff0c;后台在以往的互联网企业生产流程中&#xff0c;我们可以将研发…

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

简介&#xff1a; MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库&#xff0c;以 Serverless 架构提供快速、全托管的在线数据仓库服务&#xff0c;消除了传统数据平台在资源扩展性和弹性方面的限制&#xff0c;最小化用户运维投入&#xff0c;使您可以经济并高效的分析处…

数仓架构的持续演进与发展 — 云原生、湖仓一体、离线实时一体、SaaS模式

简介&#xff1a; 数据仓库概念从1990年提出&#xff0c;经过了四个主要阶段。从最初的数据库演进到数据仓库&#xff0c;到MPP架构&#xff0c;到大数据时代的数据仓库&#xff0c;再到今天的云原生的数据仓库。在不断的演进过程中&#xff0c;数据仓库面临着不同的挑战。 作…

华为路由器命令手册_华为路由器+蒲公英路由器,如何做双层路由器映射?

今天上午&#xff0c;有一个客户反馈&#xff0c;他们的软件和linux系统无法实现外网访问了。客户的网络拓扑是这样的&#xff0c;光猫接蒲公英路由器X5&#xff0c;蒲公英路由器的LAN 口IP是192.168.0.1&#xff0c;然后从蒲公英路由器的LAN口连接一根网线到华为路由器WAN口&a…

行业务实派:解锁数据价值,翼方健数全栈隐私安全计算技术

数智化时代&#xff0c;数据已成为最核心、最具价值的生产要素。其中&#xff0c;如何应用可落地的技术&#xff0c;共享和保护数据&#xff0c;促进数据要素进一步流通&#xff0c;释放数据价值&#xff0c;受到业内普遍关注。 隐私计算&#xff0c;被业内誉为打破“数据隐私…

ctrl c 失效了_[安卓+PC双端]超C女仆无馬中字

这周基本啥也没发&#xff0c;传个小游戏吧就&#xff5e;点赞(150) 投币(随缘)推荐用用吉里吉里模拟器玩&#xff5e;应该是女仆类的游戏&#xff0c;我没玩过也不清楚哦链接失效我就不补了&#xff0c;如果点赞在今天内达标&#xff0c;那就今晚20:00补发&#xff0c;不要错…