放弃支持 SQL 惹争议,CEO:你可以怪我!

5f95129f4711634e1ba5e39da093d9a7.gif

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

作为关系型数据库的标准语言,SQL 凭借着功能丰富、使用方便灵活、语言简洁等特性备受欢迎,行业中如 MySQL、Oracle、SQL Server、Sybase、Informix 等主流数据库都将 SQL 作为其标准处理语言。同时,据 2022 年 IEEE Spectrum 编程语言排行榜显示,SQL 在就业需求中排名第一,是最吃香的热门语言之一。

然而,正是这样一款主流的语言,却在近日惨遭弃用。据外媒 The Register 报道,一家名为 Fivetran 的自动化数据集成公司想要用一款开源工具 dbt(Data Build Tool)将 SQL 取而代之。万万没想到,吐槽也接踵而至,行业中反对的声音远比支持的要大得多。

8401b93444a8d71d222d0aa416062f67.png

缘由

Fivetran 是一家创立于 2012 年的技术公司,主要是为公司开发 SaaS 数据集成服务,以提取、加载来自不同来源的数据并将其转换到数据仓库中。

在早期,Fivetran 之所以选择自动化数据集成方向,是因为发现对于使用基于云的软件和存储的现代公司来说,传统的 ETL(Extract-Transform-Load,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程)工具性能严重不足,且所需的复杂配置往往导致项目失败,为此,Fivetran 在城里之初便聚焦于零配置、零维护的管道开发。简单来看,Fivetran 主要是帮助企业将数据搬到云上数仓,其遵循的使命是,让用户使用数据就像用电一样简单,无论数据的来源如何。

2021 年 9 月,Fivetran 获得了一轮 5.65 亿美元的融资,估值达到了 56 亿美元。领投方为网络先驱马克-安德森创建的投资公司 a16z。一时之间,Fivetran 被视为云计算时代的数据管道独角兽,发展势不可挡。

不过,近日一位 Twitter 博主、也是数据分析平台 Cogniti 的首席技术官@Matthew Mullins 突然发了一条推文,他写道,“Fivetran 放弃支持 SQL,并强迫用户转向 dbt。但你可能会因为更为“现代化”而喜欢它。”

aca48afa03344f079d4cc477b78e1279.png

一石激起千层浪,很多人处于比较迷茫的状态。相继质问:

究竟是谁在负责 Fivetran 的产品管理?它似乎正在与外界脱节。数据集成中间件市场的过去历史表明,这将会是一个巨大的战略失误。拥抱 "模型",但不要在 SQL 的迅速崛起和扩张过程中放弃 "代码"(即 SQL)。

而之所以发出这样的声明,Matthew Mullins 称他收到了一封来自 Fivetran 的邮件,具体如下:

在 2023 年 4 月,我们将结束对 Basic SQL Transformations 的支持。你收到这封邮件是因为你的账户当前或者曾经有活跃的 Basic SQL Transformations。

两年前,我们推出了现代的数据转换方法:免费的 Fivetran Transformations for dbt Core。通过内置的版本控制、测试和可重复使用的宏,dbt 改进了数据转换的体验,同时仍然保持了基于 SQL 的简单使用。我们相信这是建立你的 ELT 管道的最简单和最有效的方法。

我们的许多客户已经从 SQL 转换到 dbt。通过免费的 Fivetran Transformations for dbt Core,你还可以利用先进的功能,如:

  • 集成调度:在仓库的连接器数据加载时自动触发数据模型运行。

  • 数据脉络图:通过可视化的数据管道端到端的日志、统计和状态来增加你的可观察性。

我们将帮助您完成这一转变......

7b69193fdb3aa3789ba6c3838405e3a6.png

02752771ca12f2498bb1a1867717d1d6.png

为什么要放弃 SQL,选择 dbt?

其实对于很多公司而言,在新品中进行技术转型也实属正常。但是根据 Fivetran 资料显示,其在全球已有超过 759 家公司,包括与 ASICS、Autodesk、DocuSign、Forever 21、WeWork 和 Urban Outfitters 等知名企业都有合作。除此之外,Fivetran 还支持数百个数据库的连接,如 IBM、Oracle、SAP 和 Snowflake 等。

随着这一计划的执行,影响范围也颇为广泛。为此,也有不少人好奇,dbt 究竟有怎样的魔力,使得 Fivetran 要放弃 SQL?

所谓 dbt,也被称之为是“数据加工大师”,它是一个使用 Python 语言编写软件的工具。它可以使分析工程师能够通过编写选择语句来转换其仓库中的数据。dbt 能够通过 SQL 实现数据转换,将命令转化为表和视图。在功能上,dbt 主要聚焦于 ELT(提取、加载、转换)中的 T(转换数据)环节,它不提取或加载数据,但设计为在转换仓库内已经存在的数据时表现出色。

诞生于 2016 年的 dbt 一开始是开源的,不过在 2018 年,其背后的 dbt Labs 团队推出了商业产品。当前 dbt 主要包含两个版本,其中 dbt Core 是免费的,在 Apache 许可证下作为开源软件发布。

另一个名为 dbt Cloud,属于 Saas 云版本,它提供了一个基于网络的 IDE,帮助团队开发 dbt 项目和一个调度器。个人可以免费使用,但对于一些需要协作的功能,或者企业使用而言,则需要支付使用费用。

长期以来,SQL 一直是分析工程师开发转换和执行分析的首选语言。dbt 的到来,其结合了 SQL,可以将 dbt 项目变成了 SQL 的编程环境,并提供使用编程语言功能的功能,例如在 SQL 中通常无法实现的写函数和控制结构。这意味着分析师不需要学习新的语言或工具,可以像以前一样自由地转换数据。

一定程度上来看,dbt 简化了使用 SQL 来创建数仓的门槛。

433473c82d9c37d3e68e0c9b05b60a7e.png

dbt 实则为累赘?

在发出这份邮件之后,Fivetran 公司表示,开发人员仍然能够使用 dbt 的 SQL。话虽如此,但很多开发者并不买账,纷纷怒斥道:

  • 我知道如果你买了 Fivetran 来做 ELT,这会令人沮丧。我从不希望我的 SQL 依靠第三方平台上,所以它感觉就像一个奇怪的附加组件(不要让我开始考虑使用 Fivetran 触发 dbt 运行的成本)。

  • 强制供应商集成看起来很糟糕。dbt 不是行业标准——它只是一个受欢迎的开发商开发的工具。依赖某一个供应商似乎还挺危险的。

在这条极具争议的推文下方,Fivetran 的 CEO George Fraser 也迅速现身进行了回应,“你可以为这件事责备我。必须集中精力,Basic SQL 和 dbt SQL 实际是做同一件事的两种方法”。同时,他也表示 Fivetran 也正在努力降低扫清采用 dbt 的障碍。

0a67516f7c6945540c456191684c51ee.png

当前 dbt 已经成为一款主流开源数据转换工具,不过不少人也对其使用门槛也表达了担忧,称“如果我们已经掌握了 SQL,再去了解 dbt 的学习曲线是否很难?”而且,dbt 面向团队也不是免费的。

在数据分析平台 Cogniti 的首席技术官 Matthew Mullins 看来,Basic SQL 支持不需要任何额外的基础设施,但使用 dbt,用户只能创建表和视图,且他们也需要额外的基础设施来运行它们。这实际上是一个有点令人头疼的问题。同时,他表示,“无论哪种方式,他们都是在把你逼上梁山。你将不得不设置运行 dbt 所需的一切,并对某人进行培训,而且你现在被限制在 dbt 支持的内容和 dbt 的模式中。

ba8235e3f25aadc8273277e7b322d9d8.png

如今使用 dbt 的企业其实不在少数,在今年 2 月,dbt Labs 完成了 D 轮 2.22 亿美元的融资,Snowflake 和 Databricks 均有参与,该公司估值也达到了 42 亿美元。

不过,dbt 真的是扩展和增强 SQL 的最佳工具,并能成为云数据转换行业的标准吗?你使用过 dbt 吗?

参考:

https://www.theregister.com/2022/10/07/fivetran_slated_for_dropping_sql/

https://www.fivetran.com/blog/dbt-explained

https://twitter.com/mullinsms/status/1578209629083140101

e02d2bfb88c016a4c1b20bb65c70901f.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/510857.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解决方案|致拓T8数字化ERP

简介:通过快速构建敏捷ERP系统,实现从销售到财务的全流程闭环管理,助力企业数字化升级。 「致拓T8数字化ERP」解决方案聚焦业财一体,助力企业卓有成效地提升经营收益,赋能企业个性化数字生产管理。本解决方案由上海致…

携手数字人、数字空间、XR平台,阿里云与伙伴共同建设“新视界”

简介:2022阿里云视觉计算私享会:加速虚拟与现实的交互。 引言:2022年互联网行业里XR、数字孪生、虚拟现实等领域再次“翻红”、新旧概念频出,不少人相信这些技术将给当下的互联网行业乃至传统行业带来翻天覆地的变化。虽然XR的应…

六大挑战下,如何利用云原生数据战略打造数据驱动型企业?

在刚刚落幕的2022亚马逊云科技中国峰会上,亚马逊云科技大中华区战略业务发展部总经理顾凡带来《亚马逊云科技 成为探路者,成就探路者》主题演讲,总结了数据驱动型企业面临的六大挑战,并提供了解决思路。IDC预测,仅在20…

宜搭5月更新:跨应用数据读写能力升级,AI组件内测开放

简介:表单、权限管理、AI组件等功能上新啦~ 本次,我们带来了表单、权限管理、数据管理、平台管理权限、组件等功能的升级。 表单 支持跨应用数据查询 在使用组件数据联动、关联其他表单数据、关联表单组件数据筛选/数据填充等功能时&…

阿里云张新涛:异构计算为数字经济提供澎湃动力

简介:阿里云弹性计算在视觉计算上的应用实践分享。 图:阿里云弹性计算产品专家-张新涛 5月11日,在“2022阿里云视觉计算私享会”上,阿里云弹性计算产品专家张新涛为大家带来了题为《阿里云弹性计算在视觉计算上的应用实践》的主题…

提升Java字符串编码解码性能的技巧

简介:常见的字符串编码有LATIN1、UTF-8、UTF-16、GB18030,他们各有各的特点,且之间的转换比较复杂。本文将为大家介绍提升Java字符串编码解码性能的技巧。 作者 | 温绍锦 (高铁) 来源 | 阿里开发者公众号 1 常见字符串编码 常见的字符串编码…

BladeDISC 0.2.0更新发布

简介:在BladeDISC正式开源三个月后,我们发布了0.2.0版本,该更新包含了大量的性能优化与功能增强。 在BladeDISC正式开源三个月后,我们发布了0.2.0版本,该更新包含了大量的性能优化与功能增强。 BladeDISC是目前业界领…

智能logo免费体验|网站Logo这样设计搜索排名跟着提升

简介:一个好的网站logo,不仅让用户一眼知道网站品牌传递的信息,还能提高网站专业度和丰富度,增加SEO搜索排名。今天分享下如何设计一款实用的网站logo。阿里云智能logo设计,在线免费体验logo制作:https://l…

记一次 JMeter 压测 HTTPS 性能问题

简介:在使用 JMeter 压测时,发现同一后端服务,在单机 500 并发下,HTTP 和 HTTPS 协议压测 RT 差距非常大。同时观测后端服务各监控指标水位都很低,因此怀疑性能瓶颈在 JMeter 施压客户端。 作者:拂衣 问题…

阿里巴巴在 Envoy Gateway 的演进历程浅析

简介:最近阅读 《Envoy Gateway 来了》这篇文章,深感 Envoy 强大的可扩展性和基于 Envoy Gateway 带来的易用性,在 K8s 架构下,Envoy 重新定义了网关的定位和能力,被誉为云原生网关,甚至被称之为下一代网关…

2022华为开发者大赛北区决赛在1024程序员节北京峰会成功举行

10月24日,“2022 长沙中国 1024 程序员节”北京峰会于北京经开区国家信创园成功举办。聚焦“软件新时代 开源创未来”主题,北京峰会开展“会、赛、展、趴”四大环节。2022 华为开发者大赛云应用创新赛道作为华为 ICT 领域面向云赛道的顶级赛事&#xff0…

阿里云专利缴费小程序丨如何在一分钟为多项专利缴费?

简介:本文为用户介绍快速专利缴费的方法。 对于一家科技公司来说,手握多项专利是十分常见的事情。但这却也让相关负责人有点头疼。 “我们公司名下有十多件专利,从14年到现在大概每年申请了一两个专利。类型的话发明专利、外观专利、实用新…

SysAK 应用抖动诊断篇—— eBPF又立功了 | 龙蜥技术

简介:且看 SysAK 是如何打造一款性能开销不大、安全可靠、且灵活的关中断检测工具。 文 / 系统运维 SIG 编者按:还记得曾经风靡一时的狄仁杰探案系列之《他抖任他抖,IO诊断在我手》、《netinfo:揭开网络抖动面纱的神器》、《core…

性能提升 57% ,SMC-R 透明加速 TCP 实战解析 | 龙蜥技术

简介:SMC-R 是如何加速 TCP 应用? 编者按:TCP 协议作为当前使用最为广泛的网络协议,场景遍布移动通信、数据中心等。对于数据中心场景,通过弹性 RDMA 实现高性能网络协议 SMC-R,透明替换应用 TCP 协议&…

2022云管云网大会丨阿里云孙成浩:构建万物互联的智能云网络

简介:2022年5月19日,由中国信息通信研究院(以下简称“中国信通院”)和中国通信标准化协会联合主办的“2022云管和云网大会”通过线上直播方式成功召开。大会以“新云管 新云网”为主题,工业和信息化部信息技术发展司信…

未来两年,阿里云20%新增算力将使用自研CPU

11月3日,阿里巴巴在2022云栖大会上宣布,自研CPU倚天710已大规模应用,阿里云未来两年20%的新增算力将使用自研CPU,这是阿里算力攻坚的重要突破。目前,倚天710已在阿里云数据中心大规模部署,并以云的形式服务…

PolarDB-X迎来开源后首个重大版本升级,2.1版本新增5大特色功能

简介:2022 年 5 月25日,阿里云开源 PolarDB-X 升级发布新版本!PolarDB-X 从 2009 年开始服务于阿里巴巴电商核心系统, 2015 年开始对外提供商业化服务,并于 2021 年10月正式开源。本次发布是开源后首个重大版本升级&am…

做ToB软件质量保障的这两年

简介:自己算是阿里的老兵了,从实习开始一直投身在 toB 业务的质量保障领域内,不能说是资深的专家,但所经历的、感受的业务特点和体会还是具有一定的代表性,希望能通过这篇文章,总结一下过往,并能…

成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用

简介:人们关注 wolai 独特的功能和舒适的用户的用户体验,更关注实现这些背后的技术架构。在一个晴朗下午,我们邀请了 wolai.com 的创始人马锐拉,跟我们聊聊 wolai 背后的 Serverless 架构。 作者:马锐拉 | wolai.com …

前端质量|基于业务驱动的前端性能有效实践案例

简介:前端的本质价值是什么?作者认为是给用户创造良好的交互体验和抵达率优化应该在转化率之前。那么本文就将和大家分享基于业务驱动的前端性能有效实践案例。 作者 | 钱文玲(悠酱) 来源 | 阿里开发者公众号 一、背景 1.1.前端性能优化的业务意义 前…