PolarDB 再升级:欢迎来到云数据库 x AI新时代

大模型时代,数据库的变化走到了哪?

作者|思杭 

编辑|皮爷 

出品|产业家 

“搭积木”、“‘自动驾驶’”、“三层解耦”,这些形象的标签成了1月17日阿里云开发者生态大会当天最出圈的词汇。

会上,一名小学生受邀上台演示了数据库查询的场景。一种“全民编程”的气氛向现场观众席卷而来。而让个人开发者和企业用户都可以像“搭积木”一样开发和管理数据库,这也正是阿里云在2024年甚至更长时间里的新愿景。

而AI,正是其中的关键武器。

从IBM小型机,到Oracle“统治”时代,再到以AWS、GCP等云数据库巨头引领的新时代,全球数据库行业交错发展了40年之久。而在最近的十年时间里,国产数据库成为新的弄潮儿。

2023年底,一张亮眼的成绩单新鲜出炉。阿里云瑶池数据库入选Gartner云数据库魔力象限,并连续4年蝉联“领导者”地位。

而与之对应的一个事实是,在国内云计算行业增速放缓的背景下,入选企业只有阿里云一家。放眼国际,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。

云数据库正是其中的主角。实际上,在不少数据库企业的眼中,云数据库都被视为一个国内数据库行业换道超车的机会。其中不仅包括公有云大势所趋的推动,更重要的是云数据库所涉及到的底层创新,如存算分离和软硬一体技术等等,也正在成为数据库行业的新潮流。

2023年,据墨天轮统计,云数据库占国内数据库总数的20%。而早在2021年,中国信通院就做出相关预测。“80%的企业都认为云数据库是未来数据库行业的发展方向。”

在大模型一路“狂飙”的今天,云数据库又来到了超车关口。

一、从传统数据库到云数据库的“新需求面”

在很长一段时间里,业务高峰期间的流量指数级增长都是企业最怕遇到的问题,比如双十一期间的淘宝和春运期间的12306等等。这已经成为一种行业共识。

而在流量爆表的另一面,业务也对数据库,尤其是传统数据库提出了极高的要求,包括存储、计算等一系列环节都成为不少企业难以解决的问题。

根据一组不完全数据统计,在过去几年里,有超过70%的新型企业都因海量数据的挑战而对业务产生了影响。

天猫双十一是最常见的例子。每年双十一大促的,入驻天猫的商家都深知一个“爆款规则”,即提前几周乃止一个月对企业自身数据库计算能力和存储量做临时升配。

但尽管如此,在双十一流量高峰期间,客户的数据库还是会出现了问题。具体来看,由于传统数据库需要进行定期运维,而这种运维升级所需要的时间是6-8个小时。在此期间,不仅企业需要支付高昂的运维成本,更严重的情况则是由于资源冲突导致的升配失败。

在零售之外,中国联通这类的大型企业也在面临同样的问题。

与互联网业务不同的是,互联网业务交易量大,但速度快。而联通业务的特点则是会遇到多种需求,业务链条极长。

比如看似十分简单的选手机号的业务,一整条链条需要涉及到手机号码选择、套餐选择、开网,以及实名校验和反电信诈骗各种校验。

这种业务复杂、链条冗长的场景,对联通内部的IT系统是一个极大的考验,其不论是运维还是维护,都需要保持业务无感知以及绝对的安全,否则一旦出现问题将影响每个用户的日常生活。在这些之外,更要注意成本。因此,同样地,留给其内部数据库管理的难度极大。

实际上,不论是电商企业,还是如中国联通这样的大型运营商,传统数据库高企的成本和业务对弹性的运维需求也恰在成为采用云数据库的最强推动力。因此,极低的运营成本和弹性存储、计算便成为了对数据库企业的刚性需求。

根据不完全统计,在面对业务高峰带来的峰值时,云数据库的最大优势便是可以为企业提供弹性扩缩容能力。在这种弹性场景下,云原生数据库PolarDB的成本仅为传统商业数据库的十分之一。

另外,在厂商的帮助下,云原生数据库可以做到开箱即用,服务商提供从安装、部署到运维的全流程服务,基于云端的运维和弹性存储计算等进一步降低企业的运营和使用成本。

根据中国信通院报告显示,2022年中国公有云数据库市场规模为219.15亿元,较2021年增速51.6%,而本地部署的增速为14.4%。

二、解耦、AI、积木:

从弹性运维到智能运维

而在这个确定性的趋势之下,阿里云又向前了一步。

1月17日,阿里云PolarDB开发者大会上发布了“三层分离”的新版本,基于智能决策实现查询性能10倍提升、节省50%数据库成本。

而这里的“三层解耦/三层分离”则是阿里云的特殊标签。

此前,在过去40多年的数据库行业发展中,一个极为普遍的情况是数据库的计算与内存都是绑定在一起的,也就是俗称的存算一体。其中部分数据库可以做到计算和存储资源进行解耦,不过没有数据库能做到计算和内存的解耦。

但对于数据库而言,计算、内存和存储资源全部绑定在一起,这种强耦合性会极大地限制数据库的弹性能力,很难进行跨机迁移。

而放在现实生活中,最常见的例子是在淘宝双十一流量高峰,如果计算和内存无法进行分离,最直接的影响一方面是企业的数据库部署和运营成本十分高昂,另一方面则是对企业的计算资源造成极大的浪费。

这也是阿里云“三层解耦”方案的价值之处。

这种强解耦不仅带来的是运维和成本上的弹性,更在产品体验层面被强化。“未来,个人开发者和企业用户可以像‘搭积木’一样开发和管理数据库。”阿里云数据库产品事业部负责人李飞飞表示。

实际上,所谓的“搭积木”,其核心逻辑在于,在统一源数据管理和保证多租户隔离的前提下,企业可以自主调用搭配阿里云数据库的产品组组件,包括计算单元、存储引擎、向量引擎能力等等,满足业务对数据库的精准需求,而对阿里云而言,则是真正从原子化的层面满足企业自身需求。

从具体效果来看,“搭积木”的体现,一方面是刚刚提到的极致弹性,另一个则是强Severless能力。

对Severless化的一个通俗解释是,其更像一种按需付费的交付方式,用户不需要担心数据库的存储、计算等资源问题,也无需进行配置和维护、更新,可以大幅节省在服务上花费的时间和资源。

对企业而言,其只需要将重心放到本身的业务逻辑即可。

早在2017年,Serverless就在国内落地,也正是在这一年阿里云推出Serverless平台。后来,随着Serverless平台逐渐深化,“像搭积木一样简易”这样的愿景也开始一点点落地。

而在其中,AI是非常重要的价值工具。“在大模型时代,谁能够让整个端到端的流程更简单、更易用,谁就会在市场上占据先发优势。”李飞飞表示。

更客观来看,不论是弹性运维,还是Serverless,其本身都是对数据库产品力和使用体验的进一层深化,而如今在大模型的加持下,数据库的产品力将更为强大。

除了已有的向量引擎等数据库底层进化之外,李飞飞告诉我们,在数据库的智能运维方面,阿里云通过AI大模型能力,可以对企业内部的业务数据进行智能监控,再加上AI的智能分析能力,在一定程度上减少数据库维护、更新等人工成本。

再比如在数据库产品的服务层面,基于大模型可以对工单进行更为高效的管理,如今,这项能力已经在阿里云数据库团队内部使用。

“数据库和大模型结合的想象力很丰富,包括原有的BI,商业数据分析过等过去企业内部基于数据的动作,未来仍然会存在,但是会基于大模型的场景进行,这个想象力也是无穷的。”

三、2024,走到数据库的关口

实际上,我们再来看这个命题:即大模型究竟能为数据库做些什么?

继2023年,大模型“狂飙”了一年后,关于这样的讨论在持续发酵。甚至几乎所有大厂都All in AI来做大模型。

但就目前而言,与大模型结合更多可落地的场景在于上层应用,如AI Agent,或者与SaaS工具层的结合。而对于底层的数据库而言,大模型对数据库行业造成的潜在影响则在于智能化。

从大模型与数据库的本质进行分析,大模型需要依托海量的数据来训练、学习,而数据库的作用则是进行存储、筛选和处理数据。

因此,两者碰撞在一起的想象力,则可以通过可视化工具,来进行配合,比如通过大模型进行数据的收集、标签管理、数据资产沉淀,再利用AI大模型能力进行数据智能分析,并以清晰可视化的方式,实现真正的数据和业务结合。

这也是目前企业里较为常见的需求,即将数据库与AI和BI相结合的方向。

而从这些视角来理解,其实不难看出对当下而言,数据库行业正在坚定地发生一些变化。

首先,站在更大的行业视角,在云数据库成为新趋势的背景下,云数据库成为了国产数据库企业换道超车的新机会。而在此基础上,像阿里云所推出的“三层解耦”和“搭积木”理念,再加上AI加持的智能运维能力,也更是加速了云数据库替代传统商业数据库的趋势。

在过去2023年,整个数据库市场已经站上了数字路口的开始。从去年Gartner发布的云数据库魔力象限就可以发现,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。

而从过往的历史趋势来看,一直以来在数据库行业具有“统治者”地位的Oracle也在云计算时代由于战略判断失误而失去了其原本的霸主地位。

而另一组根据信通院的统计则是,目前国内数据库有接近300家公司,这里面包括OLTP、OLAP、NoSQL等类型,已经被大量应用在企业业务中。

李飞飞告诉我们,未来坚持传统软件思维模式的数据库企业会越来越艰难。“坚持云原生化、一体化、平台化和智能化,才是数据库的下一个方向和未来。”

云原生化意味着企业从购买资源向购买能力转变,加速数据业务上云。其中“三层解耦”和Serverless能力便是最好的体现。

平台化对应的是基于平台来提供一站式的能力和解决方案,比如通过提供标准的API接口体系来减少业务烟囱。

一体化则是聚焦客户的业务场景,通过多产品一体化的体验,来简化开发、管理和运维,避免数据搬迁。如处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化。

最后,智能化便是结合AI提升运维效率和查询效率等等。而放在未来的大模型时代,智能化的想象力和应用力也将会越来越丰富。

不难看出,2024年数据库行业在AI的推动下,既定的云端进化速度正在加速。而伴随着市场和企业对于云数据库需求的越发增加,中国数据库厂商正在成为一股不可忽视的力量。

“核心还是持续为客户创造更大的价值,这是阿里云数据库和PolarDB产品的根本使命。”李飞飞说道。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/643647.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3.jmeter接口关联及实战

1.当所传参数包含键值对和json文件时,键值对放在链接后,参数放在消息体数据中 2.当查看结果树返回乱码时,修改请求中内容编码为utf-8 一、jmeter接口关联 1.正则表达式提取器 接口2.3传递的参数中需要用到接口1的返回值 禁用接口2.3&#…

Elasticsearch:Simulate ingest API

Ingest pipeline 为我们摄入数据提供了极大的方便。在我之前的文章中,有非常多的有关 ingest pipeline 的文章。请详细阅读文章 “Elastic:开发者上手指南”。针对一组提供的文档执行摄取管道,可以选择使用替代管道定义。 Simulate ingest AP…

基于关系型数据库的知识图谱存储探析

目录 前言1 图结构数据的关系存储1.1 Wikidata与MySQL的结合1.2 关系型数据库的优势与挑战 2 选择数据库需要考虑的三个问题2.1 存储的物理结构2.2 存储的性能问题2.3 图的查询问题 3. 不同的存储方式3.1 Triple Store3.2 属性表存储3.3 二元表3.4 全索引结构 结语 前言 在当今…

前端动画特效分享(附效果图及在线演示)

分享7款有趣也实用的前端动画特效 其中有CSS动画、canvas动画、js小游戏等等 下方效果图可能不是特别的生动 那么你可以点击在线预览进行查看相应的动画特效 同时也是可以下载该资源的 SVG天气图标动画特效 SVG天气图标动画特效 不管是晴天雨天等都很完美的展示出了各自真实的…

新版idea创建spring boot项目

目录 前言 汉化教程 项目模板初始化 1.点击新建项目 2.配置初始化信息 3.初始依赖选择 配置Maven 1.打开maven设置 2.重写maven配置文件 3.选择你创建的配置文件 4.重启项目 spring boot配置并测试 1.修改配置文件后缀 2.启动项目 3.编写测试控制类 4.重启项目…

创建.gitignore,忽视不必要提交的文件

在项目主目录下创建.gitignore文件 touch .gitignore在.gitignore文件内输入要忽略的文件即可。 e.g. build/.gitignore文件不生效问题 上传后并没有不在build目录内产生文件 该文件只能作用于Untracked Files,也就是那些从来没有被git记录过的文件。 解决方法…

springboot druid数据库配置密码加密

1.使用的druid版本 <!-- 阿里数据库连接池 --> <dependency><groupId>com.alibaba</groupId><artifactId>druid-spring-boot-3-starter</artifactId><version>1.2.21</version> </dependency> 2.配置文件 # Spring配置 …

141:vue+leaflet 利用高德逆地理编码,点击地图标记marker,popup地址信息

第141个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中利用高德逆地理编码,点击地图标记marker,popup地址信息 。主要利用高德地图的api将坐标转化为地址,然后在点击的位置,弹出弹窗,在里面显示出地址信息。 直接复制下面的 vue+leaflet源代码,操作2分钟…

性能优化(CPU优化技术)-NEON 介绍

「发表于知乎专栏《移动端算法优化》」 本节主要介绍基本 SIMD 及其他的指令流与数据流的处理方式&#xff0c;NEON 的基本原理、指令以及与其他平台及硬件的对比。 &#x1f3ac;个人简介&#xff1a;一个全栈工程师的升级之路&#xff01; &#x1f4cb;个人专栏&#xff1a;…

Unity之Timeline教程

前言 Unity Timeline是Unity的一种时间轴编辑器工具&#xff0c;用于制作和管理游戏中的动画、剧情以及事件触发。它提供了直观的界面&#xff0c;使得开发者可以通过拖放操作轻松创建和编辑时间轴。 Timeline的使用 创建新的Timeline 在Unity中&#xff0c;选择菜单栏的 Wi…

云计算入门——Linux 命令行入门

云计算入门——Linux 命令行入门 前些天发现了一个人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;最重要的屌图甚多&#xff0c;忍不住分享一下给大家。点击跳转到网站。 介绍 如今&#xff0c;我们许多人都熟悉计算机&#xff08;台式机和笔记本电…

Ant Design Vue详解a-tree-select使用树形选择器,递归渲染数据,点击选项回显,一二级菜单是否可选等问题

后台给的树形数据&#xff1a; {"code": 200,"data": [{"code": "jsd","children": [{"code": "hx","children": [],"name": "航向","id": 8,"libTable…

《WebKit 技术内幕》学习之十一(3):多媒体

3 音频 3.1 音频元素 说完视频之后&#xff0c;接下来就是HTML5中对音频的支持情况。音频支持不仅指对声音的播放&#xff0c;还包括对音频的编辑和合成&#xff0c;以及对乐器数字接口&#xff08;MIDI&#xff09;等的支持&#xff0c;下面逐次介绍并分析它们。 3.1.1 H…

代码随想录算法训练营第36天 |435. 无重叠区间 763.划分字母区间 56. 合并区间

目录 435. 无重叠区间 &#x1f4a1;解题思路 &#x1f4bb;实现代码 763.划分字母区间 &#x1f4a1;解题思路 &#x1f4bb;实现代码 56. 合并区间 &#x1f4a1;解题思路 &#x1f4bb;实现代码 435. 无重叠区间 题目链接&#xff1a;435. 无重叠区间 给定一个…

一文讲透Redis的LRU与LFU算法实现

深入解析Redis的LRU与LFU算法实现 一、前言 Redis是一款基于内存的高性能NoSQL数据库&#xff0c;数据都缓存在内存里&#xff0c; 这使得Redis可以每秒轻松地处理数万的读写请求。 相对于磁盘的容量&#xff0c;内存的空间一般都是有限的&#xff0c;为了避免Redis耗尽宿主…

【Go面试向】Go程序的执行顺序

【Go】Go程序的执行顺序 大家好 我是寸铁&#x1f44a; 总结了一篇Go程序的执行顺序的文章✨ 喜欢的小伙伴可以点点关注 &#x1f49d; Go程序内容 go程序通常包含: 包、常量、变量、init()、main()等元素 下面从这几个方面分别去梳理&#xff01; 包的执行顺序 程序中的包 …

Linux系统常用命令行指令

Linux系统是一种常用于开源项目开发的生产环境&#xff0c;因其免费、开源、安全、稳定的特点被广泛应用于手机、平板电脑、路由器、电视和电子游戏机等嵌入式系统中&#xff0c;能够更加简便地让用户知道系统是怎样工作的。前几日我安装好了Red Hat Enterprise Linux 9.0&…

Linux的常见指令和基本操作演绎【复习篇章一】

文章目录 前言下载安装 XShellXShell 下的复制粘贴热键操作01.ls指令tree 02.cd指令03.touch指令04.mkdir指令&#xff08;重要&#xff09;&#xff1a;05.rmdir指令 && rm 指令&#xff08;重要&#xff09;06.组合07.man指令&#xff08;重要&#xff09;&#xff1…

《WebKit 技术内幕》学习之十一(4):多媒体

4 WebRTC 4.1 历史 相信读者都有过使用Tencent QQ或者FaceTime进行视频通话的经历&#xff0c;这样的应用场景相当典型和流行&#xff0c;但是基本上来说它们都是每个公司推出的私有产品&#xff0c;而且通信等协议也都是保密的&#xff0c;这使得一种产品的用户基本上不可能…

【时间序列篇】基于LSTM的序列分类-Pytorch实现 part3 化为己用

系列文章目录 【时间序列篇】基于LSTM的序列分类-Pytorch实现 part1 案例复现 【时间序列篇】基于LSTM的序列分类-Pytorch实现 part2 自有数据集构建 【时间序列篇】基于LSTM的序列分类-Pytorch实现 part3 化为己用 在一个人体姿态估计的任务中&#xff0c;需要用深度学习模型…