DTC 2024回顾丨云和恩墨重塑数据库内核技术,革新企业降本增效之道

在数字化浪潮席卷全球的当下,关系型数据库作为市场主导力量的地位依然稳固。然而,面对新兴数据库与服务形态的挑战,以及企业日益强烈的降本增效需求,数据库技术的发展必须紧跟时代步伐,充分发挥资源效能以提升企业竞争力。在2024“数据技术嘉年华”主论坛上,云和恩墨下一代原生HTAP企业级数据库研发团队负责人金毅分享了其团队在关系型数据库内核技术革新方面的深度思考与实践。

ea35980603a19378d706d0142b7b2d47.jpeg

金毅首先引用了两个业界瞩目的案例:

  • 马斯克接手Twitter后,通过对IT方案进行优化,将部分对象存储下云,实现了IT运行成本的节约;

  • Snowflake与Databricks在公开媒体上就单位分析计算的成本进行对比。

这两个案例共同指向一个核心议题——企业竞争力来自其自身高效运营,降本增效成为关键。在此背景下,单纯提升数据库单系统性能而不计成本及能耗的做法无法满足企业降本增效的需求。金毅强调,其团队致力于实践一种新的技术路径,使客户能在降本增效层面取得实质性成效。

经典的数据库内核技术历经大半个世纪的发展,其设计理念和优化策略仍围绕着慢速磁盘I/O为中心。然而,随着现代硬件环境的巨大变迁,成本友好的通用现代硬件特征表现为众核大内存高速I/O,然而经典数据库内核并不能充分发挥现代硬件算力。正如Stonebraker等人于2007年在VLDB发表的论文《The End of An Architectural Era (It’s Time for a Complete Rewrite)》所指出,现代硬件具备使数据库交易负载提升两个数量级的潜力。至2013年,Stonebraker等人在VLDB发表的论文《Anti-Caching: A New Approach to Database Management System Architecture》进一步提出改进思路:当代数据库应从以前围绕磁盘I/O的优化思路,转向以内存中的业务数据为核心进行优化,利用大内存和快速I/O的优势,充分释放物理并行计算内核的潜力。

d34008de4d494d56f1b2faf005ec2fa1.png

据研究显示,在典型事务处理负载(TPCC)中,用于数据加工的有效计算仅占不足7%的CPU指令,其余大部分资源被用于诸如缓冲区管理、锁管理、预写日志等非直接相关计算任务。若能有效剔除这些关键路径上的计算成本,理论上交易负载性能可提升10倍以上。据此,金毅团队正在研发的下一代原生HTAP企业级数据库原型基于协程的并发计算框架,以低切换成本支持大规模并行计算会话,同时采用原位更新的内存优化实现MVCC,并着力解决全局热点访问问题。

b0e5ad9d7fc7705fe17c46ad77918c58.png

谈及为什么继达成交易负载优化技术验证后,选择HTAP作为该数据库的目标场景,金毅表示:“HTAP的应用场景和需求一直广泛存在,优秀的HTAP能力能有效简化客户IT方案,并降低成本。但由于不同业务负载的优化技术特点往往大不相同且存在冲突,不同工作负载间往往无法达成优化配置和技术实现共存,这也导致当前没有数据库产品能够高效率满足客户的HTAP混合业务需求。”因此,云和恩墨的数据库研发团队重新思考实践原生HTAP技术,实现在不同工作负载间取得性能与成本的最优化平衡。

原生HTAP体现于数据库将仅使用一份数据和一套执行引擎实现交易负载和分析负载的性能优化。其核心在于利用“数据温度”——即根据数据访问频次,将其划分为热数据与冷数据,确保热数据常驻内存,为交易型场景提供性能优化支持;冷数据则进入高速SSD磁盘;长期无交易负载访问的冷数据被“凝结”,实现针对分析型场景的性能优化。对此,金毅的团队采用了以下三方面技术思路:

  1. 基于数据温度的智能存储优化,确保资源高效配置;

  2. 统一计算引擎,融合标量和向量处理;

  3. 强化资源隔离与调度算法。

现如今,云和恩墨的下一代数据库产品针对联机处理负载的优化已经取得阶段性成果——使用2路服务器,在NVMe SSD磁盘存在I/O交换场景下,服务器端TPCC模拟负载达成单机吞吐4200万tpmTotal、1900万tpmC的成绩。该成绩初步达成相对于已有关系型数据库性能数量级提升的目标。这一突破性的进展将未来为企业带来更高效、更低成本的联机处理负载解决方案。

对于云和恩墨的数据库研发团队来说,“创新”是技术发展的第一要义。他们正以前所未有的勇气重构数据库内核,打破既有架构限制,意图实现数据库性能质的飞跃。随着这一创新内核技术的持续演进和落地应用,我们有理由相信,它将为企业数字化转型注入强劲动力,开启数据库性能与成本效益的新纪元。

【参考资料】

[1] M Stonebraker, N Hachem, P Helland, The End of An Architectural Era (It’s Time for a Complete Rewrite). In VLDB2007

[2] J DeBrabant, A Pavlo, S Tu, M Stonebraker, S Zdonik, Anti-Caching: A New Approach to Database Management System Architecture. In VLDB2013

[3] S Harizopoulos, D J Abadi, S Madden M Stonebraker, OLTP Through the Looking Glass, and What We Found There. In Sigmod2008

5984afbee90e36bc5c1d25c006f446ed.gif

数据驱动,成就未来,云和恩墨,不负所托!


云和恩墨创立于2011年,是业界领先的“智能的数据技术提供商”。公司总部位于北京,在国内外35个地区设有本地办公室并开展业务。

云和恩墨以“数据驱动,成就未来”为使命,致力于将创新的数据技术产品和解决方案带给全球的企业和组织,帮助客户构建安全、高效、敏捷且经济的数据环境,持续增强客户在数据洞察和决策上的竞争优势,实现数据驱动的业务创新和升级发展。

自成立以来,云和恩墨专注于数据技术领域,根据不断变化的市场需求,创新研发了系列软件产品,涵盖数据库、数据库存储、数据库云管和数据智能分析等领域。这些产品已经在集团型、大中型、高成长型客户以及行业云场景中得到广泛应用,证明了我们的技术和商业竞争力,展现了公司在数据技术端到端解决方案方面的优势。

在云化、数字化和智能化的时代背景下,云和恩墨始终以正和多赢为目标,感恩每一位客户和合作伙伴的信任与支持,“利他先行”,坚持投入于数据技术核心能力,为构建数据驱动的智能未来而不懈努力。

我们期待与您携手,共同探索数据力量,迎接智能未来。

2643a41322435aa3be9d62a1408270cc.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/16453.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【机器学习300问】99、多通道卷积神经网络在卷积操作时有哪些注意事项?

一、多通道卷积神经网络示例 还是以图像处理为例,如果你的目标不仅是分析灰度图像特性,还打算捕捉RGB彩色图像的特征。如下图,当面对一张66像素的彩色图像时,提及的“3”实际上是指红、绿、蓝三种颜色通道,形象地说&am…

书生·浦语第二期-笔记2

课程链接:https://github.com/InternLM/Tutorial/tree/camp2 视频地址:轻松玩转书生浦语大模型趣味Demo_哔哩哔哩_bilibili 大模型及InternLM介绍 大模型:人工智能领域中参数数量巨大、拥有庞大计算能力和参数规模的模型 特点&#xff1a…

【Linux杂货铺】进程通信

目录 🌈 前言🌈 📁 通信概念 📁 通信发展阶段 📁 通信方式 📁 管道(匿名管道) 📂 接口 ​编辑📂 使用fork来共享通道 📂 管道读写规则 &…

初中英语优秀作文分析-002Who stole the cupcake-谁偷了纸杯蛋糕?

更多资源请关注纽扣编程微信公众号 记忆树 1 One Sunday afternoon, Leslie was at home with her kids, 3-year-old Angel, 6-year-old Carl, and 7-year-old Tony. 翻译 一个周日的下午,Leslie和她的孩子们在家,他们是3岁的Angel,6岁的…

镜子摆放忌讳多

镜子是我们日常生活中不可或缺的物品。在风水中,镜子的作用非常多,能够起到一定的作用。镜子的摆放位置也是非常有讲究的,摆放不好会直接影响到家人的事业、财运、婚姻乃至健康等诸多方面。 第一个风水忌讳,镜子对大门。大门的正前…

Linux防火墙之iptables(二)

一.SNAT策略概述 1.SNAT 策略的典型应用环境 局域网主机共享单个公网IP地址接入Internet(私有IP不能在Internet中正常路由) 局域共享上网 2.SNAT 策略的原理 源地址转换,Source Network Address Translation 修改数据包的源地址 未作SNAT转换…

用three.js+echarts给公司写了一个站点数据大屏系统经验总结

时间过的好快,参加公司的新项目研发快一年了,五一机器人项目首秀,我们遇到了高并发集中下单情景,然后海量数据处理场景来了,给我在后端领域的高并发实践业务上画上了漂亮的一笔经验。人都是在磨练中成长,我很感谢这次给我的机会,虽然有点累,但也有点小成就。正好现在有…

AGI系列(1):掌握AI大模型提示词优化术,提问准确率飙升秘籍

当我们向AI大模型提问时,通常人们的做法是有什么问题,就直接去问,得到大模型的回复结果,时好时坏,完全没有可控性。 那么有没有一种方式或是一套方法,可以让我们向大模型提问时,得到的结果更准确…

nacos 2.3.3 Windows系统安装详细版

1,下载 https://github.com/alibaba/nacos/releases 2,解压 3,将nacos的内置库(derby),修改为我们自己的 mysql 3.1 创建一个数据库 3.2 连接数据库 3.3 执行mysql 脚本,在nacos的conf 目录下 mysql-schema.sql 执…

深入了解 Golang 多架构编译:交叉编译最佳实践

随着软件开发领域的不断发展,我们面临着越来越多的挑战,其中之一是如何在不同的平台和架构上部署我们的应用程序。Golang(Go)作为一种现代化的编程语言,具有出色的跨平台支持,通过其强大的多架构编译功能&a…

刷代码随想录有感(79):回溯算法——N皇后问题

题干: 代码&#xff1a; class Solution { public:vector<vector<string>> res;void backtracking(vector<string>& chessboard, int n, int row){if(row n){res.push_back(chessboard);return;}for(int col 0; col < n; col){if(isvalid(chessboa…

将3D检测的box框投影到BEV图片上

前言 点云数据作为一种丰富的三维空间信息表达方式&#xff0c;通常用于自动驾驶、机器人导航和三维建模等领域。然而&#xff0c;点云数据的直观性不如二维图像&#xff0c;这限制了它在一些需要快速视觉反馈的应用场景中的使用。本文将探讨如何将点云数据转换为二维图像&…

公共代理IP和独享代理IP之间的区别?

公共代理IP和独享代理IP在网络应用中扮演着不同的角色&#xff0c;它们之间的区别主要体现在使用方式、性能、安全性以及隐私保护等方面。以下是对这两种代理IP的详细对比和分析。 第一点就是使用的方式以及成本上的不同&#xff0c;公共代理IP&#xff0c;顾名思义&#xff0…

python基于深度学习的聊天机器人设计

python基于深度学习的聊天机器人设计 开发语言:Python 数据库&#xff1a;MySQL所用到的知识&#xff1a;Django框架工具&#xff1a;pycharm、Navicat、Maven 系统功能实现 登录注册功能 用户在没有登录自己的用户名之前只能浏览本网站的首页&#xff0c;想要使用其他功能都…

服务器被黑?快速检测和识别系统中的恶意进程

在管理和维护服务器时,检测和识别系统中的恶意进程是非常重要的。本文将详细介绍几种常用方法和工具,帮助您有效地检测和处理恶意进程,确保系统的安全性。 方法一:使用系统监控工具 1.1. 使用 ps 命令 ps 命令可以列出系统中所有正在运行的进程。使用以下命令查看特定用户…

SpringBoo+vue3整合讯飞星火3.5通过webscoket实现聊天功能(全网首发)附带展示效果

API版本&#xff1a;Spring Boot 整合讯飞星火3.5通过接口Api接口实现聊天功能&#xff08;首发&#xff09;复制粘贴即可使用&#xff0c;后续更新WebSocket实现聊天功能_讯飞星火web聊天-CSDN博客https://blog.csdn.net/qq_53722480/article/details/138865508?csdn_share_t…

STL库 —— unordered_set与unordered_map的封装

这里要对 unordered_set 与 unordered_map 进行封装&#xff0c;封装时使用的是上一篇中学的 HashBucket 。不仅要完成封装&#xff0c;同时要写入迭代器。 一、HashBucket 的修改 1.1 节点的修改 T 首先来认识一下使用 unordered_set 和 ordered_map 时的区别&#xff1a; …

深入浅出MySQL事务实现底层原理

重要概念 事务的ACID 原子性&#xff08;Atomicity&#xff09;&#xff1a;即不可分割性&#xff0c;事务中的操作要么全不做&#xff0c;要么全做一致性&#xff08;Consistency&#xff09;&#xff1a;一个事务在执行前后&#xff0c;数据库都必须处于正确的状态&#xf…

Java开发大厂面试第17讲:MySQL 的优化方案有哪些?数据库设计、查询优化、索引优化、硬件和配置优化等

性能优化&#xff08;Optimize&#xff09;指的是在保证系统正确性的前提下&#xff0c;能够更快速响应请求的一种手段。而且有些性能问题&#xff0c;比如慢查询等&#xff0c;如果积累到一定的程度或者是遇到急速上升的并发请求之后&#xff0c;会导致严重的后果&#xff0c;…