2024可信数据库发展大会|存算分离架构驱动电信数据平台革新

7 月 16 日 - 17 日,由中国通信标准化协会和中国信息通信研究院主办,大数据技术标准推进委员会承办,InfoQ 联合主办的「2024 可信数据库发展大会」(TDBC)在北京召开。


酷克数据解决方案架构师吴昊受邀参与“电信行业数据库应用创新分论坛”,并发表《存算分离架构:加速电信行业数据处理,驱动业务创新》主题演讲,深入剖析了当前电信行业在数据平台建设过程中面临的挑战,并分享了存算分离架构的 HashData 云数仓在电信行业的方案与成果。

69ed5ea63e4f7b40d760de9f4d2e1051.jpeg


吴昊指出,移动互联网的发展导致电信行业数据量激增,这对数据平台的建设提出了前所未有的挑战。从解决单点业务问题到垂直大数据应用,再到企业级大数据中心的构建,这一系列的演变,不仅要求数据平台在数据处理和业务支撑上具备更强的能力,更重要的是,催生了一种全新的数据思维。在这种新思维下,数据洞察不再依存于基于复杂模型的抽样理论,而是基于全量数据进行分析,进行全量计算,从而降低对复杂模型的依赖。


这要求数据平台必须拥有出色的处理能力和高度的灵活性,以便能够迅速适应不断变化的数据环境和业务需求。然而,传统的 MPP 数据库由于采用了存储与计算紧密耦合的架构,导致其弹性伸缩能力不足,难以满足当前数字化转型需求。为了解决这些挑战,需要采用新的技术架构和管理方法,以提高数据平台的灵活性、可扩展性和安全性。


针对上述挑战,吴昊详细介绍了基于存算分离架构的 HashData 云原生数据仓库的独特优势。他强调,HashData 采用元数据、计算和存储三者分离的架构,能够更好地适应跨集群、跨中心以及跨云中心的数据访问。



f22aea4595b63965cecc24baed1969da.jpeg


HashData 利用统一的元数据和存储服务,构建了具有权威性的企业级数据视图,使得多个计算集群能够无缝共享数据。借助云端资源的灵活伸缩性,不仅显著提升了运维效率,还降低了系统复杂度,并成功消解了木桶效应等潜在问题。基于存算分离和云原生架构,目前 HashData 部署的最大规模已达到 35000 节点,能够根据业务需求动态地分配资源,从而实现了计算资源的高效利用与弹性扩展。


•多形态数据集中存储能力,打破数据存储孤岛:非结构化多模态数据涵盖范围广,管理过程复杂。HashData 引入 Directory Table 目录表,存储和管理非结构化数据对象的元数据,这些元数据以结构化的形式存在 ,元数据信息与共享存储上的非结构化数据文件本身形成关联关系,用户可以使用熟悉的 SQL 语句来操作 Directory Table 和普通表。



89910739570736b9f0b68930969e3202.jpeg


•利用外部表/连接器集成大数据生态,融入企业湖仓架构:面对日益多样化的数据分析场景,HashData 云数仓提供湖仓一体技术方案,数据可以在湖仓之间高效互通,支持多种数据类型存储,从架构上真正实现了湖仓一体,减少用户重复建设成本。HashData 可以同步 Hive、Hudi、Iceberg 元数据,建立外部表,并行访问大数据生态数据,参与 SQL 计算,并将数据缓存在计算节点,供后续使用。


d732df2a24ea56afdc6dcc434e525684.jpeg


•多样化分析计算能力—HashML 引擎:AI 技术的兴起为我们提供了新的机遇。HashData 基于 In-Database AI 的理念,内置功能丰富的 AI 开发工具箱 HashML,在一套架构下同时提供了面向 SQL 查询分析任务的 MPP 计算引擎和面向机器学习和深度学习任务的 ML/DL 计算引擎,赋能用户在数据查询处理、高级分析、机器学习、深度学习等场景的一站式、多层次融合分析和 AI 能力,帮助企业快速开发大模型等 AI 应用。


•存算分离的弹性架构,克服传统 MPP 局限性:HashData 通过独特的元数据、计算与存储分离架构,实现了计算集群的按需搭建与横向扩展,从而有效突破了传统 MPP 数据库在并发和计算能力上的局限。基于云原生能力,让计算、存储实现秒级独立伸缩,多个计算集群间共享同一份元数据信息,从而支撑企业业务的灵活扩展,确保工作负载在峰值场景下平稳运行。在保证了数据的一致性的同时,更节省存储和调用资源,大幅降低系统建设和维护成本。


吴昊进一步分享了 HashData 在电信行业的实际应用案例:


•基于信创底座构建湖仓融合的数据中台:某大型运营商选用 HashData 进行数据中台信创升级改造。HashData 运用云原生技术重构大数据算力调度引擎,并基于客户信创底座构建多样化分析平台。该平台融合现有大数据体系,支持批量和准实时分析,采用联邦 HDFS 统一存储、管理多源异构数据,实现数据一次入湖、直观分析。同时,支持多引擎融合,允许用户根据需求灵活选择计算引擎,并能根据租户需求隔离计算业务集群,弹性调整算力。基于存算分离架构,该平台能够满足各类业务场景的技术需求,实现业务资源需求快速交付,历史数据平滑过渡,核心技术自主可控,为用户业务增长提供了强有力的支持。


•基于 K8S 打造云原生数据平台:某运营商联合酷克数据团队,突破以往容器化仅用于无状态应用场景或开发测试环境的限制,采用 K8S+HashData 的技术路线,在国内率先建成真实生产环境下的容器化部署大规模云原生数据仓库。相比原有数据平台,基于容器化部署的 HashData 云数仓,具备高可用、高并发、计算资源水平无限扩展、秒级扩缩容等能力,扩缩容期间不影响业务连续性,实现了计算资源快速部署、高效交付的建设目标。


最后,吴昊展望了存算分离架构在电信行业的广阔前景。他认为,随着技术的不断进步和业务的持续发展,存算分离架构将在更多领域发挥重要作用。酷克数据也将继续致力于云端数据仓库的研发与应用推广,为电信行业乃至整个社会的数字化转型贡献更多力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/46682.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法-计数质数

题目: 给定整数 n ,返回 所有小于非负整数 n 的质数的数量 。 思路: 使用埃式筛法 当n大于等于2时,如果当前遍历的数 i 是质数,那么从 i*i 开始,直到 n 为止,把 i 的倍数都标记为合数 代码&a…

为什么提示词写作技能会让生成式AI工程师更上一层楼?

欢迎来到云闪世界。 “为什么我的经理对我的文章吹毛求疵?把措辞从 X 改为 Y 有什么区别?” 当你看到你的经理在你的文档中提出了无数建议时,你可能发现自己有这样的想法;我知道我有过。事实上,我曾经认为写作是数据科…

npm安装依赖包报错,npm ERR! code ENOTFOUND

一、报错现象: npm WARN registry Unexpected warning for https://registry.npmjs.org/: Miscellaneous Warning ETIMEDOUT: request to https://registry.npmjs.org/vue failed, reason: connect ETIMEDOUT 104.16.23.35:443 npm WARN registry Using stale data…

“点点通“餐饮点餐小程序-计算机毕业设计源码11264

"点点通"餐饮点餐小程序 XXX专业XX级XX班:XXX 指导教师:XXX 摘要 随着中国经济的飞速增长,消费者的智能化水平不断提高,许多智能手机和相关的软件正在得到更多的关注和支持。其中,微信的餐饮点餐小程序更…

《Exploring Aligned Complementary Image Pair for Blind Motion Deblurring》

这篇论文的标题《Exploring Aligned Complementary Image Pair for Blind Motion Deblurring》可以翻译为《探索对齐的互补图像对用于盲运动去模糊》。从标题可以推断,论文的焦点在于开发一种算法或技术,利用成对的图像来解决运动模糊问题,特别是在不知道模糊核(即造成模糊…

wifi preamble code, 前导码

WiFi packets 很神奇,自从802.11 协议诞生以来 就对信息传输 产生了无尽的影响, 闲来无事 看看wireless 空口包 发现 前导码 非常奇怪。 为什么前导码有两部分组成, 1. radiotap header 2. 802.11 radio information 并且 radiotap 是有在…

AIGC工具:IPAdapter和ControlNet 指导控制生成工具

ControlNet强调对生成过程的直接控制,如通过线条、边缘、形状等信息;而IPAdapter侧重于风格迁移和内容的间接引导。 IPAdapter 它专注于通过迁移图片风格来生成新的图像内容。IPAdapter的强项在于能够将一张图片的风格迁移到另一张图片上,实现风格融合,甚至可以进行多图风格…

CS110L(Rust)

1.Rust 语法总结 数值类型 有符号整数: i8, i16, i32, i64无符号整数: u8, u16, u32, u64 变量声明 声明变量: let i 0; // 类型推断let n: i32 1; // 显式类型声明 可变变量: let mut n 0; n n 1; 字符串 注意,let s: str "Hello world";…

React@16.x(62)Redux@4.x(11)- 中间件2 - redux-thunk

目录 1,介绍举例 2,原理和实现实现 3,注意点 1,介绍 一般情况下,action 是一个平面对象,并会通过纯函数来创建。 export const createAddUserAction (user) > ({type: ADD_USER,payload: user, });这…

WEB前端07-DOM对象

DOM模型 1.DOM概念 文档对象模型属于BOM的一 部分,用于对BOM中的核心对象document进行操作,它是一种与平台、语言无关的接口,允许程序和脚本动态地访问或更新HTML、XML文档的内容、结构和样式,且提供了一系列的函数和对象来实现…

工作边界感

工作边界 **明确工作边界****尊重他人的工作边界**:**建立有效的沟通机制**:**制定明确的规则和流程**:**保持开放和包容的心态**:**寻求专业支持**: 在程序员的日常工作中,会遇到很多边界问题。如果这些边…

【人工智能大模型】文心一言介绍以及基本使用指令

目录 一、产品背景与技术基础 二、主要功能与特点 基本用法 指令的使用 注意事项 文心一言(ERNIE Bot)是百度基于其文心大模型技术推出的生成式AI产品。以下是对文心一言的详细介绍: 一、产品背景与技术基础 技术背景:百度…

NOMAD: Non-Exclusive Memory Tiering via Transactional Page Migration——论文泛读

OSDI 2024 Paper CXL论文阅读笔记整理 问题 随着可字节寻址存储设备的出现,如CXL内存、持久内存和存储类内存,分层存储系统已成为现实,不同层具有不同的特性,如速度、大小、功耗和成本。分层内存管理的核心是操作系统&#xff0…

vmware虚拟机中,Centos安装Docker,解决国内无法访问

背景 本文主要解决了centos 的yum源 无法更新 和 docker的 源 国内无法访问的问题。 本文环境:windows宿主机装了vmware虚拟机,虚拟机中安装了Centos,centos内装docker。其实可以直接在window装docker desktop for windows,但…

VS C#类文件自动生成头部注释

VS C#类文件自动生成头部注释(以VS2019为例) 1、更新位置 E:\VS2019\vs_2019\Common7\IDE\ItemTemplates\CSharp\Code\2052\Class 2、替换Class 原始文件 using System; using System.Collections.Generic; $if$ ($targetframeworkversion$ > 3.5…

【代码随想录】【算法训练营】【第58天 3】 [卡码103]水流问题 [卡码104]建造最大岛屿

前言 思路及算法思维,指路 代码随想录。 题目来自 卡码网。 day 58,周四,ding~ 题目详情 [卡码103] 水流问题 题目描述 卡码103 水流问题 LeetCode类似题目417 太平洋大西洋水流问题 解题思路 前提: 思路: 重…

Qt 制作安装包

记录使用Qt工具制作一个安装包的过程 目录 1.准备工作 1.1检查Qt Installer Frameworks是否安装 1.2.安装Qt Installer Frameworks 1.3准备release出来的exe dll等文件 2.创建打包工程所需要的文件及目录 2.1创建子目录 2.2 创建工程文件 2.3 创建config/config.xml …

创建鸿蒙手机模拟器(HarmonyOS Emulator)

文 | Promise Sun 一.前提条件: 鸿蒙项目开发需要使用模拟器进行开发测试,但目前想在DevEco Studio开发工具中使用模拟器就必须到华为官网进行报名申请,参加“鸿蒙模拟器(HarmonyOS Emulator)Beta活动申请”。 申请审…

计算机课设——基于Java web的超市管理系统

smbms_java_web 基于Java web的超市管理系统,数据库课程设计 1.引言 是一个基于Java Web连接MySQL的小项目。 超市管理系统(smbms)作为每个计算机专业的大学生都是一个很好的练手项目,逻辑层次分明,基础功能包括用户的登录和注销&#xff…

【日常记录】【插件】excel.js导出的时候给单元格设置下拉选择、数据校验等

文章目录 1. 代码基本结构2. 导出的excel 某单元格的值设置为下拉选择3. 如何把下拉选择项设置为动态4. 单元格设置校验、提示5. 在WPS上的设置 1. 代码基本结构 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><…