腾讯大数据 x StarRocks|构建新一代实时湖仓

2023 年 9 月 26 日,腾讯大数据团队与 StarRocks 社区携手举办了一场名为“构建新一代实时湖仓”的盛大活动。活动聚集了来自腾讯大数据、腾讯视频、腾讯游戏、同程旅行以及 StarRocks 社区的技术专家,共同深入探讨了湖仓一体技术以及其应用实践等多个备受瞩目的话题,观看人数两万+。

大数据未来发展趋势和方向是许多开发者都关心的议题。活动一开场,腾讯大数据产研负责人陈鹏以及镜舟科技 CTO 张友东以业界专家的视角进行了一场精彩的技术对谈。他们就当前大数据技术热点、湖仓技术发展以及未来湖仓一体技术的发展趋势表达了未来大数据将朝着“one data, all analytics”的方向发展。

腾讯作为国内领先的互联网企业,在湖仓一体方面有丰富的实践经验。通过尝试与摸索,腾讯大数据基于 StarRocks拓展和升级湖仓一体化的架构,为业务提供高性能、一站式的解决方案。在活动中,腾讯的大数据团队分享了他们在湖仓一体方面的先进经验,包括如何搭建湖仓融合架构,湖仓分析在腾讯视频业务场景中的应用以及腾讯游戏如何从Lambda 架构逐步演进至湖仓一体架构的技术进程。其中存算分离和数据冷热分层方面的最佳实践也给其他开发带来了极具价值的借鉴意义。

与此同时,同程旅行的周涛老师应邀介绍了同程旅行是如何通过引入 StarRocks 成功解决用户画像中的问题,提升查询效率并高效实现复杂查询。 本文将汇总此次技术交流活动的重要内容和视频资料,同时由衷感谢社区中的每一位小伙伴对此次活动的支持和积极参与。未来,我们将持续与大家分享更多高质量的技术内容!

技术对谈:开源开放与下一代湖仓

陈鹏 腾讯大数据产研负责人/腾讯大数据技术委员会执行委员

张友东 镜舟科技 CTO/StarRocks 技术指导委员会成员

在本次分享中,两位专家深入探讨了当前大数据技术的焦点议题,湖仓技术的发展历程,以及 StarRocks 和腾讯在湖仓一体化方面的演进历程。他们还谈到了未来湖仓一体技术的趋势。

陈鹏认为大数据技术的发展应该是一个逐步精炼的过程,大数据体系需要变得更加精细化,以使业务应用变得更容易。这需要在数据链路和大数据架构的共同作用下实现,而不仅仅依赖一两个技术点。因此,腾讯大数据正在朝着一体化的方向发展,这一体系包括4个横向和3个纵向的维度。4个横向是指软硬一体、资源一体、存储缓存一体和计算一体,这有助于构建更简单和优雅的数据架构。3个纵向是指通过实时湖仓、虚拟引擎和智能平台来实现大数据的全面自适应和自动化。

张友东认为目前数据量经历了爆发式增长,而大数据体系主要解决的问题是如何从海量数据中挖掘有价值的信息。在这一背景下,StarRocks 在朝着湖仓一体化方向演进的过程中,实现了一份数据支持所有分析场景,从而极大简化了数据分析的流程。这也与腾讯大数据的演进路线相一致。

总的来说,未来湖仓的发展趋势将趋向于数据库化,简化流程,实现一体化,从而推动智能化应用的发展。

技术对谈:开源开放与下一代湖仓

腾讯天穹一站式湖仓融合平台架构揭秘

陈九天 腾讯大数据高级工程师/StarRocks Active Contributor

本次分享九天首先探讨了目前业内在湖仓融合场景下遇到的问题:湖仓数据如何自由流转、湖仓数据如何做到融合查询、如何优化湖仓建模链路等,同时介绍了天穹 StarRocks 湖仓融合架构是如何解决以上问题,并大规模落地腾讯内部业务的。该架构在兼顾查询性能与存储成本的情况下,大大简化了用户的湖仓建模链路。

腾讯天穹一站式湖仓融合平台架构揭秘

同程旅行如何基于 StarRocks 实现用户画像分析

周涛 同程旅行数据中台负责人

2022年,同程旅行引入了 StarRocks,用于统一 OLAP 组件,并在公司内部广泛应用。目前,已成功应用于住宿、出行以及其他领域,包括BI看板、数据分析、指标系统、风险控制、反爬、用户营销和实时数据仓库等各业务领域。

本次分享重点介绍了 StarRocks 在同程旅行中的用户画像和 CDP(Customer Data Platform)应用实践。引入StarRocks 前,用户画像分析存在问题,如标签导入资源消耗大、导入操作影响查询性能、仅支持宽表查询,无法处理复杂关联和聚合查询。引入 StarRocks后,同程旅行优化了数据导入功能,显著提高了复杂查询速度,实现了明细表和位图表的高效关联,更好支持 CDP 人群分析和导出营销等关键功能。

同程旅行如何基于 StarRocks 实现用户画像分析

StarRocks 在腾讯视频的应用实践

赵轩 腾讯视频 数据工程中心 大数据开发高级工程师

本次主要向大家介绍了腾讯视频使用StarRocks在湖仓分析场景的上的应用实践,以及腾讯视频数据架构的演进历程。通过描述湖仓分析场景遇到的查询效率、湖仓分层模型构建等方面问题,分享了StarRocks基于Iceberg进行湖上分析的解决方案。此外,还介绍了StarRocks湖仓架构下分层模型建设方式以及数据冷热分离的存储方式;同时在应用实践上介绍了使用StarRocks构建指标服务,通过 Bitmap、聚合引擎、逻辑视图、指标加速等方式助力个性化数据分析,构建高效、易用、简单的湖仓架构以提升数据价值。

StarRocks 在腾讯视频的应用实践

腾讯游戏基于 StarRocks 的湖仓一体探索

黄奕文 腾讯游戏数据分析引擎研发工程师/StarRocks Active Contributor

本次分享奕文主要介绍了腾讯游戏从原有Lambda架构,基于StarRocks的数仓架构,基于StarRocks的湖仓一体架构的演进技术路线。围绕存算分离,数据冷热分层,湖仓一体体验优化等方面进行了重点建设;同时在落地实践阶段,针对异步物化视图,查询性能优化,离线导入性能进行了深入的打磨,从而实现兼顾性能和成本的易用湖仓一体化架构。

腾讯游戏基于 StarRocks 的湖仓一体探索

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/110799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3脚手架搭建

一.安装 vue3.0 脚手架 如果之前安装了2.0的脚手架,要先卸载掉,输入: npm uninstall vue-cli -g 进行全局卸载 1.安装node.js(npm) node.js:简单的说 Node.js 就是运行在服务端的 JavaScript。Node.js 是…

PCA降维

定义 主成分分析(PCA)是常用的线性数据降维技术,采用一种数学降维的方法,在损失很少信息的前提下,找出几个综合变量作为主成分,来代替原来众多的变量,使这些主成分能够尽可能地代表原始数据的信…

Android 13.0 系统开机屏幕设置默认横屏显示

1.概述 在13.0的系统产品开发中,对于产品需求来说,由于是宽屏设备所以产品需要开机默认横屏显示,开机横屏显示这就需要从 两部分来实现,一部分是系统开机动画横屏显示,另一部分是系统屏幕显示横屏显示,从这两方面就可以做到开机默认横屏显示了 2.系统开机设置默认横屏显…

【C++笔记】模板进阶

【C笔记】模板进阶 一、非类型模板参数二、类模板的特化三、模板的分离编译 一、非类型模板参数 我们之前学过的模板虽然能很好地帮我们实现泛型编程&#xff0c;比如我们可以让一个栈存储int类型的数据&#xff0c;一个栈存储double类型的数据&#xff1a; template <cla…

OpenCV14-图像平滑:线性滤波和非线性滤波

OpenCV14-图像平滑&#xff1a;线性滤波和非线性滤波 1.图像滤波2.线性滤波2.1均值滤波2.2方框滤波2.3高斯滤波2.4可分离滤波 3.非线性滤波3.1中值滤波3.2双边滤波 1.图像滤波 图像滤波是指去除图像中不重要的内容&#xff0c;而使关心的内容表现得更加清晰的方法&#xff0c;…

【MultiOTP】在Linux上使用MultiOTP进行SSH登录

在前面的文章中【FreeRADIUS】使用FreeRADIUS进行SSH身份验证已经了解过如何通过Radius去来实现SSH和SUDO的登录&#xff0c;在接下来的文章中只是将密码从【LDAP PASSWORD Googlt OTP】改成了【MultiOTP】生成的passcode&#xff0c;不在需要密码&#xff0c;只需要OTP去登录…

大鼠药代动力学(PK参数/ADME)+毒性 实验结果分析

在真实做实验的时候&#xff0c;出现了下面真实测试的一些参数&#xff0c;一起学习一下&#xff1a; 大鼠药代动力学&#xff1a; 为了进一步了解化合物 96 的药代动力学性质&#xff0c;我们选择化合物 500 进行 SD大鼠药代动力学评估。 经静脉注射和口服给药后观察大鼠血药…

广东广西大量工地建筑支模

近年来&#xff0c;广东广西地区的建筑工地发展迅猛&#xff0c;为满足日益增长的建筑需求&#xff0c;大量工地都需要使用支模模板。支模模板是建筑施工中不可或缺的重要工具&#xff0c;用于搭建楼层、梁柱等结构的模板系统。在广东广西&#xff0c;有许多专业的支模模板厂家…

TCP/IP(二十一)TCP 实战抓包分析(五)TCP 第三次握手 ACK 丢包

一 实验三&#xff1a;TCP 第三次握手 ACK 丢包 第三次握手丢失了,会发生什么? 注意: ACK 报文是不会有重传的,当 ACK 丢失了,就由对方重传对应的报文 ① 实验环境 ② 模拟方式 1、 服务端配置防火墙iptables -t filter -I INPUT -s 172.25.2.157 -p tcp --tcp-flag ACK…

基于Springboot服装商品管理系统免费分享

基于Springboot服装商品管理系统 作者: 公众号(擎云毕业设计指南) 更多毕设项目请关注公众号&#xff0c;获取更多项目资源。如需部署请联系作者 注&#xff1a;禁止使用作者开源项目进行二次售卖&#xff0c;发现必究&#xff01;&#xff01;&#xff01; 运行环境&…

Flink之Watermark水印、水位线

Watermark水印、水位线 水位线概述水印本质生成WatermarkWatermark策略WatermarkStrategy工具类使用Watermark策略 内置Watermark生成器单调递增时间戳分配器固定延迟的时间戳分配器 自定义WatermarkGenerator周期性Watermark生成器标记Watermark生成器Watermark策略与Kafka连接…

新版pycharm(2023.2.2)修改字体大小

下载了2023新版pycharm&#xff0c;想修改字体&#xff0c;发现找不到之前的setting入口&#xff0c;网上搜索也都是file-setting-editor这些&#xff0c;自己找了找&#xff0c;记录下 2023版pycharm的修改字体大小在file-Manage IDE Settings-Setting Sync… 里面&#xff0…

一篇文章带你弄懂编译和链接

一篇文章带你弄懂编译和链接 文章目录 一篇文章带你弄懂编译和链接一、环境二、翻译环境1.编译①预处理②编译③汇编 2.链接 三、运行环境 一、环境 翻译环境和运行环境 翻译环境&#xff1a;源代码被转换成可执行的机器指令。 运行环境&#xff1a;用于实际执行代码。 二、…

设计模式之抽象工厂模式

前言 工厂模式一般指的是简单工厂模式、工厂方法模式、抽象工厂模式&#xff0c;这是三种工厂模式的最后一篇&#xff0c;其他两种的文章链接如下&#xff1a; 设计模式之简单工厂模式-CSDN博客 设计模式之工厂方法模式-CSDN博客 建议三种模式放在一起对比学习&#xff0c;…

亚马逊测评关于IP和DNS的问题

最近不少人询问了关于IP和DNS的问题&#xff0c;在此进行一些科普。 当客户端试图访问一个网站时&#xff0c;首先会向其所在的ISP的DNS服务器进行查询。如果ISP的DNS服务器没有相关缓存&#xff0c;则会向上级DNS服务器进行查询。 一些诸如CDN之类的服务&#xff0c;可能会为…

云安全—责任共担

0x00 前言 云安全的职责范围实际上一直遵循的是&#xff0c;谁提供谁负责&#xff0c;如果交付给云消费者的时候&#xff0c;交付者使用过程中就要自行负责&#xff0c;也就是我们经常遇到的配置不当等问题&#xff0c;在三层服务模式中&#xff0c;责任互相嵌套&#xff0c;最…

IT运维管理系统在国有大型企业网络中的应用和可以解决的问题

随着国有大型企业业务的快速发展&#xff0c;网络运维管理面临着诸多挑战。本文将从问题概述、解决方案、监控易优势、实际案例和总结等方面阐述IT运维管理系统在国有大型企业网络中的应用和可以解决的问题。​IT运维管理系统&#xff1a;国有大型企业网络的变革者与解决之道 一…

MMKV源码解读与理解

概述 通过 mmap 技术实现的高性能通用 key-value 组件。同时选用 protobuf 协议&#xff0c;进一步压缩数据存储。 标准 protobuf 不提供增量更新的能力&#xff0c;每次写入都必须全量写入。考虑到主要使用场景是频繁地进行写入更新&#xff0c;我们需要有增量更新的能力&am…

批量修改视频尺寸:简单易用的视频剪辑软件教程

如果你需要批量修改视频尺寸&#xff0c;同时保持高质量的画质&#xff0c;那么“固乔剪辑助手”这款软件是你的不二之选。下面就是如何使用这款软件进行批量修改视频尺寸的详细步骤。 1. 首先&#xff0c;你需要在浏览器中进入“固乔科技”的官网&#xff0c;然后下载并安装“…

大数据 DataX 数据同步数据分析入门

目录 一、DataX 概览 1.1 DataX 是什么 1.2 DataX 3.0 概览 设计理念 当前使用现状 二、DataX 详解 2.1 DataX 3.0 框架设计 2.2 DataX 3.0 插件体系 2.3 DataX 3.0 核心架构 2.3.1 核心模块介绍 2.3.2 DataX 调度流程 2.4 DataX 3.0 的六大核心优势 2.4.1 可靠的…