Apache Doris 3.0.3 版本正式发布

亲爱的社区小伙伴们,Apache Doris 3.0.3 版本已于 2024 年 12 月 02 日正式发布。 该版本进一步提升了系统的性能及稳定性,欢迎大家下载体验。

  • GitHub 下载:https://github.com/apache/doris/releases

  • 官网下载:Apache Doris - Download | Easily deploy Doris anywhere - Apache Doris

行为变更

  • 禁止在具有同步物化视图的 MOW 表上进行列更新。#40190

  • 调整 RoutineLoad 的默认参数以提升导入效率。#42968

  • 当 StreamLoad 失败时,LoadedRows 的返回值调整为 0。#41946 #42291

  • 将 Segment cache 的默认内存限制调整为 5%。#42308 #42436

新特性

  • 引入 enable_cooldown_replica_affinity 会话变量,用以控制冷热分层副本的亲和性。#42677

Lakehouse

  • 新增 table$partition 语法,用于查询 Hive 表的分区信息。#40774 查看文档

  • 支持创建 Text 格式的 Hive 表。#41860 #42175 查看文档

异步物化视图

  • 引入新的物化视图属性 use_for_rewrite。当 use_for_rewrite 设置为 false 时,物化视图不参与透明改写。#40332

查询优化器

  • 支持关联非聚合子查询。#42236

查询执行

  • 增加了 ngram_searchnormal_cdfto_iso8601from_iso8601_dateSESSION_USER()last_query_id 函数。#38226 #40695 #41075 #41600 #39575 #40739

  • aes_encryptaes_decrypt 函数支持 GCM 模式。#40004

  • Profile 中输出变更的会话变量值。#41016 #41318

半结构化数据管理

  • 新增数组函数 array_match_allarray_match_any。#40605 #43514

  • 数组函数 array_agg 支持在 ARRAY 中嵌套 ARRAY/MAP/STRUCT。#42009

  • 新增近似聚合统计函数 approx_top_kapprox_top_sum。#44082

改进与优化

存储

  • 支持将 bitmap_empty 作为默认值。#40364

  • 引入 insert_timeout 会话变量,用以控制 DELETE 语句的超时时间。#41063

  • 改进部分错误提示信息。#41048 #39631

  • 改进副本修复的优先级调度。#41076

  • 提高了建表时对时区处理的鲁棒性。#41926 #42389

  • 在创建表时检查分区表达式的合法性。#40158

  • 在 DELETE 操作时支持 Unicode 编码的列名。#39381

存算分离

  • 存算分离模式支持 ARM 架构部署。#42467 #43377

  • 优化文件缓存的淘汰策略和锁竞争,提高命中率及高并发点查性能。#42451 #43201 #41818 #43401

  • S3 storage vault 支持 use_path_style,解决对象存储使用自定义域名的问题。#43060 #43343 #43330

  • 优化存算分离配置及部署,预防不同模式下的误操作。#43381 #43522 #43434 #40764 #43891

  • 优化可观测性,并提供删除指定 segment file cache 的接口。#38489 #42896 #41037 #43412

  • 优化 Meta-service 运维接口:RPC 限速及修复 tablet 元数据修正。#42413 #43884 #41782 #43460

Lakehouse

  • Paimon Catalog 支持阿里云 DLF 和 OSS-HDFS 存储。#41247 #42585 查看文档

  • 支持读取 OpenCSV 格式的 Hive 表。#42257 #42942

  • 优化了访问 External Catalog 中 information_schema.columns 表的性能。#41659 #41962

  • 使用新的 Max Compute 开放存储 API 访问 Max Compute 数据源。#41614

  • 优化了 Paimon 表 JNI 部分的调度策略,使得扫描任务更加均衡。#43310

  • 优化了 ORC 小文件的读取性能。#42004 #43467

  • 支持读取 brotli 压缩格式的 parquet 文件。#42177

  • information_schema 库下新增 file_cache_statistics 表,用于查看元数据缓存统计信息。#42160

查询优化器

  • 优化:当查询仅注释不同时,可以复用同一个 SQL Cache。#40049

  • 优化:提升了在数据频繁更新时统计信息的稳定性。#43865 #39788 #43009 #40457 #42409 #41894

  • 优化:提升常量折叠的稳定性。#42910 #41164 #39723 #41394 #42256 #40441

  • 优化:列裁剪可以生成更优的执行计划。#41719 #41548

查询执行

  • 优化了 sort 算子的内存使用。#39306

  • 优化了 ARM 下运算的性能。#38888 #38759

  • 优化了一系列函数的计算性能。#40366 #40821 #40670 #41206 #40162

  • 使用 SSE 指令优化 match_ipv6_subnet 函数的性能。#38755

  • 在 insert overwrite 时支持自动创建新的分区。#38628 #42645

  • 在 Profile 中增加了每个 PipelineTask 的状态。#42981

  • IP 类型支持 runtime filter。#39985

半结构化数据管理

  • 审计日志中输出 prepared statement 的真实 SQL。#43321

  • filebeat doris output plugin 支持容错、进度报告等。#36355

  • 倒排索引查询性能优化。#41547 #41585 #41567 #41577 #42060 #42372

  • 数组函数 array overlaps 支持使用倒排索引加速。#41571

  • IP 函数 is_ip_address_in_range 支持使用倒排索引加速。#41571

  • 优化 VARIANT 数据类型的 CAST 性能。#41775 #42438 #43320

  • 优化 Variant 数据类型的 CPU 资源消耗。#42856 #43062 #43634

  • 优化 Variant 数据类型的元数据和执行内存资源消耗。#42448 #43326 #41482 #43093 #43567 #43620

权限

  • LDAP 新增配置项 ldap_group_filter 用于自定义过滤 group。#43292

其他

  • FE 监控项中的连接数信息支持按用户分别显示。#39200

问题修复

存储

  • 修复 IPv6 hostname 使用问题。#40074

  • 修复 broker/s3 load 进度展示不准确问题。#43535

  • 修复查询从 FE 可能卡住的问题。#41303 #42382

  • 修复异常情况下自增 id 重复的问题。#43774 #43983

  • 修复 groupcommit 偶发 NPE 问题。#43635

  • 修复 auto bucket 计算不准确的问题。#41675 #41835

  • 修复 FE 重启时流控多表不能正确规划的问题。#41677 #42290

存算分离

  • 修复 MOW 主键表 delete bitmap 过大可能导致 coredump 的问题。#43088 #43457 #43479 #43407 #43297 #43613 #43615 #43854 #43968 #44074 #41793 #42142

  • 修复 segment 文件为 5MB 整数倍时上传对象失败的问题。#43254

  • 修复 aws sdk 默认重试策略不生效的问题。#43575 #43648

  • 修复 alter storage vault 时指定错误 type 也能继续执行的问题。#43489 #43352 #43495

  • 修复大事务延迟提交过程中 tablet_id 可能为 0 的问题。#42043 #42905

  • 修复常量折叠 RCP 以及 FE 转发 SQL 可能不在预期的计算组执行的问题。#43110 #41819 #41846

  • 修复 meta-service 接收到 RPC 时不严格检查 instance_id 的问题。#43253 #43832

  • 修复 FE follower information_schema version 没有及时更新的问题。#43496

  • 修复 file cache rename 原子性以及指标不准确的问题。#42869 #43504 #43220

Lakehouse

  • 禁止带有隐式转换的谓词条件下推给 JDBC 数据源,避免不一致的查询结果。#42102

  • 修复 Hive 高版本事务表的一些读取问题。#42226

  • 修复 Export 命令可能导致死锁的问题。#43083 #43402

  • 修复无法查询 Spark 创建的 Hive 视图的问题。#43552

  • 修复 Hive 分区路径中包含特殊字符导致分区裁剪有误的问题。#42906

  • 修复 Iceberg Catalog 无法使用 AWS Glue 的问题。#41084

异步物化视图

  • 修复基表重建后,异步物化视图可能无法刷新的问题。#41762

查询优化器

  • 修复使用多列 range 分区时,分区裁剪结果可能有误的问题。#43332

  • 修复部分 limit offset 场景下计算结果错误的问题。#42576

查询执行

  • 修复 hash join 时 array 类型的大小超过 4G 导致 BE Core 的问题。#43861

  • 修复 is null 谓词运算部分场景下结果不正确的问题。#43619

  • 修复 bitmap 类型在 hash join 时输出结果不正确的问题。#43718

  • 修复一些函数结果计算错误的问题。#40710 #39358 #40929 #40869 #40285 #39891 #40530 #41948 #43588

  • 修复一些 JSON 类型解析的问题。#39937

  • 修复 varchar 和 char 类型在 runtime filter 运算时的问题。#43758 #43919

  • 修复一些 decimal256 在标量函数和聚合函数里使用的问题。#42136 #42356

  • 修复 arrow flight 在连接时报 Reach limit of connections 错误的问题。#39127

  • 修复 k8s 环境下,BE 可用内存统计不正确的问题。#41123

半结构化数据管理

  • 调整 segment_cache_fd_percentageinverted_index_fd_number_limit_percent 的默认值。[#42224](https://github.com/apache/doris/pull/42224

  • logstash 支持 group_commit。#40450

  • 修复 build index 时 coredump 的问题。#43246 #43298

  • 修复 variant index 的问题。#43375 #43773

  • 修复后台 compaction 异常情况下可能出现的 fd 和内存泄漏。#42374

  • 倒排索引 match null 正确返回 null 而不是 false。#41786

  • 修复 ngram bloomfilter 索引 bf_size 设置为 65536 时 coredump 的问题。#43645

  • 修复复杂数据类型 JOIN 可能出 coredump 的问题。#40398

  • 修复 TVF JSON 数据 coredump 的问题。#43187

  • 修复 bloom filter 计算日期和时间的精度问题。#43612

  • 修复 IPv6 类型行存 coredump 的问题。#43251

  • 修复关闭 light_schema_change 时使用 VARIANT 类型 coredump 的问题。#40908

  • 提升高并发点查的 cache 性能。#44077

  • 修复删除列时 bloom filter 索引没有同步更新的问题。#43378

  • 修复 es catalog 在数组和标量混合数据等特殊情况下的不稳定问题。#40314 #40385 #43399 #40614

  • 修复异常正则匹配导致的 coredump 问题。#43394

权限

  • 修复若干权限授权之后无法正常限制的问题。#43193 #41723 #42107 #43306

  • 加强若干权限校验。#40688 #40533 #41791 #42106

其他

  • 补充了审计日志表和文件中缺失的审计日志字段。#43303 查看文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/889399.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

torchaudio.load 段错误

使用 torchaudio.load 时出现崩溃,如图 解决: 安装 ffmpeg ​conda install ffmpeg -c conda-forge 尝试但没解决问题的方法包括 重装 cuda,重装 pytorch,安装 PySoundFile、SoundFile、sox。

介绍一下CSS中伪类和伪元素的概念

一、伪类(Pseudo - Classes) 1. 定义 伪类是添加到选择器的关键字,用于定义元素的特殊状态。这些状态不是由文档树中的结构或属性来表示,而是基于用户行为(如鼠标悬停)、元素状态(如被选中&am…

React 第十六节 useCallback 使用详解注意事项

useCallback 概述 1、useCallback 是在React 中多次渲染缓存函数的 Hook,返回一个函数的 memoized的值; 2、如果多次传入的依赖项不变,那么多次定义的时候,返回的值是相同的,防止频繁触发更新; 3、多应用在 父组件为函…

Chrome webdriver下载-避坑

WebDriver以原生的方式驱动浏览器,不需要调整环境变量。 一、window版 1.chrome和chromedriver下载地址: Chrome for Testing availability 我下载的是如下两个安装包,解压即可。 2.导包 pip install selenium然后用python代码引用即可…

PyQt事件机制练习

一、思维导图 二、代码 import sysfrom PyQt6.QtTextToSpeech import QTextToSpeech from PyQt6.QtWidgets import QApplication, QWidget, QLabel, QPushButton, QLineEdit from PyQt6 import uic from PyQt6.QtCore import Qt, QTimerEvent, QTimeclass MyWidget(QWidget):d…

【Rive】Android与Rive交互

1 Android与Rive交互的常用接口 1.1 RiveAnimationView参数 <app.rive.runtime.kotlin.RiveAnimationViewandroid:id"id/rive_view"android:layout_width"match_parent"android:layout_height"match_parent"android:adjustViewBounds"…

Maven、mybatis框架

一、Maven介绍 1.概念&#xff1a; Maven项目对象模型(POM)&#xff0c;可以通过一小段描述信息来管理项目的构建&#xff0c;报告和文档的项目管理工具软件。 2.为啥使用maven: 之前项目中需要引入大量的jar包。这些jar从网上下载&#xff0c;可能下载地址不同意。这些jar之间…

使用 Python 爬取某网站简历模板(bs4/lxml+协程)

使用 Python 爬取站长素材简历模板 简介 在本教程中&#xff0c;我们将学习如何使用 Python 来爬取站长素材网站上的简历模板。我们将使用requests和BeautifulSoup库来发送 HTTP 请求和解析 HTML 页面。本教程将分为两个部分&#xff1a;第一部分是使用BeautifulSoup的方法&am…

什么是厄尔米特(Hermitian)矩阵?

厄米矩阵&#xff08;Hermitian Matrix&#xff09;定义 在数学和物理中&#xff0c;厄米矩阵是满足以下条件的复方阵&#xff1a; A A † \mathbf{A}\mathbf{A}^\dagger AA† 其中&#xff0c; A † \mathbf{A}^\dagger A†表示矩阵 A \mathbf{A} A的共轭转置&#xff0c;即…

HCIA-Access V2.5_2_2网络通信基础_TCP/IP协议栈报文封装

TCP/IP协议栈的封装过程 用户从应用层发出数据先会交给传输层&#xff0c;传输层会添加TCP或者UDP头部&#xff0c;然后交给网络层&#xff0c;网络层会添加IP头部&#xff0c;然后交给数据链路层&#xff0c;数据链路层会添加以太网头部和以太网尾部&#xff0c;最后变成01这样…

爬虫获取的数据能否用于商业分析?

根据搜索结果&#xff0c;爬虫获取的数据能否用于商业分析&#xff0c;主要取决于以下几个因素&#xff1a; 数据的合法性与合规性&#xff1a; 爬虫技术本身并不违法&#xff0c;关键在于使用的方式和目的。爬虫技术的使用必须遵守相关法律法规&#xff0c;如《反不正当竞争法…

数据湖治理最佳实践

如果没有最佳实践&#xff0c;存储可能会变得无法维护。自动化数据质量、生命周期和隐私功能可持续清理/移动数据湖中的数据。数据湖正成为企业从大数据中提取价值的一种日益可行的解决方案&#xff0c;对于早期采用者和新用户来说都是合理的下一步。在独立的逻辑区域中随时可用…

《Vue进阶教程》第六课:computed()函数详解(上)

往期内容&#xff1a; 《Vue零基础入门教程》合集&#xff08;完结&#xff09; 《Vue进阶教程》第一课&#xff1a;什么是组合式API 《Vue进阶教程》第二课&#xff1a;为什么提出组合式API 《Vue进阶教程》第三课&#xff1a;Vue响应式原理 《Vue进阶教程》第四课&#…

根据PDF模板单个PDF导出到浏览器和多个PDF打包ZIP导出到浏览器

一、单个PDF导出到浏览器 /*** * param templatePath 模板路径* param fileName 文件名称* param data 填充文本* param images 填充图片* param response* throws IOException*/public static void generateTempPDF(String templatePath, String fileName, Map<String, S…

ssd202d-badblock-坏块检测

这边文章讲述的是坏快检测功能 思路&#xff1a; 1.第一次烧录固件会实现跳坏块&#xff0c;但是后续使用会导致坏块的产生&#xff1b; 于是我在uboot环境变量添加了两个变量来控制坏快 lb_badnum //坏块个数 lb_badoff //坏块所在位置 2.第一次开机会根据lb_badnum是否…

Tornado 异步编程全解析

一、Tornado 异步基础 核心概念 IOLoop&#xff1a; 是 Tornado 的核心事件循环&#xff0c;负责处理网络 I/O、定时器等事件。它不断地循环监听事件&#xff0c;一旦有事件就绪就调用相应的回调函数。可以在一个进程中创建多个 IOLoop&#xff0c;但通常一个应用使用一个主 IO…

Windows桌面系统管理2:VMware Workstation使用和管理

Windows桌面系统管理0:总目录-CSDN博客 Windows桌面系统管理1:计算机硬件组成及组装-CSDN博客 Windows桌面系统管理2:VMware Workstation使用和管理 Windows桌面系统管理3:Windows 10操作系统部署与使用-CSDN博客 Windows桌面系统管理4:Windows 10操作系统运维管理-…

鸿蒙ArkTS如何实现数据可视化:饼状图/柱状图/折线图

鸿蒙数据可视化系列 在我们鸿蒙APP开发中&#xff0c;经常需要使用到一些图表的开发&#xff0c;本文主要介绍使用 McCharts 框架绘制柱状图的方法 配套指导视频地址&#xff1a;鸿蒙数据可视化系列-McCharts使用介绍_哔哩哔哩_bilibili 1. 第三方库介绍 1.1. McCharts Mc…

基于go语言的开源调度系统整理

pink https://github.com/busgo/pink 通过Web界面管理操作简单方便&#xff0c;支持各种任务 高可用可以部署 n 台调度集群节点&#xff0c;保证没有单点故障。 部署简单、仅仅需要一个执行文件即可运行。 集成方便&#xff0c;统一语言无关的任务抽象&#xff0c;接入不同语言…

多个终端查看的history不一样,如何确保多个终端会话之间的 history 一致,减少历史记录差异

问题&#xff1a; 在使用 Linux 系统时&#xff0c;history 命令显示的历史记录通常是与当前终端会话相关的。这就意味着&#xff0c;如果你在多个终端中打开会话&#xff0c;它们显示的历史记录可能不完全相同。这个问题通常是由以下原因引起的&#xff1a; 原因&#xff1a…