Apache Doris 3.0.3 版本正式发布

亲爱的社区小伙伴们,Apache Doris 3.0.3 版本已于 2024 年 12 月 02 日正式发布。 该版本进一步提升了系统的性能及稳定性,欢迎大家下载体验。

  • GitHub 下载:https://github.com/apache/doris/releases

  • 官网下载:Apache Doris - Download | Easily deploy Doris anywhere - Apache Doris

行为变更

  • 禁止在具有同步物化视图的 MOW 表上进行列更新。#40190

  • 调整 RoutineLoad 的默认参数以提升导入效率。#42968

  • 当 StreamLoad 失败时,LoadedRows 的返回值调整为 0。#41946 #42291

  • 将 Segment cache 的默认内存限制调整为 5%。#42308 #42436

新特性

  • 引入 enable_cooldown_replica_affinity 会话变量,用以控制冷热分层副本的亲和性。#42677

Lakehouse

  • 新增 table$partition 语法,用于查询 Hive 表的分区信息。#40774 查看文档

  • 支持创建 Text 格式的 Hive 表。#41860 #42175 查看文档

异步物化视图

  • 引入新的物化视图属性 use_for_rewrite。当 use_for_rewrite 设置为 false 时,物化视图不参与透明改写。#40332

查询优化器

  • 支持关联非聚合子查询。#42236

查询执行

  • 增加了 ngram_searchnormal_cdfto_iso8601from_iso8601_dateSESSION_USER()last_query_id 函数。#38226 #40695 #41075 #41600 #39575 #40739

  • aes_encryptaes_decrypt 函数支持 GCM 模式。#40004

  • Profile 中输出变更的会话变量值。#41016 #41318

半结构化数据管理

  • 新增数组函数 array_match_allarray_match_any。#40605 #43514

  • 数组函数 array_agg 支持在 ARRAY 中嵌套 ARRAY/MAP/STRUCT。#42009

  • 新增近似聚合统计函数 approx_top_kapprox_top_sum。#44082

改进与优化

存储

  • 支持将 bitmap_empty 作为默认值。#40364

  • 引入 insert_timeout 会话变量,用以控制 DELETE 语句的超时时间。#41063

  • 改进部分错误提示信息。#41048 #39631

  • 改进副本修复的优先级调度。#41076

  • 提高了建表时对时区处理的鲁棒性。#41926 #42389

  • 在创建表时检查分区表达式的合法性。#40158

  • 在 DELETE 操作时支持 Unicode 编码的列名。#39381

存算分离

  • 存算分离模式支持 ARM 架构部署。#42467 #43377

  • 优化文件缓存的淘汰策略和锁竞争,提高命中率及高并发点查性能。#42451 #43201 #41818 #43401

  • S3 storage vault 支持 use_path_style,解决对象存储使用自定义域名的问题。#43060 #43343 #43330

  • 优化存算分离配置及部署,预防不同模式下的误操作。#43381 #43522 #43434 #40764 #43891

  • 优化可观测性,并提供删除指定 segment file cache 的接口。#38489 #42896 #41037 #43412

  • 优化 Meta-service 运维接口:RPC 限速及修复 tablet 元数据修正。#42413 #43884 #41782 #43460

Lakehouse

  • Paimon Catalog 支持阿里云 DLF 和 OSS-HDFS 存储。#41247 #42585 查看文档

  • 支持读取 OpenCSV 格式的 Hive 表。#42257 #42942

  • 优化了访问 External Catalog 中 information_schema.columns 表的性能。#41659 #41962

  • 使用新的 Max Compute 开放存储 API 访问 Max Compute 数据源。#41614

  • 优化了 Paimon 表 JNI 部分的调度策略,使得扫描任务更加均衡。#43310

  • 优化了 ORC 小文件的读取性能。#42004 #43467

  • 支持读取 brotli 压缩格式的 parquet 文件。#42177

  • information_schema 库下新增 file_cache_statistics 表,用于查看元数据缓存统计信息。#42160

查询优化器

  • 优化:当查询仅注释不同时,可以复用同一个 SQL Cache。#40049

  • 优化:提升了在数据频繁更新时统计信息的稳定性。#43865 #39788 #43009 #40457 #42409 #41894

  • 优化:提升常量折叠的稳定性。#42910 #41164 #39723 #41394 #42256 #40441

  • 优化:列裁剪可以生成更优的执行计划。#41719 #41548

查询执行

  • 优化了 sort 算子的内存使用。#39306

  • 优化了 ARM 下运算的性能。#38888 #38759

  • 优化了一系列函数的计算性能。#40366 #40821 #40670 #41206 #40162

  • 使用 SSE 指令优化 match_ipv6_subnet 函数的性能。#38755

  • 在 insert overwrite 时支持自动创建新的分区。#38628 #42645

  • 在 Profile 中增加了每个 PipelineTask 的状态。#42981

  • IP 类型支持 runtime filter。#39985

半结构化数据管理

  • 审计日志中输出 prepared statement 的真实 SQL。#43321

  • filebeat doris output plugin 支持容错、进度报告等。#36355

  • 倒排索引查询性能优化。#41547 #41585 #41567 #41577 #42060 #42372

  • 数组函数 array overlaps 支持使用倒排索引加速。#41571

  • IP 函数 is_ip_address_in_range 支持使用倒排索引加速。#41571

  • 优化 VARIANT 数据类型的 CAST 性能。#41775 #42438 #43320

  • 优化 Variant 数据类型的 CPU 资源消耗。#42856 #43062 #43634

  • 优化 Variant 数据类型的元数据和执行内存资源消耗。#42448 #43326 #41482 #43093 #43567 #43620

权限

  • LDAP 新增配置项 ldap_group_filter 用于自定义过滤 group。#43292

其他

  • FE 监控项中的连接数信息支持按用户分别显示。#39200

问题修复

存储

  • 修复 IPv6 hostname 使用问题。#40074

  • 修复 broker/s3 load 进度展示不准确问题。#43535

  • 修复查询从 FE 可能卡住的问题。#41303 #42382

  • 修复异常情况下自增 id 重复的问题。#43774 #43983

  • 修复 groupcommit 偶发 NPE 问题。#43635

  • 修复 auto bucket 计算不准确的问题。#41675 #41835

  • 修复 FE 重启时流控多表不能正确规划的问题。#41677 #42290

存算分离

  • 修复 MOW 主键表 delete bitmap 过大可能导致 coredump 的问题。#43088 #43457 #43479 #43407 #43297 #43613 #43615 #43854 #43968 #44074 #41793 #42142

  • 修复 segment 文件为 5MB 整数倍时上传对象失败的问题。#43254

  • 修复 aws sdk 默认重试策略不生效的问题。#43575 #43648

  • 修复 alter storage vault 时指定错误 type 也能继续执行的问题。#43489 #43352 #43495

  • 修复大事务延迟提交过程中 tablet_id 可能为 0 的问题。#42043 #42905

  • 修复常量折叠 RCP 以及 FE 转发 SQL 可能不在预期的计算组执行的问题。#43110 #41819 #41846

  • 修复 meta-service 接收到 RPC 时不严格检查 instance_id 的问题。#43253 #43832

  • 修复 FE follower information_schema version 没有及时更新的问题。#43496

  • 修复 file cache rename 原子性以及指标不准确的问题。#42869 #43504 #43220

Lakehouse

  • 禁止带有隐式转换的谓词条件下推给 JDBC 数据源,避免不一致的查询结果。#42102

  • 修复 Hive 高版本事务表的一些读取问题。#42226

  • 修复 Export 命令可能导致死锁的问题。#43083 #43402

  • 修复无法查询 Spark 创建的 Hive 视图的问题。#43552

  • 修复 Hive 分区路径中包含特殊字符导致分区裁剪有误的问题。#42906

  • 修复 Iceberg Catalog 无法使用 AWS Glue 的问题。#41084

异步物化视图

  • 修复基表重建后,异步物化视图可能无法刷新的问题。#41762

查询优化器

  • 修复使用多列 range 分区时,分区裁剪结果可能有误的问题。#43332

  • 修复部分 limit offset 场景下计算结果错误的问题。#42576

查询执行

  • 修复 hash join 时 array 类型的大小超过 4G 导致 BE Core 的问题。#43861

  • 修复 is null 谓词运算部分场景下结果不正确的问题。#43619

  • 修复 bitmap 类型在 hash join 时输出结果不正确的问题。#43718

  • 修复一些函数结果计算错误的问题。#40710 #39358 #40929 #40869 #40285 #39891 #40530 #41948 #43588

  • 修复一些 JSON 类型解析的问题。#39937

  • 修复 varchar 和 char 类型在 runtime filter 运算时的问题。#43758 #43919

  • 修复一些 decimal256 在标量函数和聚合函数里使用的问题。#42136 #42356

  • 修复 arrow flight 在连接时报 Reach limit of connections 错误的问题。#39127

  • 修复 k8s 环境下,BE 可用内存统计不正确的问题。#41123

半结构化数据管理

  • 调整 segment_cache_fd_percentageinverted_index_fd_number_limit_percent 的默认值。[#42224](https://github.com/apache/doris/pull/42224

  • logstash 支持 group_commit。#40450

  • 修复 build index 时 coredump 的问题。#43246 #43298

  • 修复 variant index 的问题。#43375 #43773

  • 修复后台 compaction 异常情况下可能出现的 fd 和内存泄漏。#42374

  • 倒排索引 match null 正确返回 null 而不是 false。#41786

  • 修复 ngram bloomfilter 索引 bf_size 设置为 65536 时 coredump 的问题。#43645

  • 修复复杂数据类型 JOIN 可能出 coredump 的问题。#40398

  • 修复 TVF JSON 数据 coredump 的问题。#43187

  • 修复 bloom filter 计算日期和时间的精度问题。#43612

  • 修复 IPv6 类型行存 coredump 的问题。#43251

  • 修复关闭 light_schema_change 时使用 VARIANT 类型 coredump 的问题。#40908

  • 提升高并发点查的 cache 性能。#44077

  • 修复删除列时 bloom filter 索引没有同步更新的问题。#43378

  • 修复 es catalog 在数组和标量混合数据等特殊情况下的不稳定问题。#40314 #40385 #43399 #40614

  • 修复异常正则匹配导致的 coredump 问题。#43394

权限

  • 修复若干权限授权之后无法正常限制的问题。#43193 #41723 #42107 #43306

  • 加强若干权限校验。#40688 #40533 #41791 #42106

其他

  • 补充了审计日志表和文件中缺失的审计日志字段。#43303 查看文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/889399.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

torchaudio.load 段错误

使用 torchaudio.load 时出现崩溃,如图 解决: 安装 ffmpeg ​conda install ffmpeg -c conda-forge 尝试但没解决问题的方法包括 重装 cuda,重装 pytorch,安装 PySoundFile、SoundFile、sox。

React 第十六节 useCallback 使用详解注意事项

useCallback 概述 1、useCallback 是在React 中多次渲染缓存函数的 Hook,返回一个函数的 memoized的值; 2、如果多次传入的依赖项不变,那么多次定义的时候,返回的值是相同的,防止频繁触发更新; 3、多应用在 父组件为函…

Chrome webdriver下载-避坑

WebDriver以原生的方式驱动浏览器,不需要调整环境变量。 一、window版 1.chrome和chromedriver下载地址: Chrome for Testing availability 我下载的是如下两个安装包,解压即可。 2.导包 pip install selenium然后用python代码引用即可…

PyQt事件机制练习

一、思维导图 二、代码 import sysfrom PyQt6.QtTextToSpeech import QTextToSpeech from PyQt6.QtWidgets import QApplication, QWidget, QLabel, QPushButton, QLineEdit from PyQt6 import uic from PyQt6.QtCore import Qt, QTimerEvent, QTimeclass MyWidget(QWidget):d…

【Rive】Android与Rive交互

1 Android与Rive交互的常用接口 1.1 RiveAnimationView参数 <app.rive.runtime.kotlin.RiveAnimationViewandroid:id"id/rive_view"android:layout_width"match_parent"android:layout_height"match_parent"android:adjustViewBounds"…

Maven、mybatis框架

一、Maven介绍 1.概念&#xff1a; Maven项目对象模型(POM)&#xff0c;可以通过一小段描述信息来管理项目的构建&#xff0c;报告和文档的项目管理工具软件。 2.为啥使用maven: 之前项目中需要引入大量的jar包。这些jar从网上下载&#xff0c;可能下载地址不同意。这些jar之间…

使用 Python 爬取某网站简历模板(bs4/lxml+协程)

使用 Python 爬取站长素材简历模板 简介 在本教程中&#xff0c;我们将学习如何使用 Python 来爬取站长素材网站上的简历模板。我们将使用requests和BeautifulSoup库来发送 HTTP 请求和解析 HTML 页面。本教程将分为两个部分&#xff1a;第一部分是使用BeautifulSoup的方法&am…

HCIA-Access V2.5_2_2网络通信基础_TCP/IP协议栈报文封装

TCP/IP协议栈的封装过程 用户从应用层发出数据先会交给传输层&#xff0c;传输层会添加TCP或者UDP头部&#xff0c;然后交给网络层&#xff0c;网络层会添加IP头部&#xff0c;然后交给数据链路层&#xff0c;数据链路层会添加以太网头部和以太网尾部&#xff0c;最后变成01这样…

数据湖治理最佳实践

如果没有最佳实践&#xff0c;存储可能会变得无法维护。自动化数据质量、生命周期和隐私功能可持续清理/移动数据湖中的数据。数据湖正成为企业从大数据中提取价值的一种日益可行的解决方案&#xff0c;对于早期采用者和新用户来说都是合理的下一步。在独立的逻辑区域中随时可用…

ssd202d-badblock-坏块检测

这边文章讲述的是坏快检测功能 思路&#xff1a; 1.第一次烧录固件会实现跳坏块&#xff0c;但是后续使用会导致坏块的产生&#xff1b; 于是我在uboot环境变量添加了两个变量来控制坏快 lb_badnum //坏块个数 lb_badoff //坏块所在位置 2.第一次开机会根据lb_badnum是否…

鸿蒙ArkTS如何实现数据可视化:饼状图/柱状图/折线图

鸿蒙数据可视化系列 在我们鸿蒙APP开发中&#xff0c;经常需要使用到一些图表的开发&#xff0c;本文主要介绍使用 McCharts 框架绘制柱状图的方法 配套指导视频地址&#xff1a;鸿蒙数据可视化系列-McCharts使用介绍_哔哩哔哩_bilibili 1. 第三方库介绍 1.1. McCharts Mc…

unity打包sdk热更新笔记

Unity3D项目Plugins目录组织 https://blog.csdn.net/linxinfa/article/details/102978005 IPreprocessBuild 继承提供打包前&#xff0c;打包后接口 BuildAssetBundles UnityWebRequest’s DownloadHandlerAssetBundle / LoadFromFile / LoadFromMemoryAsync 数据完整性校…

使用秘钥登录服务器

在我们测试或生产环境中&#xff0c;为了服务器安全性&#xff0c;有时可能需要以 SSH 密钥的方式登录服务器&#xff0c;接下来&#xff0c;将演示如何通过 SSH 私钥的方式来远程服务器。 一、远程服务器生成密钥对 1、首先在目标远程服务器下生成 SSH 密钥对 ssh-keygen然…

谷粒商城—分布式基础

1. 整体介绍 1)安装vagrant 2)安装Centos7 $ vagrant init centos/7 A `Vagrantfile` has been placed in this directory. You are now ready to `vagrant up` your first virtual environment! Please read the comments in the Vagrantfile as well as documentation on…

TimesFM(Time Series Foundation Model)安装(2)

TimesFM&#xff08;Time Series Foundation Model&#xff09;安装简介 readme TimesFM&#xff08;Time Series Foundation Model&#xff09;安装简介&#xff08;1&#xff09;-CSDN博客https://blog.csdn.net/chenchihwen/article/details/144359861?spm1001.2014.3001…

Cesium进阶教程——自定义图形、外观、绘图基础、现有着色器移植至Cesium、ShadowMapping、视频GIS、模型压平、卷帘

基础必看 https://blog.csdn.net/m0_55049655/article/details/139720401 参考路线 http://www.xt3d.online/tutorial/further/article.html 自定义图形 https://blog.csdn.net/m0_55049655/article/details/138908327 https://blog.csdn.net/m0_55049655/article/details/14…

国际荐酒师(香港)协会亮相第六届地博会助力中欧地标交流合作

国际荐酒师&#xff08;香港&#xff09;协会亮相第六届知交会暨地博会&#xff0c;助力中欧地理标志产品交流合作 12月9日&#xff0c;第六届粤港澳大湾区知识产权交易博览会暨国际地理标志产品交易博览会&#xff08;以下简称“第六届知交会暨地博会”&#xff09;在中新广州…

spring boot之@Import注解的应用

我们知道spring boot会通过ComponentScan定义包扫描路径进行业务定义的bean的加载&#xff0c;但是对于很多不在此包路径下定义的bean怎么办呢&#xff1f;比如其他jar包中定义的。这时候import就发挥作用了&#xff0c;通过它也可以实现bean的定义。具体是怎么做的呢&#xff…

【Liunx篇】基础开发工具 - vim

文章目录 一.vim的基本概念1.正常/命令模式2.插入模式3.底行模式/末行模式4.视图模式5.替换模式 二.vim的基本操作1.进入vim&#xff1a;2.退出vim: 三.vim正常模式命令集1.光标定位&#xff1a;2.复制/粘贴3.撤销4.剪切/删除5. 更改 四.vim底行模式命令集1.保存/退出2.调出行号…

Windows安装WSL子系统及docker,以及WSL和docker配置、使用及问题解决

在Windows操作系统中,Ubuntu子系统(也称为Windows Subsystem for Linux, WSL)为开发者提供了一个在Windows环境下运行Linux环境的平台。然而,有时用户在按照Ubuntu子系统或者使用WSL时,可能会遇到各种问题,下面总结一下解决方式。 想要在Windows上安装Docker(实际上是基…