Databend 开源周报第 146 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

支持 ExpressionScan 和 CacheScan

为进一步提高查询的效率和性能,Databend 近期支持了 ExpressionScan 和 CacheScan 。

  • ExpressionScan 允许在读取数据的同时,动态计算表达式或函数。
  • CacheScan 可以从 CacheSource::HashJoinBuil 读取数据,从而实现侧向语义。
select t1.a, v1.c1, v1.c2 from t1 
inner join lateral (values('t1_b', t1.b), ('t1_c', t1.c)) as v1 ("c1", "c2") on t1.a = v1.c2
inner join lateral (values('t1_b', t1.b), ('t1_c', v1.c1)) as v2 ("c1", "c2") on t1.a = v2.c2;

其执行计划如下: 

如果您想了解更多信息,欢迎联系 Databend 团队,或查看下面列出的资源。

  • PR 15561 | feat(planner): support ExpressionScan and CacheScan

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

了解 Embedded UDFs

Databend 利用用户定义的函数(UDF)提供向 SQL 查询中嵌入自定义操作的能力。其中 Embedded UDFs 允许开发者直接在 SQL 查询中嵌入和执行编程代码。

目前 Databend 支持使用 JavaScript 和 WASM 作为 Embedded UDFs 。

CREATE FUNCTION wasm_gcd (INT, INT) RETURNS INT LANGUAGE wasm HANDLER = 'wasm_gcd(int4,int4)->int4' AS $$@data/udf/test10_udf_wasm_gcd.wasm.zst$$;SELECTnumber,wasm_gcd((number * 3), (number * 6))
FROMnumbers(5)
WHERE(number > 0)
ORDER BY 1;

Docs | Embedded UDFs

Highlights

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • show grants 支持 where 和 limit 选项。
  • 支持毫秒级任务调度。
  • 为 OpenTelemetry 日志支持 HTTP 端点。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

为 UDF 增加 GRPC 接口

当前 Databend 的 UDF 服务封装在 Flight 服务中,当遇到连接问题时,很难判断这是网络问题还是服务器问题。

为了改善 Databend 在处理用户定义函数时的健壮性和透明度,需要提供一个内置的健康检查和信息报告方式,例如 Health.info() 接口。此接口将能够展示服务器中所有可用的 UDF 方法,从而简化问题的诊断过程。通过运行如下命令,用户可以快速检查服务状态:

grpcurl grpc.server.com:443 com.databend.udf.Health/info

Issue #15645 | feat: add a grpc info interface to UDF server framework

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 webdav-server: Read and write are not handled correctly · Issue #3231 · apache/opendal · GitHub 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:Releases · datafuselabs/databend · GitHub

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • Databend Website
  • GitHub Discussions
  • Twitter
  • Slack Channel

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/843978.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络编程基础知识

一、网络的相关概念 二、Ip 对于ipv4,是由4个字节(32位)表示,一个字节的范围是0~255,采用的是十进制表示ipv6的地址长度位128位,是ipv4的4倍,采用的是16进制表示查看ip地址:在命令行…

windows 下载redis (通过redis-server.exe启动服务)

下载链接: https://github.com/MicrosoftArchive/redis/releases 启动: 查看: 人工智能学习网站 https://chat.xutongbao.top

玩转STM32-I2C通信协议(详细-慢工出细活)

文章目录 一、I2C总线原理(掌握)1.1 硬件构成1.2 传输位1.3数据传输格式 二、STM32的I2C特性和结构三、STM32的I2C通信实现(硬件实现方式)3.1 I2C主模式 四、应用实例 一、I2C总线原理(掌握) 1.1 硬件构成…

day19--IO流(二)

day19-IO流(二) 一、字符流 同学们,前面我们学习了字节流,使用字节流可以读取文件中的字节数据。但是如果文件中有中文使用字节流来读取,就有可能读到半个汉字的情况,这样会导致乱码。虽然使用读取全部字…

【云原生 | 60】Docker中通过docker-compose部署kafka集群

目录 1、环境准备 1.1 安装docker 1.2 安装Docker Compose 2、docker-compose.yaml文件配置 3、system-config.properties文件配置 4、启动服务 1、环境准备 部署服务器的ip 可用的9093 9094 9095 2181端口 docker和docker-compose 1.1 安装docker 卸载旧版本&#x…

Harmony OS 开发指南——源码下载和编译

本文介绍了如何下载鸿蒙系统源码,如何一次性配置可以编译三个目标平台(Hi3516,Hi3518和Hi3861)的编译环境,以及如何将源码编译为三个目标平台的二进制文件。 坑点总结: 下载源码基本上没有太多坑&#xff…

C/C++利用指针变量输入输出数组元素

【算法代码】 通过指针变量 p 输入输出数组元素的代码如下所示。 #include <stdio.h>int main() {int a[6];int *p;for(pa; p<a6; p) scanf("%d",p); //通过指针变量p输入数组元素pa;for(pa; p<a6; p) printf("%d ",*p); //通过指针变量p输出…

爬虫案例-亚马逊反爬分析-验证码突破(x-amz-captcha)

总体概览&#xff1a;核心主要是需要突破该网站的验证码&#xff0c;成功后会返回我们需要的参数后再去请求一个中间页&#xff08;类似在后台注册一个session&#xff09;&#xff0c;最后需要注意一下 IP 是不能随意切换的 主要难点&#xff1a; 1、梳理整体反爬流程 2、验证…

【C++初阶】--- C++入门(中)

目录 一、缺省参数1.1 缺省参数概念1.2 缺省参数分类 二、函数重载2.1 函数重载概念2.2 C支持函数重载的原理 --- 名字修饰 三、引用3.1 引用概念3.2 引用特性3.3 常引用3.4 使用场景3.5 引用和指针的区别 一、缺省参数 1.1 缺省参数概念 缺省参数是声明或定义函数时为函数的…

leetcode438 找到字符串中所有字母的异位词

题目 给定两个字符串 s 和 p&#xff0c;找到 s 中所有 p 的 异位词 的子串&#xff0c;返回这些子串的起始索引。不考虑答案输出的顺序。 异位词 指由相同字母重排列形成的字符串&#xff08;包括相同的字符串&#xff09;。 示例 输入: s “cbaebabacd”, p “abc” 输…

数据挖掘与机器学习——回归分析

目录 回归分析定义&#xff1a; 案例&#xff1a; 线性回归 预备知识&#xff1a; 定义&#xff1a; 一元线性回归&#xff1a; 如何找出最佳的一元线性回归模型&#xff1a; 案例&#xff1a; python实现&#xff1a; 多元线性回归 案例&#xff1a; 线性回归的优缺…

大疆、猛犸、西圣无线麦克风哪个牌子好?大疆、西圣麦克风测评PK

在当今这个全民参与媒体创作的时代&#xff0c;视频分享已经崛起为引领流行文化的关键力量。随着自媒体领域的竞争日益白热化&#xff0c;要想在浩瀚的内容海洋中脱颖而出&#xff0c;创作出卓越的作品无疑是吸引观众目光的核心要素。然而想要成功打造这样的佳作&#xff0c;除…

学习Uni-app开发小程序Day21

学习了评分组件、自定义导航栏 评分组件uni-rate 这是需要达到的效果图&#xff0c;这里先分析下效果图&#xff0c; 1、图片是从布局中间弹出的&#xff0c;那这里就要用到uni-popup &#xff0c;设置type从中间弹出 2、这个弹出的顶部和上一张的顶部布局是一样的&#xff0c…

域名绑定ip和端口的方法是什么?

在互联网世界中&#xff0c;域名绑定IP和端口是实现网站精准访问的关键步骤。域名是用户访问网站的直观标识&#xff0c;而IP地址和端口号则指明了服务器的具体位置和通信接口。本文将详细介绍域名绑定IP和端口的过程。 域名与IP地址的关系 域名是互联网上网站的人类可读地址…

水电表远程抄表:智能化时代的能源管理新方式

1.行业背景与界定 水电表远程抄表&#xff0c;是随着物联网技术发展&#xff0c;完成的一种新型的能源计量管理方式。主要是通过无线传输技术&#xff0c;如GPRS、NB-IoT、LoRa等&#xff0c;将水电表的信息实时传输到云服务器&#xff0c;进而取代了传统人工当场抄水表。这种…

SBOM生成之CycloneDX

SBOM是一份信息详尽、机器可读的形式化清单&#xff0c;其中囊括了软件所有组件的详尽信息及它们之间的层级关系。 主流SBOM格式标准分别是SPDX、CycloneDX和SWIDCycloneDX格式&#xff1a;是一种轻量级的标准&#xff0c;专为应用安全和供应链组件分析而设计&#xff0c;专注于…

企业微信群营销SOP:打造高效、系统的营销流程

随着企业微信在企业营销中的广泛应用&#xff0c;构建一套高效、系统的微信群营销SOP&#xff08;Standard Operating Procedure&#xff0c;标准操作程序&#xff09;已成为企业提升营销效果、优化客户体验的关键。本文将深入探讨企业微信群营销SOP的重要性、构建方法以及实施…

目标检测——家庭日常用品数据集

引言 亲爱的读者们&#xff0c;您是否在寻找某个特定的数据集&#xff0c;用于研究或项目实践&#xff1f;欢迎您在评论区留言&#xff0c;或者通过公众号私信告诉我&#xff0c;您想要的数据集的类型主题。小编会竭尽全力为您寻找&#xff0c;并在找到后第一时间与您分享。 …

详解 Scala 面向对象相关知识

一、包 1. 作用 区分相同名字的类当类很多时&#xff0c;可以很好的管理类控制访问范围 2. 声明语法 // 第一种&#xff1a;与 Java 一致&#xff0c;以 . 作为层级划分 package package_name// 第二种&#xff1a;以 {} 作为层级划分 /*1. 一个源文件中可以声明多个 packa…

CentOS 7如何使用systemctl管理应用

说明&#xff1a;本文介绍如何使用systemctl命令的方式来启动、查看、停止和重启应用&#xff0c;以安装后的prometheus、alertmanager为例&#xff1b; Step1&#xff1a;创建文件 在系统/etc/systemd/system/路径下&#xff0c;创建一个xxx.service文件&#xff0c;该文件内…