calcite mysql_Apache顶级项目 Calcite使用介绍

原标题:Apache顶级项目 Calcite使用介绍

什么是Calcite

Apache Calcite是一个动态数据管理框架,它具备很多典型数据库管理系统的功能,比如SQL解析、SQL校验、SQL查询优化、SQL生成以及数据连接查询等,但是又省略了一些关键的功能,比如Calcite并不存储相关的元数据和基本数据,不完全包含相关处理数据的算法等。

也正是因为Calcite本身与数据存储和处理的逻辑无关,所以这让它成为与多个数据存储位置(数据源)和多种数据处理引擎之间进行调解的绝佳选择。

Calcite所做的工作就是将各种SQL语句解析成抽象语法树(AST Abstract Syntax Tree),并根据一定的规则或成本对AST的算法与关系进行优化,最后推给各个数据处理引擎进行执行。

目前,使用Calcite作为SQL解析与优化引擎的又Hive、Drill、Flink、Phoenix和Storm,Calcite凭借其优秀的解析优化能力,会有越来越多的数据处理引擎采用Calcite作为SQL解析工具。

Calcite 主要功能

Calcite的主要功能我们上面其实已经提到了,主要有以下功能:

SQL解析:通过JavaCC将SQL解析成未经校验的AST语法树

SQL校验:校验分两部分,一种为无状态的校验,即验证SQL语句是否符合规范;一种为有状态的即通过与元数据结合验证SQL中的Schema、Field、Function是否存在。

SQL查询优化:对上个步骤的输出(RelNode)进行优化,得到优化后的物理执行计划

SQL生成:将物理执行计划生成为在特定平台/引擎的可执行程序,如生成符合Mysql or Oracle等不同平台规则的SQL查询语句等

数据连接与执行:通过各个执行平台执行查询,得到输出结果。

所以在Calcite中,一条SQL的处理步骤就很清晰了,那么我们通过Calcite的代码来实际了解一下:

// 初始化配置

SqlParser.ConfigBuilder configBuilder = SqlParser.configBuilder();

configBuilder.setUnquotedCasing(Casing.UNCHANGED);

//Sql解析:解析Sql语句,通过JavaCC解析成AST语法树,表现为SqlNode

SqlParser sqlParser = SqlParser.create(sql, configBuilder.build());

SqlNode sqlNode = sqlParser.parseQuery();

//Sql校验:结合元数据信息验证Sql是否符合规范

Planner planner = Frameworks.getPlanner(config);

SqlNode node = planner.validate(sqlNode);

//Sql查询优化:将SqlNode转换为LogicalPlan,表现为RelNode

RelRoot relRoot = planner.rel(node);

RelNode project = relRoot.project();

//指定优化规则

final HepProgram program = new HepProgramBuilder()

.addRuleInstance(SubQueryRemoveRule.PROJECT)

.addRuleInstance(SubQueryRemoveRule.FILTER)

.addRuleInstance(SubQueryRemoveRule.JOIN)

.build();

//生成优化后的RelNode

HepPlanner prePlanner = new HepPlanner(program);

prePlanner.setRoot(project);

RelNode relNode = prePlanner.findBestExp();

//ToDo 执行查询

使用Calcite

那么前面对Calcite进行了简单的介绍,我们如何使用Calcite呢?Calcite的使用非常简单,你要做的只是添加数据源即可。我们以Mysql数据源为例,我们通过添加Mysql数据库作为Calcite的数据源,实现通过Calcite对Mysql数据进行查询的Demo。

//创建Calcite Connection对象

Class.forName(org.apache.calcite.jdbc.Driver);

Properties info = new Properties();

info.setProperty(lex, JAVA);

Connection connection =

DriverManager.getConnection(jdbc:calcite:, info);

CalciteConnection calciteConnection =

connection.unwrap(CalciteConnection.class);

SchemaPlus rootSchema = calciteConnection.getRootSchema();

//创建Mysql的数据源schema

Class.forName(com.mysql.jdbc.Driver);

BasicDataSource dataSource = new BasicDataSource();

dataSource.setUrl(jdbc:mysql://localhost);

dataSource.setUsername(username);

dataSource.setPassword(password);

Schema schema = JdbcSchema.create(rootSchema, hr, dataSource,

null, name);

rootSchema.add(hr, schema);

//执行查询

Statement statement = calciteConnection.createStatement();

ResultSet resultSet = statement.executeQuery(

select d.deptno, min(e.empid)\n

+ from hr.emps as e\n

+ join hr.depts as d\n

+ on e.deptno = d.deptno\n

+ group by d.deptno\n

+ having count(*) 1);

print(resultSet);

resultSet.close();

statement.close();

connection.close();

Calcite提供了多种方式添加数据源,如通过“inline:”的字符串方式以及通过json或yaml文件的方式。同时,Calcite抽象出了功能齐全的接口,可以方便的将CSV文件抽象成数据表进行查询。这部分内容可以通过官方的示例了解一下!

当然SQL解析、校验与执行计划优化是Calcite的基本功能,Calcite的NB之处在于,Calcite的目标是“one size fits all”,希望能为不同的计算平台和数据源提供统一的查询引擎,并且以类似传统数据库的访问方式(SQL)来访问Hadoop上的数据。所以Calcite提供了非常丰富的可扩展接口,帮助我们实现扩展数据源、扩展针对不同数据源的优化规则、扩展SQL查询语法、扩展数据处理引擎等等。这部分后面会详细介绍(挖坑ing)返回搜狐,查看更多

责任编辑:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/337977.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言中「」的含义

点击上方蓝字关注我,了解更多咨询取决于在scanf中使用还是在printf中使用。在scanf中使用,则添加了*的部分会被忽略,不会被参数获取。例如:int a,b;char b[10];scanf("%d%*s",&a,b);输入为:1…

maven和docker_Java EE,Docker和Maven(技术提示#89)

maven和dockerJava EE应用程序通常使用Maven构建和打包。 例如&#xff0c; github.com/javaee-samples/javaee7-docker-maven是一个琐碎的Java EE 7应用程序&#xff0c;它显示了Java EE 7依赖性&#xff1a; <dependencies><dependency><groupId>javax<…

mysql ondumplictcate_4.5万字手把手教你实现MySQL TB级数据存储!!

写在前面业界对系统的高可用有着基本的要求&#xff0c;简单的说&#xff0c;这些要求可以总结为如下所示。系统架构中不存在单点问题。可以最大限度的保障服务的可用性。一般情况下系统的高可用可以用几个9来评估。所谓的几个9就是系统可以保证对外提供的服务的时间达到总时间…

c语言中+ =和=+有什么区别

点击上方蓝字关注我&#xff0c;了解更多咨询c语言中 和有什么区别&#xff1a;区别在于 是简写&#xff0c;a 1就是a a1&#xff1a;并不是简写&#xff0c;a a直接对a的赋值&#xff0c;符号代表的是正负&#xff08;完全可以省略不写&#xff09;&#xff0c;即a b其实就…

jvm7 jvm8_我们真的仍然需要32位JVM吗?

jvm7 jvm8即使在今天&#xff08;2015年&#xff09;&#xff0c;我们仍然有两个版本或Oracle HotSpot JDK –已调整为32或64位体系结构。 问题是我们是否真的想在服务器甚至笔记本电脑上使用32位JVM&#xff1f; 我们应该有很受欢迎的意见&#xff01; 如果只需要较小的堆&…

C语言中的printf函数,你觉得它简单吗?

点击上方蓝字关注我&#xff0c;了解更多咨询什么是printf函数&#xff1f;printf函数是C语言当中的输出函数&#xff0c;是用来将内容显示在屏幕上的&#xff0c;是C库中的一种函数。printf函数的用法printf函数使用起来很简单&#xff0c;格式&#xff1a;printf&#xff08;…

tp5怎么生成短链接_请问在tp5中怎样才能使用url函数?

MM们thinkphp中的自动完成函数调用有两种不同的方法&#xff0c;分别为callback与function;12345678910namespace Home\Model;use Think\Model;class UserModel extends Model{protected $_auto array (array(status,1), // 新增的时候把status字段设置为1array(password,md5,…

cuba 平台_CUBA平台的理念

cuba 平台最近发生了很多事。 在CUBA于6月1日正式发布之后&#xff0c;我们推出了新版本&#xff0c;在一些Java网站上发布了我们的第一篇文章&#xff0c;并在伦敦的Devoxx UK会议上介绍了该平台 。 但是在热潮继续之前&#xff0c;大约是时候阐明CUBA背后的哲学了。 与企业软…

C语言进阶:探讨函数指针的的定义与使用

点击上方蓝字关注我&#xff0c;了解更多咨询函数指针今天准备和大家讲解一下我们C语言编程的函数指针&#xff0c;为什么函数也需要指针呢&#xff1f;我是这样理解的函数指针方便我们对函数的调用&#xff0c;当我们需要把一个函数作为参数传给其他参数的时候就必须使用函数指…

jvm gc停顿_在JVM中记录世界停顿

jvm gc停顿不同的事件可能导致JVM暂停所有应用程序线程。 这种暂停称为世界停止&#xff08;STW&#xff09;暂停。 触发STW暂停的最常见原因是垃圾回收&#xff08; 例如github中的示例 &#xff09;&#xff0c;但是不同的JIT操作&#xff08; 示例 &#xff09;&#xff0c;…

-在c语言中什么含义

点击上方蓝字关注我&#xff0c;了解更多咨询->是一个整体&#xff0c;它是用于指向结构体。1.换种说法&#xff0c;如果我们在C语言中定义了一个结构体&#xff0c;然后申明一个指针指向这个结构体&#xff0c;那么我们要用指针取出结构体中的数据&#xff0c;就要用到“-&…

idea如何连接本地mysql_IDEA如何连接MYSQL

IDEA如何连接MYSQL1>下载JDBC2>导入数据库驱动在IDEA中新建一个lib目录复制下载的驱动包&#xff0c;然后粘贴到刚刚建立的lib目录下右键点击添加的数据库驱动&#xff0c;找到最下面的Add as Library...&#xff0c;点击它会出现一个弹窗&#xff0c;点击"OK"…

apache camel_Apache Camel日志组件示例

apache camelApache Camel日志组件示例 您要将消息记录到底层的记录机制中&#xff0c;请使用骆驼的log:组件。 Camel使用sfl4j作为记录器API&#xff0c;然后允许您配置记录器实现。 在本文中&#xff0c;我们将使用Log4j作为实际的记录器机制。 让我们从我们的例子开始。 依…

putchar在c语言中怎么用

点击上方蓝字关注我&#xff0c;了解更多咨询putchar在c语言中的作用是向终端输出一个字符&#xff0c;也属于一种C库函数&#xff0c;包含在C标准库中&#xff0c;putchar是一个字符输出&#xff0c;用于快写的时候很方便。首先来看一下c语言的含义&#xff0c;c语言是一门面向…

mysql设计体会_数据库设计心得体会

组名&#xff1a;NoobStruggle。成员&#xff1a;刘海天、胡亮、谭晓杰、宁君辉。一&#xff0e;分析需求对于每一个项目&#xff0c;数据库的设计都是至关重要的&#xff0c;它关系到后端进行接口开发时实现的难度&#xff0c;数据库中数据的可维护性&#xff0c;一致性&#…

hibernate查询缓存_Hibernate查询缓存如何工作

hibernate查询缓存介绍 现在&#xff0c;我已经介绍了实体和集合缓存&#xff0c;现在该研究查询缓存的工作原理了。 查询缓存与实体严格相关&#xff0c;它在搜索条件和满足该特定查询过滤器的实体之间绘制关联。 像其他Hibernate功能一样&#xff0c;查询缓存也不像人们想象…

windows mysql kip grant tables_数据库mysql数据库mysql: [ERROR] unknown option '--skip-grant-tables'...

mysql数据库报ERROR 1045 (28000): Access denied for user ODBClocalhost (using password: NO)看到网上说要配置my.ini我的是win10系统&#xff0c;用的是mysql-5.7.18-winx64mysql文件里没有my.ini&#xff0c;在网上看到可以自己建&#xff0c;就家加了一个内容如下&#x…

教你快速了解C语言基本结构

点击上方蓝字关注我&#xff0c;了解更多咨询在步入C语言程序世界之前&#xff0c;不要对C语言产生恐惧感&#xff0c;觉得这种语言应该是学者或研究人员的专利。C语言是人类共有的财富&#xff0c;是普通人只要通过努力学习就可以掌握的知识。下面通过一个简单的程序来看一看C…

hpcc_使用Java将数据流式传输到HPCC

hpcc高性能计算集群&#xff08;HPCC&#xff09;是类似于Hadoop的分布式处理框架&#xff0c;除了它运行以自己的称为企业控制语言&#xff08;ECL&#xff09;的特定领域语言&#xff08;DSL&#xff09;编写的程序外。 ECL很棒&#xff0c;但是偶尔您会想用其他语言来执行繁…

提高mysql insert速度_让你的insert操作速度增加1000倍的方法

大家平时都会使用insert语句,特别是有时候需要一个大批量的数据来做测试,一条一条insert将会是非常慢的,那么我们如何让我们的inser更快呢。很多时候方法选对了对于我们做事将会是事半功倍。大家平时都会使用insert语句,特别是有时候需要一个大批量的数据来做测试,一条一条inse…