Flink SQL --Flink 整合 hive

1、整合

# 1、将依赖包上传到flink的lib目录下
flink-sql-connector-hive-3.1.2_2.12-1.15.2.jar# 2、重启flink集群
yarn application -list
yarn application -kill application_1699579932721_0003
yarn-session.sh -d# 3、重新进入sql命令行
sql-client.sh

2、Hive catalog

catalog(元数据) ---> database ---> table ---> 数据 --- > 列

-- 1、开启hive的元数据服务
nohup hive --service metastore &-- 2、创建hive catalog
CREATE CATALOG myhive WITH ('type' = 'hive','hive-conf-dir' = '/usr/local/soft/hive-3.1.2/conf'
);-- 查看所有的catalog
-- default_catalog: 默认的元数据，将元数据保存在内存中
show catalogs;--3、切换catalog
use catalog myhive;--4、在flink中就可以使用hive中已经创建好的表
select * from student;
-- 可以从catalog开始定位一张表
select * from myhive.`default`.student;-- 将flink的表结构保存到hive catalog中
-- hive中可以看到flink创建的流表，但是在hive中不能查询flink的流表
create database flink;
use flink;
-- 创建flink动态表
CREATE TABLE students_kafka (`offset` BIGINT METADATA VIRTUAL, -- 偏移量`event_time` TIMESTAMP(3) METADATA FROM 'timestamp', --数据进入kafka的时间，可以当作事件时间使用sid STRING,name STRING,age INT,sex STRING,clazz STRING
) WITH ('connector' = 'kafka','topic' = 'students', -- 数据的topic'properties.bootstrap.servers' = 'master:9092,node1:9092,node2:9092', -- broker 列表'properties.group.id' = 'testGroup', -- 消费者组'scan.startup.mode' = 'earliest-offset', -- 读取数据的位置earliest-offset latest-offset'format' = 'csv' -- 读取数据的格式
);

3、Hive functions

在Flink中的使用hive中的函数：

-- 加载hive函数
LOAD MODULE hive WITH ('hive-version' = '3.1.2');-- 使用hive的函数
select split('java,spark',',');

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/141363.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Flink SQL --Flink 整合 hive

1、整合

2、Hive catalog

3、Hive functions

相关文章

超越任务调度的极致：初探分布式定时任务 XXL-JOB 分片广播

字符设备驱动基础框架

如何评估一个需求？需求做不完，怎么办？

windows系统用于 SDN 的软件负载均衡器 (SLB)

聚观早报 |京东11.11公布成绩单；2023数字科技生态大会

Docker 中的端口

MLIR笔记（1）

【中间件篇-Redis缓存数据库06】Redis主从复制/哨兵高并发高可用

SparkSQL之Analyzed LogicalPlan生成过程

16. 机器学习——决策树

go中的rune类型

MIPI速率计算

打开word文档报错，提示HRESULT 0x80004005 位置: 部分: /word/comments.xml,行: 0,列: 0

java学习part02一些特性

No199.精选前端面试题，享受每天的挑战和学习

Seaborn数据可视化综合应用Basemap和Seaborn在线闯关_头歌实践教学平台

微信小程序用户隐私API

SpringBoot--中间件技术-3：整合mongodb，整合ElasticSearch，附案例含代码(简单易懂)

基于flask+bootstrap4实现的注重创作的轻博客系统项目源码

rabbitMq创建交换机，以及路由键绑定队列教程