Hive笔记-4

240618-Hive笔记-4

4.2 Insert

4.2.1 将查询结果插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION 
(partcol1=val1,partcol2=val2 ...)] select_stamement;

关键字说明:

(1) INTO: 将结果追加到目标表

(2) OVERWRITE: 用结果覆盖原有数据

2) 案例
(1) 新建一张表
hive (default) >
create table student1(
id int,
name string
)
row format delimited fields terminated by '\t'
(2) 根据查询结果插入数据
hive (default) > insert overwrite table student3
select 
id,
name
from student;

4.2.2 将给定Values插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION
(partocol1[val1],partcol2[=val2] ...] VALUES values_row [,
values_row ...]
2) 案例
hive (default) > insert into table student1
values(1,'wangwu'),(2,'zhaoliu');

追加成功:

4.2.3 将查询结果写入目标路径

1) 语法
INSERT OVERWRITE [LOCAL] DIRECTORY directory
[ROW FORMAT row_format] [STORED AS
file_format] select_statement;
2) 案例
insert overwrite local directory '/opt/module/datas/student' ROW
FORMAT SERDE 'org.apache.hadoop.hive.serde2.JsonSerDe'
select id,name from student;

4.2 Export & Import

 Export导出语句可将表的数据和元数据信息一并到处的HDFS路径,Import可将Export导出的内容导入Hive,表的数据和元数据信息都会恢复。Export和Import可用于两个Hive实例之间的数据迁移。

1) 语法

--导出
EXPORT TABLE tablename TO 'export_target_path'--导入
IMPORT [EXTERNAL] TABLE new_or_original_tablename FROM 'source_path' [LOCATION 'import_target_path']

2) 案例

--导出
hive>
export table default.student to '/user/hive/warehouse/export/student';--导入
hive>
import table student2 from '/user/hive/warehouse/export/student';

执行export代码:

查看结果:

执行Import代码:

第 6 章 查询

6.1 基础语法

1) 官网的地址:

LanguageManual Select - Apache Hive - Apache Software Foundation

2) 查询语句语法:

SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference       -- 从什么表查[WHERE where_condition]   -- 过滤[GROUP BY col_list]        -- 分组查询[HAVING col_list]          -- 分组后过滤[ORDER BY col_list]        -- 排序[CLUSTER BY col_list| [DISTRIBUTE BY col_list] [SORT BY col_list]][LIMIT number]                -- 限制输出的行数

6.2 基本查询(Select ... From)

6.2.1 数据准备
 (1) 原始数据
 1.在/opt/module/hive/datas/路径上创建dept.txt文件,并赋值如下内容:

部门编号 部门名称 部门位置id

[atguigu@hadoop102 datas]$ vim dept.txt10 行政部 1700
20 财务部 1800
30 教学部 1900
40 销售部 1700
 2.在/opt/module/hive/datas/路径上创建emp.txt文件,并赋值如下内容:

员工编号 姓名 岗位   薪资  部门

[atguigu@hadoop102 datas]$ vim emp.txt7369 张三 研发 800.00 30
7499 李四 财务 1600.00 20
7521 王五 行政 1250.00 10
7566 赵六 销售 2975.00 40
7654 侯七 研发 1250.00 30
7698 马八 研发 2850.00 30
7782 金九 \N 2450.0 30
7788 银十 行政 3000.00 10
7839 小芳 销售 5000.00 40
7844 小明 销售 1500.00 40
7876 小李 行政 1100.00 10
7900 小元 讲师 950.00 30
7902 小海 行政 3000.00 10
7934 小红明 讲师 1300.00 30

创建文件dept.txt :

(1) 创建部门表
hive (default)>
create table if not exists dept(deptno int,    -- 部门编号dname string,  -- 部门名称loc int        -- 部门位置
)
row format delimited fields terminated by '\t';

(2) 创建员工表
hive (default)>
create table if not exists emp(empno int,      -- 员工编号ename string,   -- 员工姓名job string,     -- 员工岗位(大数据工程师、前端工程师、java工程师)sal double,     -- 员工薪资deptno int      -- 部门编号
)
row format delimited fields terminated by '\t';

(3) 导入数据
hive (default)>
load data local inpath '/opt/module/hive/datas/dept.txt' into table dept;
load data local inpath '/opt/module/hive/datas/emp.txt' into table emp;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/33821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

表单prop必填验证根据el-radio-group的值来动态绑定

1、radio的值为5时输入框是必填,其余时候是非必填 2、看图 3、代码 data() {return {optForm:{type:,remark:,},rules:{type:[{ required: true,trigger: change,message:该项为必填项}],remark:[]}};},watch: {"optForm.type"(newVal, oldVal) {this.$…

红酒品鉴秘籍:一键解锁味觉宇宙,开启你的味觉探险新纪元

红酒,这种优雅的液体,蕴藏着丰富的口感和层次,每一次的品鉴都是一次味觉的探险。今天,就让我们一起探索红酒品鉴的奥秘,解锁味觉的新世界,而在这个过程中,雷盛红酒将成为我们的向导,…

定制化服务:可燃气体报警器检定收费新模式

随着工业化和城市化的快速发展,可燃气体报警器作为重要的安全监测设备,其准确性和可靠性对于保障人们的生命财产安全至关重要。因此,可燃气体报警器的定期检定和维护显得尤为重要。 在这篇文章中,佰德将围绕可燃气体报警器检定收…

Windows重新安装安全中心解决白屏问题

重新安装Windows安全中心(Windows Security Center)涉及多个步骤,包括重置Windows安全功能和重新安装Windows安全应用。以下是详细的步骤: 1. 通过PowerShell重置Windows安全中心 打开PowerShell: 在开始菜单中搜索“PowerShell”…

【多通道卷积终结篇,通俗易懂,清晰必读】

作为常识, 1、卷积层 输出特征图通道数 卷积核个数 与输入特征图通道数无关, 2、多卷积核处理多通道特征图的机制过程如下: 本文的参考资料为知乎:一文读懂Faster RCNN。 对于多通道图像多卷积核做卷积,计算方式如…

科创板持续反弹,如何看几个焦点问题:成交、解禁、并购

从去年鼓励市场重估高分红高现金流等优质央国企,到今年对创新科技企业的政策着墨增加,下一阶段市场投资理念将回归均衡。 科创板基本面的边际变化是根本,政策是触发因素,若干线索在当时出现了共振,这是一轮市场久违的…

软考中级复习过程

中级软考复习过程 先上成绩截图 ~~~~ 总结一下自己的软考中级备考过程,个人备考的是软件设计师,首先对于软考中的大部分内容其实我都学过的,只是有些内容确实会忘记,我把整个备考的过程分为前后两个阶段。 ~~~~ 前期阶段&#…

Axure RP 9 安装详细笔记

一、下载 1.官网下载地址 Axure RP 9 MAC正式版:https://axure.cachefly.net/versions/9-0/AxureRP-Setup-3740.dmgAxure RP 9 WINDOWS正式版:https://axure.cachefly.net/versions/9-0/AxureRP-Setup-3740.exe2.网盘下载 链接:https://pa…

一键登录功能实现(采用极光SDK)

前端流程 1. 引入极光认证 SDK&#xff1a; 通过 <script> 标签引入 &#xff0c;在 public/index.html 中确认 SDK 脚本已正确加载&#xff1a;参考官网Web SDK 概述 - 极光文档 <!-- 引入极光认证 SDK --> <script type"text/javascript" src&qu…

ElementUI table的设置成Excel表格效果

实现效果代码最重要的部分 <el-table:data"Commision"border:row-style"{height: 0}":cell-style"{padding: 0 ,lineHeight: 0}":header-cell-style"{padding: 0,height: 0,ineHeight: 0}"><el-col :span"11">&…

EtherCAT笔记(四)——EtherCAT数据帧结构

EtherCAT数据包含2B的数据头和44~1948B的数据区。数据区由多个子报文组成。由于EtherCAT本身是通过以太网数据帧的形式传输&#xff0c;因此其协议帧中会携带以太网的帧头。 其中&#xff0c;解释如下&#xff1a; &#xff08;1&#xff09;以太网数据帧头&#xff1a;EtherC…

经典神经网络(12)Transformer代码详解及其在Multi30k数据集上的训练

经典神经网络(12)Transformer代码详解及其在Multi30k数据集上的训练 论文链接&#xff1a;https://arxiv.org/pdf/1706.03762v2 原理可以参考&#xff1a;Self-Attention和Transformer 网络架构图如下&#xff1a; 1 Transformer编码器模块 1.1 Embedding位置编码 在实际…

【AI大模型】GPTS 与 Assistants API

前言 2023 年 11 月 6 日&#xff0c;OpenAI DevDay 发表了一系列新能力&#xff0c;其中包括&#xff1a;GPT Store 和 Assistants API。 GPTs 和 Assistants API 本质是降低开发门槛 可操控性和易用性之间的权衡与折中&#xff1a; 更多技术路线选择&#xff1a;原生 API、…

6.二叉树.题目1

6.二叉树.题目 题目1.翻转二叉树2.对称二叉树3.二叉树的最大深度4.二叉树的最小深度5.完全二叉树的节点个数6.平衡二叉树7.二叉树的所有路径8.左叶子之和 总结 题目 1.翻转二叉树 (题目链接) 直观的思路是就把每一个节点的左右孩子交换一下就可以了&#xff0c; 深度优先-递归…

stm32学习笔记---TIM输出比较(理论部分)

目录 TIM简介 定时器类型 基本定时器的结构图 时基单元 预分频器 计数器 自动重装寄存器 主模式触发DAC的功能 通用定时器的结构图 计数器的计数模式 内外时钟源选择和主从触发模式的结构 外部时钟模式2 外部时钟模式1 其他部分 输出比较电路 输入捕获电路 高…

深度测试中的隐藏面消除技术

by STANCH 标签&#xff1a;#计算机图形学 #深度测试 #深度测试 #隐藏面消除 1.概述 根据我们的日常经验&#xff0c;近处的物体会挡住后面的物体&#xff0c;在三维场景中通常通过深度缓冲来实现这样的效果。深度缓冲记录着屏幕对应的每个像素的深度值。模型一开始所在的局部…

我对ChatGPT-5的期待

在科技飞速发展的今天&#xff0c;人工智能&#xff08;AI&#xff09;已经成为我们生活中不可或缺的一部分。尤其是近年来&#xff0c;随着ChatGPT等先进AI模型的推出&#xff0c;我们见证了AI技术在智能水平上的巨大飞跃。作为这一领域的最新成果&#xff0c;GPT-5的即将发布…

2005年下半年软件设计师【上午题】试题及答案

文章目录 2005年下半年软件设计师上午题--试题2005年下半年软件设计师上午题--答案 2005年下半年软件设计师上午题–试题 2005年下半年软件设计师上午题–答案

解决ssh: connect to host IP port 22: Connection timed out报错(scp传文件指定端口)

错误消息 ssh: connect to host IP port 22: Connection timed out 指出 SSH 客户端尝试连接到指定的 IP 地址和端口号&#xff08;默认 SSH 端口是 22&#xff09;&#xff0c;但是连接超时了。这意味着客户端没有在预定时间内收到来自服务器的响应。 可能的原因 SSH 服务未…

C语言---C指针+ASCII码

内存地址&#xff1a;内存中每个字节单位都有一个编号&#xff08;一般用十六进制表示&#xff09; 存储类型 数据类型 *指针变量名&#xff1b;int *p; //定义了一个指针变量p,指向的数据是int类型的。访问指针所指向空间的内容用取内容运算符* &&#xff1a;取地址符&am…