Hive笔记-4

240618-Hive笔记-4

4.2 Insert

4.2.1 将查询结果插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION 
(partcol1=val1,partcol2=val2 ...)] select_stamement;

关键字说明:

(1) INTO: 将结果追加到目标表

(2) OVERWRITE: 用结果覆盖原有数据

2) 案例
(1) 新建一张表
hive (default) >
create table student1(
id int,
name string
)
row format delimited fields terminated by '\t'
(2) 根据查询结果插入数据
hive (default) > insert overwrite table student3
select 
id,
name
from student;

4.2.2 将给定Values插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION
(partocol1[val1],partcol2[=val2] ...] VALUES values_row [,
values_row ...]
2) 案例
hive (default) > insert into table student1
values(1,'wangwu'),(2,'zhaoliu');

追加成功:

4.2.3 将查询结果写入目标路径

1) 语法
INSERT OVERWRITE [LOCAL] DIRECTORY directory
[ROW FORMAT row_format] [STORED AS
file_format] select_statement;
2) 案例
insert overwrite local directory '/opt/module/datas/student' ROW
FORMAT SERDE 'org.apache.hadoop.hive.serde2.JsonSerDe'
select id,name from student;

4.2 Export & Import

 Export导出语句可将表的数据和元数据信息一并到处的HDFS路径,Import可将Export导出的内容导入Hive,表的数据和元数据信息都会恢复。Export和Import可用于两个Hive实例之间的数据迁移。

1) 语法

--导出
EXPORT TABLE tablename TO 'export_target_path'--导入
IMPORT [EXTERNAL] TABLE new_or_original_tablename FROM 'source_path' [LOCATION 'import_target_path']

2) 案例

--导出
hive>
export table default.student to '/user/hive/warehouse/export/student';--导入
hive>
import table student2 from '/user/hive/warehouse/export/student';

执行export代码:

查看结果:

执行Import代码:

第 6 章 查询

6.1 基础语法

1) 官网的地址:

LanguageManual Select - Apache Hive - Apache Software Foundation

2) 查询语句语法:

SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference       -- 从什么表查[WHERE where_condition]   -- 过滤[GROUP BY col_list]        -- 分组查询[HAVING col_list]          -- 分组后过滤[ORDER BY col_list]        -- 排序[CLUSTER BY col_list| [DISTRIBUTE BY col_list] [SORT BY col_list]][LIMIT number]                -- 限制输出的行数

6.2 基本查询(Select ... From)

6.2.1 数据准备
 (1) 原始数据
 1.在/opt/module/hive/datas/路径上创建dept.txt文件,并赋值如下内容:

部门编号 部门名称 部门位置id

[atguigu@hadoop102 datas]$ vim dept.txt10 行政部 1700
20 财务部 1800
30 教学部 1900
40 销售部 1700
 2.在/opt/module/hive/datas/路径上创建emp.txt文件,并赋值如下内容:

员工编号 姓名 岗位   薪资  部门

[atguigu@hadoop102 datas]$ vim emp.txt7369 张三 研发 800.00 30
7499 李四 财务 1600.00 20
7521 王五 行政 1250.00 10
7566 赵六 销售 2975.00 40
7654 侯七 研发 1250.00 30
7698 马八 研发 2850.00 30
7782 金九 \N 2450.0 30
7788 银十 行政 3000.00 10
7839 小芳 销售 5000.00 40
7844 小明 销售 1500.00 40
7876 小李 行政 1100.00 10
7900 小元 讲师 950.00 30
7902 小海 行政 3000.00 10
7934 小红明 讲师 1300.00 30

创建文件dept.txt :

(1) 创建部门表
hive (default)>
create table if not exists dept(deptno int,    -- 部门编号dname string,  -- 部门名称loc int        -- 部门位置
)
row format delimited fields terminated by '\t';

(2) 创建员工表
hive (default)>
create table if not exists emp(empno int,      -- 员工编号ename string,   -- 员工姓名job string,     -- 员工岗位(大数据工程师、前端工程师、java工程师)sal double,     -- 员工薪资deptno int      -- 部门编号
)
row format delimited fields terminated by '\t';

(3) 导入数据
hive (default)>
load data local inpath '/opt/module/hive/datas/dept.txt' into table dept;
load data local inpath '/opt/module/hive/datas/emp.txt' into table emp;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/33821.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

表单prop必填验证根据el-radio-group的值来动态绑定

1、radio的值为5时输入框是必填,其余时候是非必填 2、看图 3、代码 data() {return {optForm:{type:,remark:,},rules:{type:[{ required: true,trigger: change,message:该项为必填项}],remark:[]}};},watch: {"optForm.type"(newVal, oldVal) {this.$…

NAT punching hole tech

What is NAT Hole Punching? NAT hole punching is a technique used to establish direct connections between devices behind Network Address Translation (NAT) routers or firewalls.The goal is to allow communication between two devices (let’s call them Node A …

红酒品鉴秘籍:一键解锁味觉宇宙,开启你的味觉探险新纪元

红酒,这种优雅的液体,蕴藏着丰富的口感和层次,每一次的品鉴都是一次味觉的探险。今天,就让我们一起探索红酒品鉴的奥秘,解锁味觉的新世界,而在这个过程中,雷盛红酒将成为我们的向导,…

ArcGIS Pro SDK (五)内容 6 工程单位

ArcGIS Pro SDK (五)内容 6 工程单位 目录 ArcGIS Pro SDK (五)内容 6 工程单位1 获取所有可用单位格式的完整列表2 获取当前项目的单位格式列表3 获取当前项目的特定单位格式列表4 获取当前项目的默认格式列表5 获取当前项目的特…

【杂记-浅谈RSTP快速生成树】

RSTP快速生成树 一、RSTP协议概述二、RSTP工作原理与配置三、RSTP的端口角色和状态四、RSTP之边缘端口 一、RSTP协议概述 定义 Rapid Spanning Tree Protocol,RSTP,快速生成树协议,是在STP生成树基础上发展起来的,用于在网络结构…

使用Python进行文本处理:从入门到精通

哈喽,大家好,我是木头左! 1. 引言 在当今的信息时代,文本数据已经成为了生活中不可或缺的一部分。无论是社交媒体、新闻报道还是学术论文,都离不开文本。因此,掌握文本处理技能对于的生活和工作都具有重要意义。而Python作为一门强大的编程语言,其在文本处理方面的表现…

定制化服务:可燃气体报警器检定收费新模式

随着工业化和城市化的快速发展,可燃气体报警器作为重要的安全监测设备,其准确性和可靠性对于保障人们的生命财产安全至关重要。因此,可燃气体报警器的定期检定和维护显得尤为重要。 在这篇文章中,佰德将围绕可燃气体报警器检定收…

Windows重新安装安全中心解决白屏问题

重新安装Windows安全中心(Windows Security Center)涉及多个步骤,包括重置Windows安全功能和重新安装Windows安全应用。以下是详细的步骤: 1. 通过PowerShell重置Windows安全中心 打开PowerShell: 在开始菜单中搜索“PowerShell”…

【多通道卷积终结篇,通俗易懂,清晰必读】

作为常识, 1、卷积层 输出特征图通道数 卷积核个数 与输入特征图通道数无关, 2、多卷积核处理多通道特征图的机制过程如下: 本文的参考资料为知乎:一文读懂Faster RCNN。 对于多通道图像多卷积核做卷积,计算方式如…

常用框架-Zookeeper

常用框架-Zookeeper 1、Zookeeper是什么?2、ZooKeeper有哪些应用场景?3、说说Zookeeper的工作原理?4、说说Zookeeper的通知机制?5、Zookeeper对节点的 watch 监听通知是永久的吗?6、Zookeeper集群中有哪些角色?7、Zookeeper集群中是怎样选举leader的?8、Zookeeper是如何…

科创板持续反弹,如何看几个焦点问题:成交、解禁、并购

从去年鼓励市场重估高分红高现金流等优质央国企,到今年对创新科技企业的政策着墨增加,下一阶段市场投资理念将回归均衡。 科创板基本面的边际变化是根本,政策是触发因素,若干线索在当时出现了共振,这是一轮市场久违的…

软考中级复习过程

中级软考复习过程 先上成绩截图 ~~~~ 总结一下自己的软考中级备考过程,个人备考的是软件设计师,首先对于软考中的大部分内容其实我都学过的,只是有些内容确实会忘记,我把整个备考的过程分为前后两个阶段。 ~~~~ 前期阶段&#…

Axure RP 9 安装详细笔记

一、下载 1.官网下载地址 Axure RP 9 MAC正式版:https://axure.cachefly.net/versions/9-0/AxureRP-Setup-3740.dmgAxure RP 9 WINDOWS正式版:https://axure.cachefly.net/versions/9-0/AxureRP-Setup-3740.exe2.网盘下载 链接:https://pa…

一键登录功能实现(采用极光SDK)

前端流程 1. 引入极光认证 SDK&#xff1a; 通过 <script> 标签引入 &#xff0c;在 public/index.html 中确认 SDK 脚本已正确加载&#xff1a;参考官网Web SDK 概述 - 极光文档 <!-- 引入极光认证 SDK --> <script type"text/javascript" src&qu…

ElementUI table的设置成Excel表格效果

实现效果代码最重要的部分 <el-table:data"Commision"border:row-style"{height: 0}":cell-style"{padding: 0 ,lineHeight: 0}":header-cell-style"{padding: 0,height: 0,ineHeight: 0}"><el-col :span"11">&…

【SQL】SQL表构建实战:从零开始打造数据基石

目录 SQL入门教程 - 表的创建与管理 1. 创建表及定义字段 2. 描述字段的数据类型与约束 3. 查看表结构 4. 修改与删除表 注意 SQL入门教程 - 表的创建与管理 数据库中的表是数据存储和组织的基本单元&#xff0c;每一行代表一条记录&#xff0c;每一列代表一个字段&#…

EtherCAT笔记(四)——EtherCAT数据帧结构

EtherCAT数据包含2B的数据头和44~1948B的数据区。数据区由多个子报文组成。由于EtherCAT本身是通过以太网数据帧的形式传输&#xff0c;因此其协议帧中会携带以太网的帧头。 其中&#xff0c;解释如下&#xff1a; &#xff08;1&#xff09;以太网数据帧头&#xff1a;EtherC…

经典神经网络(12)Transformer代码详解及其在Multi30k数据集上的训练

经典神经网络(12)Transformer代码详解及其在Multi30k数据集上的训练 论文链接&#xff1a;https://arxiv.org/pdf/1706.03762v2 原理可以参考&#xff1a;Self-Attention和Transformer 网络架构图如下&#xff1a; 1 Transformer编码器模块 1.1 Embedding位置编码 在实际…

【AI大模型】GPTS 与 Assistants API

前言 2023 年 11 月 6 日&#xff0c;OpenAI DevDay 发表了一系列新能力&#xff0c;其中包括&#xff1a;GPT Store 和 Assistants API。 GPTs 和 Assistants API 本质是降低开发门槛 可操控性和易用性之间的权衡与折中&#xff1a; 更多技术路线选择&#xff1a;原生 API、…

6.二叉树.题目1

6.二叉树.题目 题目1.翻转二叉树2.对称二叉树3.二叉树的最大深度4.二叉树的最小深度5.完全二叉树的节点个数6.平衡二叉树7.二叉树的所有路径8.左叶子之和 总结 题目 1.翻转二叉树 (题目链接) 直观的思路是就把每一个节点的左右孩子交换一下就可以了&#xff0c; 深度优先-递归…