hadoop元数据mysql中表字段_hive mysql元数据表说明

2019独角兽企业重金招聘Python工程师标准>>>

6936d1565ae689371725cdb5fc51c415.png

数据库相关的表

DBS

该表存储Hive中所有数据库的基本信息,字段如下:

元数据表字段

说明

示例数据

DB_ID

数据库ID

2

DESC

数据库描述

测试库

DB_LOCATION_URI

数据库HDFS路径

hdfs://namenode/user/hive/warehouse/lxw1234.db

NAME

数据库名

lxw1234

OWNER_NAME

数据库所有者用户名

lxw1234

OWNER_TYPE

所有者角色

USER

DATABASE_PARAMS

该表存储数据库的相关参数,在CREATE DATABASE时候用

WITH DBPROPERTIES (property_name=property_value, …)指定的参数。

元数据表字段

说明

示例数据

DB_ID

数据库ID

2

PARAM_KEY

参数名

createdby

PARAM_VALUE

参数值

lxw1234

DBS和DATABASE_PARAMS这两张表通过DB_ID字段关联。

表相关的表

TBLS

该表中存储Hive表、视图、索引表的基本信息。

元数据表字段

说明

示例数据

TBL_ID

表ID

1

CREATE_TIME

创建时间

1436317071

DB_ID

数据库ID

2,对应DBS中的DB_ID

LAST_ACCESS_TIME

上次访问时间

1436317071

OWNER

所有者

liuxiaowen

RETENTION

保留字段

0

SD_ID

序列化配置信息

86,对应SDS表中的SD_ID

TBL_NAME

表名

lxw1234

TBL_TYPE

表类型

MANAGED_TABLE、EXTERNAL_TABLE、INDEX_TABLE、VIRTUAL_VIEW

VIEW_EXPANDED_TEXT

视图的详细HQL语句

select `lxw1234`.`pt`, `lxw1234`.`pcid` from `liuxiaowen`.`lxw1234`

VIEW_ORIGINAL_TEXT

视图的原始HQL语句

select * from lxw1234

TABLE_PARAMS

该表存储表/视图的属性信息。

元数据表字段

说明

示例数据

TBL_ID

表ID

1

PARAM_KEY

属性名

totalSize、numRows、EXTERNAL

PARAM_VALUE

属性值

970107336、21231028、TRUE

TBL_PRIVS

该表存储表/视图的授权信息

元数据表字段

说明

示例数据

TBL_GRANT_ID

授权ID

1

CREATE_TIME

授权时间

1436320455

GRANT_OPTION

0

GRANTOR

授权执行用户

liuxiaowen

GRANTOR_TYPE

授权者类型

USER

PRINCIPAL_NAME

被授权用户

username

PRINCIPAL_TYPE

被授权用户类型

USER

TBL_PRIV

权限

Select、Alter

TBL_ID

表ID

22,对应TBLS表中的TBL_ID

存储相关的元数据表

SDS

该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。

TBLS表中的SD_ID与该表关联,可以获取Hive表的存储信息。

元数据表字段

说明

示例数据

SD_ID

存储信息ID

1

CD_ID

字段信息ID

21,对应CDS表

INPUT_FORMAT

文件输入格式

org.apache.hadoop.mapred.TextInputFormat

IS_COMPRESSED

是否压缩

0

IS_STOREDASSUBDIRECTORIES

是否以子目录存储

0

LOCATION

HDFS路径

hdfs://namenode/hivedata/warehouse/ut.db/t_lxw

NUM_BUCKETS

分桶数量

5

OUTPUT_FORMAT

文件输出格式

org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat

SERDE_ID

序列化类ID

3,对应SERDES表

SD_PARAMS

该表存储Hive存储的属性信息,在创建表时候使用

STORED BY ‘storage.handler.class.name’ [WITH SERDEPROPERTIES (…)指定。

元数据表字段

说明

示例数据

SD_ID

存储配置ID

1

PARAM_KEY

存储属性名

PARAM_VALUE

存储属性值

SERDES

该表存储序列化使用的类信息

元数据表字段

说明

示例数据

SERDE_ID

序列化类配置ID

1

NAME

序列化类别名

SLIB

序列化类

org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe

SERDE_PARAMS

该表存储序列化的一些属性、格式信息,比如:行、列分隔符

元数据表字段

说明

示例数据

SERDE_ID

序列化类配置ID

1

PARAM_KEY

属性名

field.delim

PARAM_VALUE

属性值

,

表字段相关的元数据表

PARTITIONS

该表存储表分区的基本信息。

元数据表字段

说明

示例数据

PART_ID

分区ID

1

CREATE_TIME

分区创建时间

LAST_ACCESS_TIME

最后一次访问时间

PART_NAME

分区名

pt=2015-06-12

SD_ID

分区存储ID

21

TBL_ID

表ID

2

PARTITION_KEYS

该表存储分区的字段信息。

元数据表字段

说明

示例数据

TBL_ID

表ID

2

PKEY_COMMENT

分区字段说明

PKEY_NAME

分区字段名

pt

PKEY_TYPE

分区字段类型

string

INTEGER_IDX

分区字段顺序

1

PARTITION_KEY_VALS

该表存储分区字段值。

元数据表字段

说明

示例数据

PART_ID

分区ID

2

PART_KEY_VAL

分区字段值

2015-06-12

INTEGER_IDX

分区字段值顺序

0

PARTITION_PARAMS

该表存储分区的属性信息。

元数据表字段

说明

示例数据

PART_ID

分区ID

2

PARAM_KEY

分区属性名

numFiles、numRows

PARAM_VALUE

分区属性值

15、502195

示例

建表语句:

CREATE TABLE lxw1234 (

cookieid STRING,

url STRING,

ua STRING,

ip STRING,

createtime STRING

)

COMMENT 'This is the page view table'

partitioned BY (day STRING,site STRING)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ','

stored AS ORC;

建表执行之后,元数据中以下表的数据会有所变化:

TBLS

生成了表lxw1234的基本信息

SELECT * FROM TBLS WHERE TBL_NAME = ‘lxw1234’;

元数据表字段

数据

TBL_ID

41509

CREATE_TIME

1436324659

DB_ID

11

LAST_ACCESS_TIME

0

OWNER

liuxiaowen

RETENTION

0

SD_ID

91740

TBL_NAME

lxw1234

TBL_TYPE

MANAGED_TABLE

VIEW_EXPANDED_TEXT

NULL

VIEW_ORIGINAL_TEXT

NULL

TABLE_PARAMS

select  *  from  TABLE_PARAMS  WHERE  TBL_ID=41509

TBL_ID

PARAM_KEY

PARAM_VALUE

41509

comment

This is the page view table

41509

transient_lastDdlTime

1436324659

SDS

SELECT * FROM SDS WHERE SD_ID = 91740

元数据表字段

数据

SD_ID

91740

CD_ID

41564

INPUT_FORMAT

org.apache.hadoop.hive.ql.io.orc.OrcInputFormat

IS_COMPRESSED

0

IS_STOREDASSUBDIRECTORIES

0

LOCATION

hdfs://namenode/hivedata/warehouse/liuxiaowen.db/lxw1234

NUM_BUCKETS

-1

OUTPUT_FORMAT

org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat

SERDE_ID

91740

SERDES

select * from SERDES WHERE SERDE_ID = 91740

元数据表字段

数据

SERDE_ID

91740

NAME

SLIB

org.apache.hadoop.hive.ql.io.orc.OrcSerde

SERDE_PARAMS

select * from  SERDE_PARAMS  WHERE  SERDE_ID=91740

SERDE_ID

PARAM_KEY

PARAM_VALUE

91740

field.delim

,

91740

serialization.format

,

COLUMNS_V2

select * from COLUMNS_V2 WHERE CD_ID=41564 ORDER BY INTEGER_IDX

CD_ID

COMMENT

COLUMN_NAME

TYPE_NAME

INTEGER_IDX

41564

cookieid

string

0

41564

url

string

1

41564

ua

string

2

41564

ip

string

3

41564

createtime

string

4

PARTITION_KEYS

select * from  PARTITION_KEYS  WHERE  TBL_ID=41509

TBL_ID

PKEY_COMMENT

PKEY_NAME

PKEY_TYPE

INTEGER_IDX

41509

day

string

0

41509

site

string

1

再插入数据:

INSERT OVERWRITE TABLE lxw1234 PARTITION (day = '2015-07-08', site = 'lxw1234.com')

SELECT

'cookie1' AS cookieid,

'http://lxw1234.com' AS url,

'firefox' AS ua,

'127.0.0.1' AS ip,

'2015-07-08 11:00:01' AS createtime

FROM dual

limit 1;

插入数据执行完之后,以下表的元数据发生变化:

PARTITIONS

select * from  `PARTITIONS`  WHERE  TBL_ID=41509

PART_ID

CREATE_TIME

LAST_ACCESS_TIME

PART_NAME

SD_ID

TBL_ID

54472

1436325812

0

day=2015-07-08/site=lxw1234.com

91746

41509

SDS

select *  from  SDS  WHERE  SD_ID=91746

注意:这里的存储和表的存储是不同的,因为每个分区也会有一个SD

元数据表字段

数据

SD_ID

91746

CD_ID

41564

INPUT_FORMAT

org.apache.hadoop.hive.ql.io.orc.OrcInputFormat

IS_COMPRESSED

0

IS_STOREDASSUBDIRECTORIES

0

LOCATION

hdfs://namenode/hivedata/warehouse/liuxiaowen.db/lxw1234/day=2015-07-08/site=lxw1234.com

NUM_BUCKETS

-1

OUTPUT_FORMAT

org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat

SERDE_ID

91746

PARTITION_KEY_VALS

select  *  from  PARTITION_KEY_VALS  where  PART_ID=54472

PART_ID

PART_KEY_VAL

INTEGER_IDX

54472

2015-07-08

0

54472

lxw1234.com

1

PARTITION_PARAMS

select * from PARTITION_PARAMS where PART_ID = 54472

PART_ID

PARAM_KEY

PARAM_VALUE

54472

COLUMN_STATS_ACCURATE

true

54472

numFiles

1

54472

numRows

1

54472

rawDataSize

408

54472

totalSize

703

54472

transient_lastDdlTime

1436325813

在分区的属性里面,生成的该分区的统计信息(Statistics)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/427827.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CentOs7.2编译安装Nginx服务器

1. 安装nginx依赖 首先安装nginx的依赖 yum install gcc gcc-c openssl openssl-devel cyrus-sasl-md5 2,创建nginx用户 如果没有nginx,启动nginx时会报错 [rootlocalhost nginx-1.11.2]# /usr/local/nginx/sbin/nginx nginx: [emerg] getpwnam("ng…

2017-2018-2 20179215《网络攻防实践》第六周作业

2017-2018-2 20179215《网络攻防实践》 第六周学习总结 课本学习笔记 一、TCP/IP网络协议攻击 1.网络安全的属性:机密性 、完整性 、可用性 、真实性 、不可抵赖性 。 2.网络攻击的基本模式分为:截获(嗅探 与 监听) 、中断&#x…

mysql分布式一致性hash_分布式哈希一致性

问题分布式哈希一致性的动机是什么?相比其他有什么好处概述我们谈论的分布式哈希一致性常常使用在负载均衡,权衡一个策略的好坏,我们常常谈到扩展性和容错性。我们可以从以下两个方面来考量扩展性 :水平扩展和垂直扩展&#xff0c…

css3 - target

通过CSS3伪元素target&#xff0c;我们可以实现拉风琴 源码 1 <!DOCTYPE HTML>2 <html lang"en-US">3 4 <head>5 <meta charset"UTF-8">6 <title>垂直手风琴</title>7 <style type"text/css"…

javascript中打印对象显示[object object]_js如何打印object对象

这篇文章主要介绍了js如何打印object对象,需要的朋友可以参考下 js调试中经常会碰到输出的内容是对象而无法打印的时候,光靠alert只能打印出object标示,却不能打印出来里面的内容,甚是不方便,于是各方面整理总结了如下一个函数,能够将数组或者对象这类的结果一一打印出来…

弹弹堂sf发布网_私服冒险岛,新开私服冒险岛,心动sf冒险岛发布网,最新开的私服冒险岛应该如何快速的获取魅力呢?...

私服冒险岛,新开私服冒险岛,心动sf冒险岛发布网,最新开的私服冒险岛应该如何快速的获取魅力呢&#xff1f;不同的游戏&#xff0c;我们在操作的时候&#xff0c;最主要的一点就是想要去涨经验&#xff0c;只有通过经验的积累才可以快速的升级&#xff0c;才可以进入到更多的地图…

svm解决兵王问题_机器学习: svm

本周学习内容为SVM的基本原理和运用。参考资料&#xff1a;耳东陈&#xff1a;零基础学SVM—Support Vector Machine(一)1、什么是SVMSVM的全称是Support Vector Machine&#xff0c;即支持向量机&#xff0c;主要用于解决模式识别领域中的数据分类问题&#xff0c;属于有监督学…

Django基础11(Django中form表单)

Form介绍 之前在HTML页面中利用form表单向后端提交数据时&#xff0c;都会写一些获取用户输入的标签并且用form标签把它们包起来。 与此同时我们在好多场景下都需要对用户的输入做校验&#xff0c;比如校验用户是否输入&#xff0c;输入的长度和格式等正不正确。如果用户输入的…

mysql上k8s_通过搭建MySQL掌握k8s(Kubernetes)重要概念(上):网络与持久卷

上一篇"通过实例快速掌握k8s(Kubernetes)核心概念"讲解了k8s的核心概念&#xff0c;有了核心概念整个骨架就完整了&#xff0c;应付无状态程序已经够了&#xff0c;但还不够丰满。应用程序分成两种&#xff0c;无状态和有状态的。一般的前段和后端程序都是无状态的&a…

python简单笔记

Remarks&#xff1a;python中注意缩进&#xff08;Tab键或者4个空格&#xff09; print&#xff08;输出&#xff09; 格式&#xff1a;print&#xff08;values&#xff09; 字符串、数字、变量等都可以输出&#xff1a; 实例&#xff1a; print(1)->1 print(11)->2 a …

【Alpha阶段】第一次Scrum Meeting

PS&#xff1a;因为安装android的SDK插件出现问题&#xff0c;在eclipse和android studio中安装都不成功&#xff0c;项目不能运行&#xff0c;且一直在下载一些插件&#xff0c;安装了3天都没有成功&#xff0c;按照网上的解决办法进行解决都没有成功&#xff0c;导致项目不能…

581. Shortest Unsorted Continuous Subarray连续数组中的递增异常情况

&#xff3b;抄题&#xff3d;&#xff1a; Given an integer array, you need to find one continuous subarray that if you only sort this subarray in ascending order, then the whole array will be sorted in ascending order, too. You need to find the shortest suc…

python三阶魔方_三阶魔方自动求解及动态可视化matlab代码

三阶魔方自动求解及动态可视化matlab代码思路与步骤三阶魔方有6个面&#xff0c;每个面有333\times333小块&#xff0c;用一个6336\times3\times3633的矩阵来保存魔方的状态&#xff1b;定义412种魔方旋转行为&#xff1a;整体旋转(左右上下共4种方式AaCc)&#xff0c;侧面(6个…

Qt 常用类——QStandardItemModel

转载&#xff1a;落叶知秋时 类QabstractItemModel&#xff0c;QabstractListModel&#xff0c;QAbstractTableModel不保存数据&#xff0c;用户需要从这些类派生出子类&#xff0c;并在子类中定义某种数据结构来保存数据。 与此不同&#xff0c;类QStandardItemModel负责保存数…

ad19原理图标注_AD19中原理图的模板如何进行编辑?

我们在进行原理图设计的时候&#xff0c;有时候不想去用软件自带默认的模板&#xff0c;想要用自己设计的模板&#xff0c;就涉及到我们的模板怎么去编辑的呢&#xff1f;我们应该如何去编辑原理图自己设计的模板&#xff1f;操作步骤是怎么的呢&#xff1f;我们今天就以AD19为…

mysql+秘密_mysql不被人知的秘密

http://blog.csdn.net/yueguanghaidao/article/details/69333872011先建立两张表。1.student表2.grade表一&#xff1a;mysql的复制技术1.表与数据的复制->>实现表结构和数据的同步create table desttable select * from srctable;(desttable:目标表&#xff0c;srctable…

mysql一个表几亿数据_如何在mysql 造1亿条记录的大容量数据表?

背景及目标&#xff1a;现有数据1000w单表&#xff0c;为压力测试准备1亿条数据。步骤&#xff1a;1.将1000w条记录&#xff0c;除id外都导入到多个文件中&#xff1a;//DELIMITERDROP PROCEDURE if EXISTS createManyTable;create PROCEDURE createManyTable()BEGINDECLARE i …

windows键盘在mac上怎么识别_Mac电脑怎么使用pc键盘?

苹果电脑一般需要使用配套的mac键盘&#xff0c;毕竟按键和普通pc键盘不一样。但是总会遇到一些情况&#xff0c;比如配套的mac键盘坏了&#xff0c;而刚好有一个pc键盘&#xff0c;那么这时候苹果电脑要怎么用pc键盘呢&#xff1f;这边小编跟大家介绍mac电脑连接pc键盘以及设置…

LOJ#6002. 「网络流 24 题」最小路径覆盖

模板。 1 #include<iostream>2 #include<cstring>3 #include<cstdio>4 //#include<time.h>5 //#include<complex>6 //#include<set>7 //#include<queue>8 #include<algorithm>9 #include<stdlib.h>10 using namespace s…

zabbix mysql设置中文乱码_解决zabbix监控因php问题导致图形界面中文乱码方法

解决因编译php中添加了-enable-gd-jis-conv选项导致Zabbix监控系统图形界面中文乱码问题现象&#xff1a;php编译参数&#xff1a;说明&#xff1a;如果PHP编译时启用–enable-gd-jis-conv选项的话&#xff0c;那么非ASCII字符(例如汉字、拼音、希腊文和箭头) 会被当成EUC-JP编…