Hive精华问答 | Hive的数据模型是怎样的?

640?wx_fmt=png

Hive是一个数据仓库基础工具,它是建立在Hadoop之上的数据仓库,在某种程度上可以把它看做用户编程接口(API),本身也并不存储和处理数据,依赖于HDFS存储数据,依赖MR处理数据。它提供了一系列对数据进行提取、转换、加载的工具。依赖于HDFS存储数据,依赖MR处理数据。


640?wx_fmt=gif1

Q:Hive是什么?


A:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本质是将HQL转换为MapReduce程序。


640?wx_fmt=gif2

Q:Hive的设计目标是什么?


A:1、Hive的设计目标是使Hadoop上的数据操作与传统SQL相结合,让熟悉SQL编程开发人员能够轻松向Hadoop平台迁移

2、Hive提供类似SQL的查询语言HQL,HQL在底层被转换为相应的MapReduce操作

3、Hive在HDFS上构建数据仓库来存储结构化的数据,这些数据一般来源与HDFS上的原始数据,使用Hive可以对这些数据执行查询、分析等操作。


640?wx_fmt=gif3

Q:Hive的数据模型是怎样的?


A:Hive数据库

内部表

外部表

分区

Hive的视图

Hive在创建内部表时,会将数据移动到数据仓库指向的路径,若创建外部表,仅记录数据所在的路径,不对数据位置做任何改变,在删除表的时候,内部表的元数据和数据会被一起删除,外部表只会删除元数据,不删除数据。这样来说,外部表要比内部表安全,数据组织液更加灵活,方便共享源数据。


640?wx_fmt=gif4

Q:Hive都有哪些调用方式?


A1、Hive Shell

2、Thrift

3、JDBC

4、ODBC


640?wx_fmt=gif5

Q:Hive的运行机制是什么?


A:1、将sql转换成抽象语法树

2、将抽象语法树转化成查询块

3、将查询块转换成逻辑查询计划(操作符树)

4、将逻辑计划转换成物理计划(M\Rjobs)


640?wx_fmt=png


福利

扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!


640?wx_fmt=jpeg


推荐阅读:

  • OpenStack入门科普,看这一篇就够啦!

  • 优秀工程师必备的一项技能,你解锁了吗?

  • 被窦唯夸奖“音乐好”的刺猬乐队成员竟然是程序员

  • 乔纳森离开苹果;李彦宏被泼水;Windows 公开 Linux 内核源代码 | 开发者周刊

  • 以太坊暗网? 这群北大才子做到了...

  • 智能文本信息抽取算法的进阶与应用

  • 人工智能六十年技术简史


    真香,朕在看了!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/523137.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网络虚拟化技术为双11提供灵动网络

摘要: 12月13-14日,由云栖社区与阿里巴巴技术协会共同主办的《2017阿里巴巴双11技术十二讲》顺利结束,集中为大家分享了2017双11背后的黑科技。本文是《网络虚拟化技术为双11提供灵动网络》演讲整理,主要讲解了混合云技术的应用与…

阿里1682亿背后的协同研发云——云效公共云正式商业化

摘要: 2017年12月20日云栖大会北京峰会,阿里云宣布其一站式企业协同研发云产品——云效公共云版本正式进入商业化服务阶段,同时云效还发布了三大新功能模块:跨团队联合作战的项目集、多维度测试服务、便捷高效的移动端工作台。 20…

符号库匹配不对的原因_中频点焊机焊接螺母有流渣是什么原因造成的?-苏州安嘉...

中频点焊机焊接螺母有流渣是什么原因造成的?主要的原因是输入热量过大,焊接区域金属熔化溢流出产生的;中频点焊机焊接螺母有流渣是螺母焊接过程中常见的问题,也是使用过程最需要避免出现的问题,因为这影响到螺栓无法通…

5分钟,带你了解不同类型的云计算!

戳蓝字“CSDN云计算”关注我们哦!译者 | 风车云马要掌握云计算的核心内容,需要很好地理解三种云:私有云、公共云和混合云。本文让您快速了解它们的存在原因、实际含义、它们之间的区别以及为什么不同的组织选择使用不同的云模型。为什么有三种…

数十万应用结点全息监控,ARMS新上线的应用监控神器到底有多牛?

摘要: 就在不久前,2017年阿里双11刚刚创下电商史上的新销售奇迹,24小时交易金额达1682亿,每秒交易创建峰值325000,每秒支付峰值256000!在这个海量交易背后是数十万个结点规模的应用的高效运行。 就在不久前…

easyui-textbox锁定按钮不锁定_不放水了!湖人G5改穿曼巴球衣,热火输定了,詹姆斯提前锁定FMVP!...

在昨天湖人赢球后,NBA著名评论员帕金斯开玩笑的建议:要不G5湖人换上曼巴球衣吧!现在这句玩笑话成真了。湖人官方在今早宣布,在G5他们将会改穿曼巴球衣,而原本计划的是G7才会穿的,而现在明显湖人等不到G7了。…

阿里云迁云方式大汇总

摘要: 前不久,阿里云发布了一款迁云神器,即 阿里云迁云工具,使用该迁云神器您可以方便快捷地将服务器迁移至阿里云。 其实,除了迁云神器之外,还有其他迁移服务器至阿里云的途径。 以下分别从迁云方式和服务…

2019年技术盘点容器篇(三):阿里专家谈容器:既叫好又叫座? | 程序员硬核评测...

戳蓝字“CSDN云计算”关注我们哦!作者:刘晶晶据相关调研机构出具的报告数据显示,目前应用容器市场规模将从2016年的 7.62亿美元增长到2020年的27亿美元。显而易见,引入容器所展现的巨大灵活性有效推动了其采用速率,使企…

【产品活动】阿里云GPU云服务器年付5折!阿里云异构计算助推行业发展!

摘要: 阿里云GPU云服务器全力支持AI生态发展,进一步普惠开发者红利,本周将会推出针对异构计算GPU实例GN5年付5折的优惠活动,希望能够打造良好的AI生态环境,帮助更多的人工智能企业以及项目顺利上云。 活动规则&#xf…

更改盘符不成功_DVD光驱不读盘怎么解决?DVD光驱能刻录吗

外置移动光驱就是在机箱外面放置的光驱,具有便携、移动的特点。具有多种数据接口,主要还是USB接口,可以读取CD、DVD以及刻录CD。对于光驱你了解多少呢?DVD光驱不读盘怎么解决?它还能刻录吗?下面我们就一起去…

IoT日志利器:嵌入式日志客户端(C Producer)发布

摘要: 2017年12月19日至20日,2017云栖大会北京峰会在国家会议中心召开,飞天智能是贯穿云栖大会不变的主题,云计算、大数据、人工智能、物联网等热门话题备受各方关注。其中阿里云日志服务发布的嵌入式日志采集客户端(C…

Storm精华问答 | Storm如何连接MySQL?

Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,大数据实时处理解决方案的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Storm更是流计算技术…

ECS 控制台诊断系统

摘要: 控制台诊断系统,旨在为您提供快速反馈问题的渠道,在降低您的反馈成本的同时,第一时间为您提供解决方案,减少您的损失,给您提供更加平滑的控制台操作体验。 当您在操作 ECS控制台 时,可能会…

android 获取通讯录全选反选_Xamarin.Forms读取并展示Android和iOS通讯录 TerminalMACS客户端...

本文同步更新地址:https://dotnet9.com/11520.htmlhttps://terminalmacs.com/861.html阅读导航:一、功能说明二、代码实现三、源码获取四、参考资料五、后面计划一、功能说明完整思维导图:https://github.com/dotnet9/TerminalMACS/blob/mast…

IDEA Terminal替换成Git Bash_05

IDEA Terminal替换成Git Bash 在IDEA中,打开settings,设置相应的bash路径 settings–>Tools–>Terminal–>Shell path:C:\Program Files\Git\bin\bash.exe

再提“鸿蒙”,任正非说这是为物联网而生;硅谷公司年薪报告出炉,谷歌年薪居榜首;苹果CEO库克接班人浮出水面,苹果高层或大换血?...

关注并标星星CSDN云计算极客头条:速递、最新、绝对有料。这里有企业新动、这里有业界要闻,打起十二分精神,紧跟fashion你可以的!每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 麒麟810芯片真容&#xff08…

ECS 按量付费VPC实例停机不收费FAQ

摘要: 停机不收费支持范围 目前只支持VPC类型的按量付费的ECS实例,您需要在控制台签署接受停机不收费协议可以开启。开启之后下次Stop机器自动进入停机不收费模式。不影响您的经典网络和包年包月预付费ECS实例的行为。 停机不收费支持范围 目前只支持VP…

在maven引入一个maven仓库中不存在的jar,安装本地底仓库

问题描述:如果要在一个maven工程中引入一个不存在的jar,即无法通过denpendecy的gav定位到。 处理方式: 方式一:如果maven工程是war包形式,可以直接放在 WEB-INF下的lib目录中,然后add到类路径中。 方式二…

重磅!Python再次第一,Java和C下降,凭什么?

编程语言流行指数(PYPL)排行榜近日公布了2019年7月份榜单。在最新一期榜单上, Python的份额高达28.08%,再次蝉联第一,并且增长4.7%,同时成为增长势头较好的语言。而被挤到第二蝉联Java,同比下跌1.8个百分点…