Hive-表设计优化 1.Hive查询基本原理 Hive的设计思想是通过元数据解析描述将HDFS上的文件映射成表。 基本的查询原理是当用户通过HQL语句对Hive中的表进行复杂数据处理和计算时,默认将其转换为分布式计算MapReduce程序对HDFS中的数据进行读取处理的过程。 当执行查询计划时,Hive会使用表的最后一级目录作为底层处理数据的输入。 2.分区表的设计与使用 普通表结构问题: 3.分桶表的设计与使用 4.索引的设计与使用