一、Namespace的概述
1.1.集群与命名空间的关系
类似于大集群与小集群之间的关系,彼此之间独立又相互依存。每个namespace彼此独立,Namespace工作时只负责维护本区域的数据,同时所有的namespace维护的文件都可以共用DataNode节点,为了区分数据属于哪些Namespace,DataNode会通过BlockPool的形式进行管理
1.2.管理Namespace的文件
当我们格式化namenode的时候,会产生一个包含 Cluster 相关的信息
- namespaceID:这是命名空间的唯一标识符,它在HDFS集群中标识一个特定的命名空间实例。在HDFS中,每个命名空间都有一个唯一的ID,用于区分不同的命名空间。
- clusterID:这是HDFS集群的全局唯一标识符。所有命名空间和存储池(Block Pools)都属于这个集群ID。
- cTime:这是集群的创建时间戳,通常在集群首次格式化时设置。
- storageType:这指明了节点的类型,在这个上下文中是NAMENODE,意味着这个存储信息是关于NameNode的。
- blockpoolID:这是Block Pool的唯一标识符,它与一个特定的命名空间关联,并且管理属于那个命名空间的所有数据块(Blocks)。Block Pool可以跨多个DataNode,这些DataNode存储属于同一个