一、概念
Hadoop 是一个开源的分布式计算和存储框架。
Hadoop 使用 Java 开发,所以可以在多种不同硬件平台的计算机上部署和使用。其核心部件包括分布式文件系统 (Hadoop DFS,HDFS) 和 MapReduce。
二、HDFS
命名节点 (NameNode)
命名节点 (NameNode) 是用于指挥其它节点存储的节点。
数据节点 (DataNode)
数据节点 (DataNode) 使用来储存数据块的节点。
副命名节点 (Secondary NameNode)
副命名节点 (Secondary NameNode) 别名"次命名节点",是命名节点的"秘书"。
三、MapReduce
分布式记录合并结果