本节需要修改的 YARN 配置文件保存在$HADOOP_HOME/etc/haoop 目录下,需要修改的文件共有 7 个,分别是:core-site.xml, hadoop-env.sh, hdfs-site.xml, yarn-site.xml, yarn-env.sh, mapred-site.xml, slave. 这些文件的用途:
-
core-site.xml:
-
用途:包含 Hadoop 核心配置,例如文件系统的默认URI、Hadoop运行时环境的全局设置等。
-
示例配置项:
<configuration><property><!--指定默认的文件系统。在这里,它设置为 HDFS 的地址 hdfs://hadoop1:9000 --><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><!-- 其他配置项 --> </configuration>
-
-
hadoop-env.sh:
-
用途:配置 Hadoop 环境变量,例如 Java 路径、内存设置等。
-
示例配置项:
export JAVA_HOME=/path/to/java export HADOOP_HEAPSIZE=1024 # 其他环境变量配置
-
-
hdfs-site.xml:
-
用途:包含 Hadoop 分布式文件系统(HDFS)的配置,如数据块大小、复本数等。
-
示例配置项:
<configuration><property><name>dfs.namenode.secondary.http-address</name><value>hadoop1:9001</value></property><property><!-- 指定数据块的默认复制因子。在这里,设置为 3,表示每个数据块会被复制到三个节点上--><name>dfs.replication</name><value>3</value></property><!-- 其他配置项 --> </configuration>
-
-
yarn-site.xml:
-
用途:包含 YARN(Yet Another Resource Negotiator)配置,例如 ResourceManager 地址、NodeManager 的资源配置等。
-
示例配置项:
<configuration><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property><!-- 其他配置项 --> </configuration>
-
-
yarn-env.sh:
-
用途:配置 YARN 环境变量,例如 Java 路径、内存设置等。
-
示例配置项:
export JAVA_HOME=/path/to/java export YARN_HEAPSIZE=1024 # 其他环境变量配置
-
-
mapred-site.xml:
-
用途:包含 MapReduce 配置,如 MapReduce 框架的运行模式、任务跟踪器地址等。使用的时候可以先从模板中复制,然后再编辑。
-
示例配置项:
<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property><property><name>mapreduce.jobhistory.address</name><value>hadoop1:10020</value></property><property><name>mapreduce.jobhistory.webapp.address</name><value>hadoop1:19888</value></property> </configuration>
-
-
slaves:
-
用途:列出参与 Hadoop 集群的计算节点(DataNode、NodeManager)。每行一个节点。
-
示例:
hadoop1 hadoop2 hadoop3
-