1、学习内容
(1)了解什么是代理服务器
(2)了解什么是历史服务器
2、辅助架构
(1)辅助架构的由来
对于YARN架构来讲,除了ResourceManager集群资源总管家、NodeManager单机资源管家两个核心角色外,还可以搭配两个辅助角色使得YARN架构的运行更加稳定、更加高效。
辅助角色:
~代理服务器(ProxyServer)
~历史服务器(JobHistoryServer)
[代理服务器]:
注意,此处将代理服务器分离出来,让其独立运行,会在一定程度上提高安全性。
[历史服务器]:
功能:记录历史运行的程序的信息以及产生的日志并提供WEB UI站点供用户使用浏览器查看。
在这里,我们可以能会有疑惑,为什么要专门设置一个历史服务器呢?如果我想要查看某个程序的运行日志,为什么不直接找到该程序的日志呢?
其实,这个问题和YARN的运行机制是相关的。
YARN负责的资源分配调度,它会在每个节点中画出一定空间大小的内存,即容器,供某个程序使用,那个该程序产生的日志文件,会存储在已划分的容器中。那么,对于一个节点来说,它里面可能会有n个被划分的容器,就会至少存在n个日志文件,更别说,我们不可能之查看一个服务器的日志文件,所以我们在查看某个程序的日志文件时,就会显得特别麻烦。
所以,打开历史服务器是很有必要的。