2019独角兽企业重金招聘Python工程师标准>>>
Spark集群预览:
官方文档对spark集群的初步描述如下,这是一个典型的主从结构:
官方文档对spark集群中的一些关键点给出详细的指导:
其Worker的定义如下所示:
需要注意的是Spark Driver所在的集群需要和Spark集群最好位于同一个网络环境中,因为Driver中的SparkContext实例需发送任务给不同Worker Node的Executor并接受Executor的一些执行结果信息,一般而言,在企业实际的生产环境中Driver所在的机器是的配置往往都是比较不错的,尤其是其CPU的处理能力要很强悍。