大家想了解更多大数据相关内容请移驾我的课堂: 大数据相关课程 剖析及实践企业级大数据 数据架构规划设计 大厂架构师知识梳理:剖析及实践数据建模 剖析及实践数据资产运营平台 Spark作为大数据领域离线计算的王者,在分布式数据处理计算领域有着极高的处理效率,而Python作为Spark支持的开发的重要语言之一,特别对各类机器学习算法的支持,使得有着极高的使用率,本系列文章将通过介绍Spark的基础使用,带大伙入坑Spark 一、什么是Spark Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎。 1.1 框架模块