spark环境搭建java_Spark MLlib 环境搭建超详细教程

1、系统及环境版本

系统:Win7 旗舰版 64位 sp1

JDK:1.8.0

Spark:2.3.2

Hadoop:2.7

Scala:2.11.8

文章最后,有所有版本的下载链接,不用再去折腾版本之间的问题。

2、环境下载

2.1 Spark 下载

9f40fe1b6587

spark

2.2 hadooponwindos 下载

9f40fe1b6587

image.png

2.3 Hadoop 下载

9f40fe1b6587

image.png

2.4 JDK下载

2.5 IntelliJ IDEA

2.6 scala 下载

2.7 IntelliJ-scala plug 下载

9f40fe1b6587

image.png

至此,准备工作才算完成!

3、环境配置

安装ideaIC-2017.3.5.exe。

除了scala-intelliJ-bin-2017.3.15不需要解压外,其他能解压的都需要解压。

重要:配置之前,需要把2.2中的bin文件夹替换掉2.3中的bin文件夹

重要:配置之前,需要把2.2中的bin文件夹替换掉2.3中的bin文件夹

重要:配置之前,需要把2.2中的bin文件夹替换掉2.3中的bin文件夹

重要的事说三遍!

3.1 JAVA环境配置:

JAVA_HOME:java所在的目录,注意不是bin目录

PATH:%JAVA_HOME%\bin

ClassPath:%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar

3.2 Hadoop环境配置

HADOOP_HOME:hadoop解压的目录

Path:%HADOOP_HOME%\bin

3.3 Spark环境配置

SPARK_HOME:spark解压的目录

Path:%SPARK_HOME%\bin

3.4 Scala环境配置

SCALA_HOME:scala解压的目录

Path:%SCALA_HOME%\bin

4、IDE的配置

4.1创建新项目

9f40fe1b6587

image.png

4.2 选择Project SDK

选择刚才解压的JAVA目录

9f40fe1b6587

image.png

next>next>finesh!

此时可以看到 external library只有一个jdk1.8

9f40fe1b6587

image.png

4.3 安装scala插件

file>settings

9f40fe1b6587

image.png

9f40fe1b6587

image.png

4.4 重启IntelliJ

重启之后:

9f40fe1b6587

image.png

9f40fe1b6587

image.png

选择scala的解压的目录,我原来装过一个2.11.12版本的,所以,我这里会有两个版本,应该选择2.11.8版本。

4.5 添加spark library

9f40fe1b6587

此时,新建项目之后可以看到,external libraryes 出现了 jdk1.8 和scala sdk。

我们最后再添加spark library

file>project structure

9f40fe1b6587

image.png

Libraries > +

之后添加解压后的spark下的jars

9f40fe1b6587

image.png

最终可以看到External Libraries出现了三个。

9f40fe1b6587

image.png

4.6 建一个Sparkdemo 的object

9f40fe1b6587

image.png

import org.apache.spark._

object SparkDemo {

def main(args: Array[String]): Unit = {

val masterUrl = "local[1]"

val conf = new SparkConf().setAppName("helenApp").setMaster(masterUrl)

val sc = new SparkContext(conf)

val rdd = sc.parallelize(List(1, 2, 3, 4, 5, 6)).map(_ * 3)

rdd.filter(_ > 10).collect().foreach(println)

println(rdd.reduce(_ + _))

println("hello world")

}

}

4.7 ctrl+shift+F10运行!

最终,成功!

9f40fe1b6587

image.png

由于是小白,所以记录得很详细。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/534901.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python自动发邮件附件_python自动发送带附件的邮件(163邮箱,亲测可用)

1.设置发送邮件邮箱的SMTP服务 https://www.360kuai.com/pc/927b9f8da3555bb70?cota4&kuai_so1&tj_urlxz&sign360_57c3bbd1&refer_sceneso_1 设置步骤时,记住设置的邮箱的独立密码,在以下脚本中能够用到2. python脚本 import smtplib f…

java 导出bcp文件格式_使用BCP导出导入数据

bcp 实用工具可以在 Microsoft SQL Server 实例和用户指定格式的数据文件间大容量复制数据。 使用 bcp 实用工具可以将大量新行导入 SQL Server 表,或将表数据导出到数据文件。 除非与 queryout 选项一起使用,否则使用该实用工具不需要了解 Transact-SQL…

鱼骨图分析法实际案例_会用“鱼骨图”的项目经理无难题

项目经理在遇到一些瓶颈问题时,如何突破这些难题?答案就是鱼骨图!项目经理,广州深圳PMP培训,PMP认证考试培训机构,圣略PMP培训考试1、鱼骨图分析法介绍鱼骨图的由来及含义鱼骨图是由日本管理大师石川馨先生所发明出来的,故又名石川…

mysql5.6.msi 百度云_如何安装Mysql数据库类型msi(5.6)

首先让大家看下我下载的数据库有多少哈,还不包括我删除的一些数据库。光是8.0.17.0的数据库我就下载了四五个,经常安装数据报错,我一直找不到是啥原因,所以我就把所有的全部给删掉了,然后一遍一遍的安装。现在想想还真…

mysql如何下载msi_2、Windows下MySQL数据库下载与安装详细教程 MSI方式

做者:叁念mysql写在前言:本文篇幅比较长,可是整体分为三大部分:下载部分、安装部分、环境配置与测试部分 ;读者能够自行选择阅读web1、下载部分MySQL数据库下载与安装详细教程sql1.如何下载MySQL?(本文章以5.6版本实际…

python词云乱码_python词云库wordCloud使用方法详解(解决中文乱码)

文章中的例子主要借鉴wordColud的examples,在文章对examples中的例子做了一些改动。 一、wordColud设计中文词云乱码 使用wordColud设计词云的时候可能会产生乱码问题,因为wordColud默认的字体不支持中文,所以我们只需要替换wordColud的默认字…

linux同时安装python2和python3_linux-Centos7安装python3并与python2共存

1.查看是否已经安装Python CentOS 7.2 默认安装了python2.7.5 因为一些命令要用它比如yum 它使用的是python2.7.5。 使用 python -V 命令查看一下是否安装Python 然后使用命令 which python 查看一下Python可执行文件的位置可见执行文件在/usr/bin/ 目录下,切换到该…

opencv获取模板旋转角度_OpenCV入门之获取图像的旋转角度

在我们的日常生活中,所碰到的图像往往都有一定的倾斜。那么,如何用OpenCV来获取图像的旋转角度呢?   我们以下面的图片为例,简单介绍如何用OpenCV来获取图像的旋转角度。可以看到,该图像存在着许多噪声,且…

后台使用orm多还是直接sql_Django应用app创建及ORM

Django应用app创建及ORM一.重要知识点回顾:1. form表单提交数据的注意事项:1. 是form不是from,必须要有method和action (action用来指定你的数据提交到后台哪个地方,method用来指定你提交数据的方式)2. 所有获取用户输入的表单标签要放在form表单里面&am…

求一批整数中出现最多的个位数字_C语言经典100例007-求低n-1位的数

系列文章《C语言经典100例》持续创作中,欢迎大家的关注和支持。喜欢的同学记得点赞、转发、收藏哦~后续C语言经典100例将会以pdf和代码的形式发放到公众号欢迎关注:计算广告生态 即时查收1 题目函数:unsigned fun(unsigned w)功能…

java文件序列化_Java序列化与反序列化,文件操作

参考两篇博客:http://blog.csdn.net/moreevan/article/details/6697777http://blog.csdn.net/moreevan/article/details/6698529针对第二篇博客,看了下面的评论,发现子类输出的书号其实是父类的,书名是自己先添加的成员变量&#…

python自定义模块和三方模块_python基础知识8——模块1——自定义模块和第三方开源模块...

模块的认识模块,用一砣代码实现了某个功能的代码集合。类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来,可能需要多个函数…

dhcp只能分配与路由器相同网段么_路由器的桥接详解

网上关于路由器无线桥接的教程很多,让你注意那注意这的,都没有说明白。今天,我来试着缕清它们间的关系!1、主路由器这是我主路由器目前的状态,其中IP地址是我在上级光猫路由的可用ip段192.168.1.2~254里选的一个&#…

java orcl自动_Oracle自动生成编号

祝大家新年快乐,有任何问题可与我联系:今天用JAVA向Oracle数据库中插数据时,每次都要去计算ID,觉得好麻烦,于是想到了用数据库自带的ID来做,具体如下:1、首先得创建一序列序列(SEQUENCE)序列是一…

import java.awt.BorderLayout;_Swing-布局管理器之BorderLayout(边界布局)-入门

边界布局管理器(BorderLayout)把容器的的布局分为五个位置:CENTER、EAST、WEST、NORTH、SOUTH。依次对应为:上北(NORTH)、下南(SOUTH)、左西(WEST)、右东(EAST),中(CENTER),如下图所示。特征:l 可以把组件放在这五个位…

java 建造者实际中的用法_java中j建造者模式详解和使用方法

建造者模式(Builder Pattern)使用多个简单的对象一步一步构建成一个复杂的对象。这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。一个 Builder 类会一步一步构造最终的对象。该 Builder 类是独立于其他对象的。介绍意图:将一个复杂的…

jsp测试mysql_Jsp登陆与MySQL对接验证

最近在做一个Web项目,账户登陆验证是Web项目中必不可少的环节,所以需要阶段性的记录,帮助自己更好的掌握其中的知识。Jsp登陆涉及到POST方法参数获取,以及MySQL数据库信息的获取。可能因为自己是新手,刚开始写的项目有…

数据归一化处理方法_科研常用的实验数据分析与处理方法

科研常用的实验数据分析与处理方法对于每个科研工作者而言,对实验数据进行处理是在开始论文写作之前十分常见的工作之一。但是,常见的数据分析方法有哪些呢?常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分…

信息系统项目管理师_信息系统项目管理师通过率是多少?

答:信息系统项目管理师考试每个地区的通过率都是不一样的,一般全国在10%-20%左右,这个20%的通过率是按参考人数作为统计,就是除去了那些报名了但是没去参加考试的考生,如果算上所有报名考生的通过率数据,那…

类型“unknown”上不存在属性“foreach”_JavaScript红宝书第四版精简解析系列--映射Map数据类型...

Map数据类型顾名思义也就是映射类型,包含一个[[Entries]]私有特性我们可以使用一个二维数组作为初始值const map1 new Map([[1, 1],[2, 2],[3, 3],]); console.log("Map数据类型>", map1);当然也可以使用迭代器进行初始化const map2 new Map({[Symbol.iterator]…