Spark在Ambari集群环境的使用

news/2025/4/27 11:09:10/文章来源:https://wanghq.blog.csdn.net/article/details/106208985

进入安装sparkclient的节点

hdfs准备一个文件

su - hdfs

vi text.txt

随便写几行东西

#创建目录

hdfs dfs -mkdir /user/hdfs/test

#上传文件

hdfs dfs -put test.txt /user/hdfs/test/

#检查文件是否在

hdfs dfs -ls /user/hdfs/test/

#检查内容是否对

hdfs dfs -cat /user/hdfs/test/test.txt

spark在yarn上运行参见官方文档

http://spark.apache.org/docs/latest/running-on-yarn.html

进入spark-shell

spark-shell --master yarn --deploy-mode client

统计下

scala> sc.textFile("/user/hdfs/test/test.txt").count()

res0: Long = 7

scala> sc.stop()

再次刷新Spark History Server页面即可

http://192.168.128.55:18081/?showIncomplete=false

spark-submit提交任务到yarn

spark-submit --class org.whq.sparkTest.MLTest1 \

--master yarn \

--deploy-mode cluster \

--driver-memory 4g \

--executor-memory 2g \

--executor-cores 1 \

--queue default \

spark244test_2.11-0.1.jar \

10

--deploy-mode cluster集群模式，多个application，每个application启动一个Driver在集群的多台worker（NodeManager）上启动。

--deploy-mode client客户端模式，多个application，每个application启动一个Driver只在本机运行，与集群产生大量通讯。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/416707.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Spark实战之读写HBase

Spark实战之读写HBase

1 配置 1.1 开发环境： HBase：hbase-1.0.0-cdh5.4.5.tar.gzHadoop：hadoop-2.6.0-cdh5.4.5.tar.gzZooKeeper：zookeeper-3.4.5-cdh5.4.5.tar.gzSpark：spark-2.1.0-bin-hadoop2.61.2 Spark的配置 Jar包：需要HBa…

阅读更多...

greenplum vacuum清理删除数据命令

greenplum vacuum清理删除数据命令

官方文档 http://docs.greenplum.org/6-4/ref_guide/sql_commands/VACUUM.html greenplum数据删除后不会释放存储空间，需要命令VACUUM清理释放命令格式 VACUUM [({ FULL | FREEZE | VERBOSE | ANALYZE } [, ...])] [table [(column [, ...] )]] VACUUM [FULL] …

阅读更多...

vitualbox命令操作VBoxManage

vitualbox命令操作VBoxManage

进入本地virtualbox管理运行服务器上的virtualbox 本地直接启动了virtualbox界面这个很牛啊，直接本地图形化管理了，不用纠结服务器端没有显卡，进不去图形界面的问题了。研究了VBoxManage startvm 最后才发现可能这样也行，哈…

阅读更多...

Hadoop2之NameNode HA详解

Hadoop2之NameNode HA详解

在Hadoop1中NameNode存在一个单点故障问题，如果NameNode所在的机器发生故障，整个集群就将不可用(Hadoop1中虽然有个SecorndaryNameNode，但是它并不是NameNode的备份，它只是NameNode的一个助理，协助NameNode工作&#x…

阅读更多...

GCC10.1.0最新版编译

GCC10.1.0最新版编译

官网地址：GCC, the GNU Compiler Collection- GNU Project 下载编译 wget http://mirror.linux-ia64.org/gnu/gcc/releases/gcc-10.1.0/gcc-10.1.0.tar.gztar zxvf gcc-10.1.0.tar.gzcd gcc-10.1.0/mkdir buildcd build/../configure 报错，提示信息co…

阅读更多...

python 一句话校验软件 hash值

python 一句话校验软件 hash值

转载： 我是如何 Python 一句话校验软件哈希值的原创 2017-05-21 余弦懒人在思考MD5 python -c "import hashlib,sys;print hashlib.md5(open(sys.argv[1],rb).read()).hexdigest()" ***.exe 校验下载软件是否被“中间人动过手脚” 例如：校验…

阅读更多...

Apache Nifi 实战：多表导入实现及填坑 GitChat连接

Apache Nifi 实战：多表导入实现及填坑 GitChat连接

NiFi 是美国国家安全局开发并使用了 8 年的可视化数据集成产品，2014 年 NAS 将其贡献给了 Apache 社区，2015 年成为 Apache 顶级项目。大数据平台都需要进行数据流转，Apache Nifi 作为一款强大的数据流开源软件，支持大量的输入输…

阅读更多...

hosts 文件与 ipv6

hosts 文件与 ipv6

ipv6 的项目地址：ipv6-hosts 正如文档中所说，用于在大陆地区加快 Google、YouTube、Facebook、Wikipedia 等的访问；（twitter 不支持）使用说明（windows）： 解压到的 hosts 文件对于 wi…

阅读更多...

工作总结3：axios里面的主要参数

工作总结3：axios里面的主要参数

<template><div class"axios"></div> </template> <script> import axios from axiosexport default {name: axios3-2,created() {// 实际开发// 两种请求接口：// http://localhost:9090// http://localhost:9091const …

阅读更多...

快速入门系列之 Scala 语言 GitChat连接

快速入门系列之 Scala 语言 GitChat连接

Scala 是一门多范式的编程语言，设计初衷是要集成面向对象编程和函数式编程的各种特性。目前常应用于 Spark、后端开发等，Twitter 等公司也选择其作为后端语言。本文以实例为导向，讲解 Scala 这门语言，适合有一定其他面向对象语言…

阅读更多...

jsp页面，使用Struts2标签，传递和获取Action类里的参数，注意事项。s:a actions:iterators:paramognl表达式...

jsp页面，使用Struts2标签，传递和获取Action类里的参数，注意事项。s:a actions:iterators:paramognl表达式...

在编写SSH2项目的时候，除了使用<s:form>表单标签向Action类跳转并传递参数之外，很更多时候还需要用到<s:a action"XXX.action">这个链接标签进行跳转，此时，传递需要的参数必不可少。此外，在jsp页…

阅读更多...

工作总结4：拦截器的使用

工作总结4：拦截器的使用

1.拦截器综述拦截器的功能是定义在Java拦截器规范。拦截器规范定义了三种拦截点: 业务方法拦截, 生命周期回调侦听, 超时拦截(EJB)方法。在容器的生命周期中进行拦截 public class DependencyInjectionInterceptor {PostConstructpublic void injectDependencies(Invoca…

阅读更多...

快速入门系列之 Rust 语言 GitChat连接

快速入门系列之 Rust 语言 GitChat连接

Rust 是一枚新星，兼顾开发效率和执行效率的语言。本文以实例为导向，讲解 Rust 这门语言，适合有一定其他面向对象语言基础的人员快速入门。本文将讲解如下内容： - Hello World 从头起 - 各种类型各种算 - 各式流程来控制 - 数组…

阅读更多...

java -jar maven项目打包提示.jar中没有主清单属性

java -jar maven项目打包提示.jar中没有主清单属性

mvn package java -jar target/java_bottom_level_learning-1.0-SNAPSHOT.jar这里报错了： target/java_bottom_level_learning-1.0-SNAPSHOT.jar中没有主清单属性我们打开 jar 中的 /META_INF/ MANIFEST.MF缺少项目启动项，即没有Main-Class 怎么处理呢…

阅读更多...

工作总结5：插槽的使用

工作总结5：插槽的使用

什么是插槽？ 插槽就是子组件中的提供给父组件使用的一个占位符，用<slot></slot> 表示，父组件可以在这个占位符中填充任何模板代码，如 HTML、组件等，填充的内容会替换子组件的<slot></slot>标…

阅读更多...

pycharm 破解

pycharm 破解

亲测有效！ http://blog.lanyus.com/archives/174.html 备注： 注册码破解链接：http://idea.lanyus.com/ 将下载的jar包放入PyCharm.exe所在路径如D:\pycharm\pycharm2017\PyCharm 2017.1.2\bin pycharm.exe.vmoptions 和pycharm64.exe.vmopti…

阅读更多...

Java JVM 汇编代码入门 GitChat链接

Java JVM 汇编代码入门 GitChat链接

为什么 new Integer(151)151？我来带你们一起学习下 JVM 汇编代码吧，窥探下神奇的 Java 中间语言到底什么样子的，能帮你更深入的理解 Java。本文包含以下内容工具介绍 JVM 汇编代码初见汇编初步分析局部变量生命周期基础类型大于 5 的…

阅读更多...

Streaming 101

Streaming 101

开宗明义！本文根据Google Beam大神Tyler Akidau的系列文章《The world beyond batch: Streaming 101》(批处理之外的流式世界)整理而成， 主要讨论流式数据处理。在大数据领域，流式数据处理越发地重要了。原因有以下几点： 人们越来…

阅读更多...

工作总结6：token问题

工作总结6：token问题

1.使用请求拦截器，拦截vue所有请求，增加token参数使用倒数计时，假如token有效期60分钟，会在59分钟的时候去重新拿着refresh_Token，去请求新的token. 注意：如果一个账号允许多人登录使用，上述方…

阅读更多...

从底层重学 Java 之四大整数 GitChat链接

从底层重学 Java 之四大整数 GitChat链接

从底层，从原理，我们来重学一次 Java。四大 Java 整数类 Byte、Short、Integer、Long 是我们比较常用的对象，他们的源码及实现是怎样的呢？ 本系列秉承所有结论尽量从源码中来，没有源码的尽量标明出处。相关源码会附着在…

阅读更多...

最新文章