修改云主机配置 - 内存增容

文章目录

  • 一、修改云主机配置缘由
  • 二、修改云主机配置步骤
    • 1、查看云主机概述
    • 2、查看master云主机
    • 3、更改master云主机配置
    • 4、查看master云主机
  • 三、使用Spark Shell玩Saprk SQL
    • 1、启动HDFS服务
    • 2、启动Spark集群
    • 3、启动集群模式Spark Shell
    • 4、读取文件生成单例数据帧
    • 5、将单列数据帧转换成多列数据帧
    • 6、基于数据帧生成临时视图
    • 7、基于临时视图进行SQL查询

一、修改云主机配置缘由

  • 在今天的Spark课程中,我们深入学习了数据集和数据帧的操作方法。然而,我注意到云主机的内存几乎被耗尽,这导致了系统运行时的卡顿,有时甚至会导致Spark Shell的强制退出。为了确保课程的顺利进行,我需要对云主机的配置进行调整,特别是增加内存容量,以满足我们学习过程中对计算资源的需求。

二、修改云主机配置步骤

1、查看云主机概述

  • 内存使用情况:20GB用了12GB
    在这里插入图片描述

2、查看master云主机

  • 云主机类型 - m1.medium
    在这里插入图片描述

3、更改master云主机配置

  • 更多 ⟶ \longrightarrow 配置变更 ⟶ \longrightarrow 修改配置
    在这里插入图片描述
  • 选择云主机类型 - m1.vlarge - 内存8GB
    在这里插入图片描述
  • 勾选同意强制关机复选框,单击【确定】按钮,正在修改 - 配置/迁移
    在这里插入图片描述
  • 确认修改配置/迁移
    在这里插入图片描述
  • 弹出消息框要求用户确认
    在这里插入图片描述
  • 单击【确定】按钮
    在这里插入图片描述

4、查看master云主机

  • 云主机类型已成功改成m1.vlarge,8GB运行内存,正常运行中……
    在这里插入图片描述

三、使用Spark Shell玩Saprk SQL

1、启动HDFS服务

  • 执行命令:start-dfs.sh
    在这里插入图片描述

2、启动Spark集群

  • 执行命令:start-all.sh
    在这里插入图片描述

3、启动集群模式Spark Shell

  • 执行命令:spark-shell --master spark://master:7077
    在这里插入图片描述

4、读取文件生成单例数据帧

  • 执行命令:val df = spark.read.text("hdfs://master:9000/student/input/student.txt")
    在这里插入图片描述

  • 执行命令:df.show
    在这里插入图片描述

5、将单列数据帧转换成多列数据帧

val stuDF = df.withColumn("id", split(col("value"), ",")(0).cast("int")).withColumn("name", split(col("value"), ",")(1)).withColumn("gender", split(col("value"), ",")(2)).withColumn("age", split(col("value"), ",")(3).cast("int")).drop("value") // 删除原始的 value 列
  • 执行上述命令
    在这里插入图片描述

  • 执行命令:stuDF.printSchema
    在这里插入图片描述

  • 执行命令:stuDF.show
    在这里插入图片描述

6、基于数据帧生成临时视图

  • 执行命令:stuDF.createOrReplaceTempView("student")
    在这里插入图片描述

7、基于临时视图进行SQL查询

  • 执行命令:spark.sql("select * from student where gender = '女' and age > 20").show
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22024.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言----字符串、字符数组

一、定义 C语言中的字符串是以字符数组的形态存在的 在C语言中,没有字符串类型,字符串实际上是使用空字符\0结尾的一维字符数组。因此,\0是用于标记字符串的结束。 二 、如何创建字符串? 1.通过字符数组来创建字符串&#xff0…

某黑产组织最新攻击样本利用BYVOD技术的详细分析

前言概述 最近一两年BYVOD技术被广泛应用到了各种黑产攻击、APT攻击以及勒索病毒攻击活动当中,笔者近期在对某黑产组织进行跟踪,捕获到该组织的最新攻击样本,通过某安全厂商的驱动漏洞,利用BYVOD技术对抗其他安全软件包括各种EDR…

单片机+M26429+PAM8403+MH-M18无线蓝牙音频功放设计 原理图PCB源程序

目录 功能描述: 原理图 PCB ​代码 资料下载地址:单片机M26429PAM8403MH-M18无线蓝牙音频功放设计 原理图PCB源程序 功能描述: 1,无线蓝牙连接,手机可控制歌曲音频选择。 2,音频声音的大小可控制一排…

三维模型轻量化工具:手工模型、BIM、倾斜摄影等皆可用!

老子云是全球领先的数字孪生引擎技术及服务提供商,它专注于让一切3D模型在全网多端轻量化处理与展示,为行业数字化转型升级与数字孪生应用提供成套的3D可视化技术、产品与服务。 老子云是全球领先的数字孪生引擎技术及服务提供商,它专注于让…

sectigo和certum ip ssl证书的区别

IP SSL证书是一种数字证书,为客户端和服务器之间的信息传输提供加密服务。但是和应用比较广泛的域名SSL证书相比,IP SSL证书是为只有公网IP地址的网站准备的数字证书。市场上常见的IP SSL证书品牌就是Sectigo和Certum,那么,这两种…

[AI Google] Ask Photos: 使用Gemini搜索照片的新方法

借助Gemini模型,将Google Photos提升到一个新的水平。 Google Photos是我们最早以AI为核心构建的产品之一,让你能够搜索照片和视频中的人、宠物、地点等。现在,我们通过我们最强大的AI模型Gemini对Google Photos进行重大升级。通过Ask Photos…

【C/C++】——小白初步了解——内存管理

目录 1. C/C内存分布 代码区(Code Segment): 数据区(Data Segment): 堆区(Heap): 栈区(Stack): 常量区(Constant Seg…

数据中心横向虚拟化 M-LAG 技术

M-LAG 一、M-LAG概述 1、M-LAG定义:M-LAG(Multichassis Link Aggregation Group)是跨设备链路聚合组。可以将两台设备进行跨设备链路聚合,从而把链路的可靠性从单板机提高到了设备级。 2、优势: (1)、M-LAG系统的两台…

UE 打包报错 MarketplaceRules.dll‘ does not exist.

Precompiled rules assembly /Users/unity/Library/Application Support/Epic/UnrealEngine/Intermediate/Build/BuildRules/MarketplaceRules.dll does not exist. Window下找到该DLL 拷到Mac对应的目录下即可。如没有则需要手动创建相应的文件夹 /Users/unity/Library/Appl…

# 全面解剖 消息中间件 RocketMQ-(5)

全面解剖 消息中间件 RocketMQ-(5) 一、RocketMQ :过滤消息的两种方式 1、Tag 过滤 在大多数情况下,TAG 是一个简单而有用的设计,其可以来选择您想要的消息。 例如: DefaultMoPushconsumer consumer new DefaultM…

文件夹突变解析:类型变文件的数据恢复与预防

在数字化时代,文件夹作为我们存储和组织数据的基本单元,其重要性不言而喻。然而,有时我们可能会遇到一种令人困惑的情况——文件夹的类型突然变为文件,导致无法正常访问其中的内容。这种现象不仅会影响我们的工作效率,…

[MySQL最详细的知识点]

MySQL 关系型数据库以一行作为一个记录,列数据库以一列为一个记录一行是一个记录,一列是一个字段一行是一个实体,一列是一个属性 MySQL引擎: MySQL引擎:可以理解为,MySQL的“文件系统”,只不过功能更加强大。​MySQL引擎功能:除…

mysql 分区

目标 给一个表(半年有800万)增加分区以增加查询速度 约束 分区不能有外键否则会报错 https://blog.csdn.net/yabingshi_tech/article/details/52241034 主键 按照时间列进行分区 https://blog.csdn.net/winerpro/article/details/135736454 参看以…

安全测试 之 常见安全漏洞:CORS

1. 背景 安全测试定义:安全测试,是在软件产品开发基本完成时,验证产品是否符合安全需求定义和产品质量标准的过程。目的:通过对系统进行全面的脆弱性安全测试,发现系统未知的安全隐患并提出相关建议,确保系…

BUAA操作系统万字笔记-课堂笔记-期末考试-考研必备-北航961系列

文章目录 1 概论1.1 CPU漏洞攻击1.2 操作系统简史1.2.1 体系结构1.2.2 系统发展 1.3 操作系统基本实现机制1.3.1 异常:陷阱和中断 2 系统引导3 内存管理3.1 预备知识-链接与装载3.2 存储管理基础3.2.1 存储器管理目标3.2.2 存储器硬件发展3.2.3 存储管理的功能3.2.4…

【python】成功解决“TypeError: not enough arguments for format string”错误的全面指南

成功解决“TypeError: not enough arguments for format string”错误的全面指南 一、引言 在Python编程中,TypeError: not enough arguments for format string错误是一个常见的字符串格式化问题。这个错误通常发生在使用str.format()方法时,提供的参数…

frp之XTCP实现内网穿透家用电脑远程桌面公司电脑

官网XTCP介绍 《XTCP介绍》 实现图 fprs.toml # frps 服务端口(不填,则默认:7000) bindPort 81 auth.token "token 令牌"公司电脑frpc.toml serverAddr "frps公网服务器域名或ip" serverPort frps 服…

Java图形用户界面程序设计所需要使用的工具

Java图形用户界面程序设计 前言一、图形用户界面程序设计的概述GUI概述Java GUI技术的发展 二、AWT概述简介AWT继承体系总结 三、Swing概述Swing概述优势Swing的特征总结 前言 推荐一个网站给想要了解或者学习人工智能知识的读者,这个网站里内容讲解通俗易懂且风趣…

Python程序设计 身份证号的奥秘

第1关:判断性别 通过身份证的第17位也就是倒数第二位的数字可以辨别该身份证所属人的性别,奇数为男性,偶数为女性。 任务:输入身份证号,第17位若是偶数,输出男性,否则输出女性 如何截取字符串的一个字符 如何判断一个…

机器视觉检测--相机

一,相机就是CCD么? 通常,我们把相机都叫作CCD,CCD已经成了相机的代名词。其实很可能正在使用的是CMOS。CCD以及CMOS都称为感光元件,都是将光学图像转换为电子信号的半导体元件。他们在检测光时都采用光电二极管&#…