Spark01 —— Spark基础

在这里插入图片描述
在这里插入图片描述

文章目录

  • Spark01 —— Spark基础
      • 一、为什么选择Spark?
          • 1.1 MapReduce编程模型的局限性
          • 1.2 Spark与MR的区别
          • 1.3 版本
          • 1.4 优势
          • 1.5 Spark其他知识
            • 1、多种运行模式
            • 2、技术栈
            • 3、spark-shell:Spark自带的交互式工具
            • 4、Spark服务
      • 二、Spark的基础配置
      • 三、Spark实例
          • Spark WordCount
      • 四、Spark运行架构
          • 运行架构
          • 架构核心组件
          • SparkContext
      • 五、Spark分区
          • 分区过程
          • RDD
            • RDD的相关概念
            • RDD创建方式
            • RDD分区
            • RDD与DAG
          • Spark Shuffle
          • 再分区
      • 六、Spark算子
          • 转换算子
      • 七、Spark优化
          • 数据的本地化读取
      • 八、拓展
          • 数据处理提取指标 基本思路:

Spark01 —— Spark基础

一、为什么选择Spark?

1.1 MapReduce编程模型的局限性
  • 1、繁杂:只有Map和Reduce两个操作,复杂的逻辑需要大量的样板代码
  • 2、处理效率低:
    • 2.1、Map中间结果写磁盘,Reduce写HDFS,多个Map通过HDFS交换数据
    • 2.2、任务调度与启动开销大
  • 3、不适合迭代处理、交互式处理和流式处理
1.2 Spark与MR的区别

Spark是类似Hadoop MapReduce的通用【并行】框架(仿照MR的计算流程)

  • 1、Job中间输出结果可以保存在内存,不再需要读写HDFS
    • 1.1、内存不够也可以写盘
  • 2、比MapReduce平均快10倍以上
1.3 版本
20141.0
20162.x
20203.x
1.4 优势

1、速度快

  • 基于内存数据处理,比MR快100个数量级以上(逻辑回归算法测试)

  • 基于硬盘数据处理,比MR快10个数量级以上

为了容灾,会将少量核心数据进行持久化。即在计算过程中,会将检查点的数据写入磁盘中,当数据计算失败时,可以基于检查点数据进行恢复。

2、易用性

  • 支持Java、【Scala】、【Python:pyspark】、R语言(主流使用Scala,pyspark存在缺陷:只能在单机上计算,对单机内存和算力的要求过高
  • 交互式shell方便开发测试

3、通用性

  • 一栈式解决方案:
    • 批处理:将数据分批次加载到内存中进行计算
    • 交互式查询
    • 实时流处理(微批处理)
    • 图计算
    • 机器学习
1.5 Spark其他知识
1、多种运行模式

YARN ✔、Mesos、EC2、Kubernetes、StandaloneLocal[*]

​ Local[*]:在本地模式下运行,且尝试使用所有可用的核心。

2、技术栈
  • Spark Core:核心组件,分布式计算引擎 RDD

  • Spark SQL:高性能的基于Hadoop的SQL解决方案

  • Spark Streaming:可以实现高吞吐量、具备容错机制的准实时流处理系统

  • Spark GraphX:分布式图处理框架

  • Spark MLlib:构建在Spark上的分布式机器学习库

3、spark-shell:Spark自带的交互式工具
  • local:spark-shell --master local[*]
  • alone:spark-shell --master spark://MASTERHOST:7077
  • yarn :spark-shell --master yarn(需要先启用Hadoop)
4、Spark服务
  • Master:Cluster Manager
  • Worker:Worker Node

二、Spark的基础配置

Spark在IDEA工程中的基础配置

<properties><maven.compiler.source>8</maven.compiler.source><maven.compiler.target>8</maven.compiler.target><project.build.sourceEncoding>UTF-8</project.build.sourceEncoding><spark.version>3.1.2</spark.version><spark.scala.version>2.12</spark.scala.version>
</properties><dependencies><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_${spark.scala.version}</artifactId><version>${spark.version}</version></dependency>
</dependencies>

三、Spark实例

Spark WordCount
val conf: SparkConf = new SparkConf().setAppName("spark01").setMaster("local[*]")
val sc: SparkContext = SparkContext.getOrCreate(conf) // 获取SparkContext,Spark应用程序的入口点val storyPath = "E:\\BigData\\projects\\scala01\\data\\story.txt"
sc.textFile(storyPath,4)// 读取文本文件,将其转化为一个RDD.flatMap(_.split("[^a-zA-Z]+")) // 将文本文件按段落按句子分割单词.filter(_.nonEmpty) // 过滤掉空单词.map((_, 1)) // 将单词映射成(单词,1).reduceByKey(_ + _) // 将相同单词出现的次数求和 reduceByKey()的含义是:对相同键对应的值进行聚合操作,这个函数是Spark独有的.sortBy(_._2, false) // 按出现次数降序排序.collect() // 获取结果 Spark的转换操作是惰性的,仅仅定义了要进行的计算,而不立即执行它们。当调用collect()时,Spark会触发所有前面定义的转换操作,实际进行数据的处理。.foreach(println)sc.stop()

四、Spark运行架构

运行架构

①、在驱动程序Driver Program中,通过SparkContext主导应用的执行

②、SparkContext可以连接不同类型的 CM(CM的类型与运行模式相关),连接后,获得节点上的 Executor

③、一个节点默认一个Executor,可通过SPARK_WORKER_INSTANCES调整

④、Executor一般Spark启动时由Cluster Manager创建并管理,创建Executor是一个初始化过程的一部分,其中包括为每个Executor分配资源(CPU、内存等),Executor的作用是并行处理Driver分配的多个任务。

⑤、每个Task处理一个RDD分区

请添加图片描述

架构核心组件
  • Application 建立在Spark上的用户程序,包括Driver代码运行在集群各节点Executor中的代码
  • Driver program 驱动程序,Application中的main函数,并创建SparkContext
  • Cluster Manager 在集群(StandAlone、Mesos、YARN)上获取资源的外部服务
  • Worker Node 集群中任何可以运行Application代码的节点
  • Executor 某个Application运行在Worker节点上的一个进程
  • Task 被送到某个Executor上的工作单元
  • Job 多个Task组成的并行计算,由Action触发生成,一个Application中含多个Job
  • Stage 每个Job会被拆分成多组Task,作为一个TaskSet,其名称为Stage
SparkContext

连接DriverSpark Cluster(Workers)

Spark执行的主入口

每个JVM仅能有一个活跃的SparkContext,需要有多个SparkContext需要开多台虚拟机。

  • 配置SparkContext
val conf:SparkConf = new SparkConf().setAppName(name:String).set(key:String,value:String) // 多项设置.setMaster(master:String)
val sc: SparkContext = SparkContext.getOrCreate(conf)
  • master

    • local[*]【推荐】:CPU核数为当前环境的最大值

    • local[2]:CPU核数为2

    • local:CPU核数为1

    • yarn

  • 实例:SparkContext的工厂化方法

    • 使用lazy val对重要资源实现==“需要时再创建”==
    • 使用Seq()实现对配置项的包装
package cha05import org.apache.spark.api.java.JavaSparkContext.fromSparkContext
import org.apache.spark.{SparkConf, SparkContext}class SparkCom(appName:String,master:String,options:Seq[(String,String)]){private lazy val _conf:SparkConf = {val conf = new SparkConf()conf.setAppName(appName)conf.setMaster(master)options.foreach(o => conf.set(o._1,o._2))conf}private lazy val _sc = SparkContext.getOrCreate(_conf)def this(appName:String) = {this(appName,"local[*]",Seq())}def sc = _scdef logLevel(level:String): Unit = {if(level.matches("ERROR|INFO|WARN|FATAL")){_sc.setLogLevel(level)}}def close(): Unit = {_sc.stop()}
}
object SparkCom{def apply(appName:String,master:String,options:Seq[(String,String)]): SparkCom = new SparkCom(appName,master,options)def apply(appName:String): SparkCom = new SparkCom(appName)
}
  • 调用示例
// 引入必要的 Spark 类库
import org.apache.spark.{SparkConf, SparkContext}// 定义一个包含配置选项的SparkCom对象
val customOptions = Seq(("spark.executor.memory", "4g"), // 为每个执行器分配4GB内存("spark.executor.cores", "4"),   // 为每个执行器分配4个核心("spark.cores.max", "40"),       // 最多使用40个核心("spark.local.dir", "/tmp/spark-temp") // 指定Spark的临时目录
)// 创建一个SparkCom实例,应用名称为"MySparkApp",使用本地模式运行
val sparkApp = SparkCom("MySparkApp", "local[*]", customOptions)// 获取SparkContext
val sc = sparkApp.sc// 可以使用sc来进行一些Spark操作,例如读取数据、执行转换等
// 示例:读取本地系统的一个文件并计算其行数
val lines = sc.textFile("path/to/your/file.txt")
val lineCount = lines.count()println(s"Total lines in the file: $lineCount")// 设置日志级别为ERROR,减少控制台日志量
sparkApp.logLevel("ERROR")// 应用完成后,关闭SparkContext
sparkApp.close()

五、Spark分区

分区过程

请添加图片描述

1 File —— N Blocks —— 1 InputSplit —— 1 Task —— 1 RDD Partition

RDD
RDD的相关概念

RDD是描述数据存储位置的(主要数据抽象),并不实际存储数据。

RDD是一个大的不可变、分区、并行处理的数据集合,每个子集合就是一个分区,存储在集群的工作节点上的内存和硬盘。

RDD是数据转换的接口,数据规模经过转换越来越小,最终指向目标数据类型,

RDD指向了

​ 或存储在Hive(HDFS)、Cassandra、HBase

​ 或缓存(内存、内存+磁盘、仅磁盘等)

​ 或在故障或缓存收回时重新计算其他RDD分区中的数据

RDD是弹性分布式数据集(Resilient Distributed Datasets)

  • 分布式数据集

    • RDD是只读的、分区记录的集合,每个分区分布在集群的不同节点上。

    • RDD并不存储真正的数据,只是【对数据和操作】的描述。

  • 弹性

    • RDD默认存放在内存中,当内存不足,Spark自动将RDD写入磁盘
  • 容错性

    • 根据数据血统,可以自动从节点失败中恢复分区。

      请添加图片描述

  • RDD的特性

    • 一系列的分区(分片)信息,每个任务处理一个分区
    • 每个分区上都有compute函数,计算该分区中的数据
    • RDD之间有一系列的依赖
    • 分区器决定数据会被分在那个分区
    • 将计算任务分派到其所在处理数据块的存储位置

RDD可以跨集群的多个节点存储数据,支持两种类型的操作:转换和行动

RDD操作类型:分为lazynon-lazy两种

  • 转换操作(lazy):定义了一个操作序列,实际计算则被推迟到触发动作时。常见的转换操作包括 map, filter, flatMap, reduceByKey 等。

    • 每一个RDD都由转换操作生成,一个 RDD 由另一个 RDD 通过某种转换操作生成时,原始的 RDD 称为父 RDD,新生成的 RDD 称为子 RDD

    • 转换操作普遍会丢失父RDD的分区信息,因为分器依赖于键的不变性,但是转换操作可能改变元素的数量和类型。

  • 动作算子(non-lazy):动作会触发前面定义的所有转换的实际执行。常见的动作操作包括 count, collect, reduce, foreach 等。

一个InputSplit对应的多个Blocks只能位于一个File中。

这些Task会被分配到集群上的某个节点的某个Executor去执行,会尽量使执行任务的计算节点(Worker)与存储数据的节点(DataNode)是同一台机器。

每个Executor由若干core组成,每个Executor的每个core一次只能执行一个Task

每个Task的执行结果就是生成了RDD的一个Partition

RDD创建方式
// 集合创建:小数据集,可通过 numSlices 指定并行度(分区数)
val rdd: RDD[T] = sc.parallelize(seq:Seq[T], numSlices:Int) // ✔
val rdd: RDD[T] = sc.makeRDD(seq:Seq[T], numSlices:Int) // 调用了 parallelize
// 将序列分为3个分区,并且进行数字的频次统计
// val rddInt: RDD[Int] = sc.makeRDD(Seq(2, 3, 4, 5, 6, 7, 8, 9, 10), 3)
val rddInt: RDD[Int] = sc.parallelize(Seq(2, 3, 4, 5, 6, 7, 8, 9, 10), 3)
rddInt.map((_,1)).reduceByKey(_+_).foreach(println)
// 外部数据源创建: 可通过 minPartitions 指定最小分区数
// 文件系统:local(file:///...)或hadoop(hdfs://)
val rdd: RDD[String] = sc.textFile(path:String, minPartitions:Int)
val rdd: RDD[String] = sc.wholeTextFiles(dir:String, minPartitions:Int)
RDD分区
  • 分区概念

    • 每个分区都是被分发到不同worker node的候选者
    • 每个分区对应一个Task
  • 分区数量

    • 分区数量最好从源头设计,尽量不在过程中修改分区数量,会造成数据迁移,增加网络负载。同时引发不必要的Shuffle过程。

    • 使用textFile()方法创建RDD时可以传入第二个参数指定最小分区数量,最小分区数量只是期望的数量,Spark会根据实际文件大小、Block大小等情况确定最终分区数量。

    • 分区数要等于集群CPU核数,也要等于1/Block数

  • 分区方式

    • 分区器主要用于键值对的RDD,如通过reduceByKey等操作创建的RDD。
    • HashPartition(默认)RangePartition两种分区方式
      • HashPartitioner:它使用键的哈希值来分配记录,尽量保证数据在不同分区间的均匀分布。
      • RangePartitioner:它将键排序后分成若干连续的范围,每个范围对应一个分区,这样可以让范围内的键都分到一个分区。
RDD与DAG

请添加图片描述

每个Stage由n个Task组成,每个Task构成一个TaskSet

有多少个PartitionTaskSet中就有多少个Task

Spark Shuffle

在Spark中,Shuffle是代价较大的操作,应该尽量避免。

  • 过程:基本与MR中的Shuffle过程类似。
    • 分区Partition
    • Sort根据Key排序
    • Combiner进行Value的合并
  • 需要进行Shuffle的Spark算子
    • reduceByKey:需要通过网络对不同的Executor中相同key对应的值进行分组Pull(拉取)操作
    • repartition:当RDD的分区数量和父RDD分区数量不同时,就会引起数据的重新组织。
    • sortByKey:当需要进行排序操作时
再分区

默认算子间的分区数不发生变化,如果需要进行再分区操作,可以通过在可带分区参数的方法调用时设置分区参数调用重新设置分区的算子

  • numPartitions:指定分区数

  • partitioner:指定分区器

  • repartition(numPartitions:Int):进行重分区操作,必定会触发Shuffle操作

六、Spark算子

转换算子
/*简单类型 RDD[T]
*/// 【逐条处理】
val rdd2: RDD[U] = rdd.map(f:T=>U)
// 【扁平化处理】:TraversableOnce : Trait用于遍历和处理集合类型元素,类似于java:Iterable
val rdd2: RDD[U] = rdd.flatMap(f:T=>TraversableOnce[U])
/* 【分区内逐行处理】:以分区为单位(分区不变)逐行处理数据 ✔*/
val rdd2: RDD[U] = rdd.mapPartitions(f:Iterator[T]=>Iterator[U][,preservePar:Boolean])
// 【分区内逐行处理】:以分区为单位逐行处理数据,并追加分区编号。
val rdd2: RDD[U] = rdd.mapPartitionsWithIndex(f:(Int,Iterator[T])=>Iterator[U][,preservePar:Boolean])
  • mapPartitions
    • 如何判断是否需要保留父RDD的分区器设置?
      • 优化键值对操作:如果输入数据已经根据键正确分区,Spark可以在每个分区内独立地进行规约,无需跨节点传输大量数据。
      • 如果某个操作(如map)不改变键的映射关系(则数据的键仍然映射到同一个分区)
    • mapmapPartitions的区别
      • 1.IO数量:
        • map:对每个输入RDD中的元素都执行一次转换函数,因此输入和输出的元素数量是一致的,一进一出
        • mapPartitions:对每个分区中的元素进行处理,每个分区只会产生一个输出。因此,如果有多个分区,输入和输出的元素数量不一定是一致的,多进多出。
      • 2.性能:
        • map:对于每个元素,都会启动一次函数调用,适用于简单的转换。但是,如果有大量的小任务,这可能会导致性能下降,因为函数调用的开销可能会很高。
        • mapPartitions:对于每个分区,只会启动一次函数调用。这样可以减少函数调用的开销,特别是当处理的操作比较复杂时,效率更高。此外,可以在每个分区中累积一些状态信息,从而进一步提高性能。
      • 3.内存占用:
        • map:由于每个元素都会单独处理,可能会占用大量的内存,尤其是在处理大规模数据时容易导致OOM(Out Of Memory)错误。
        • mapPartitions:由于对每个分区进行处理,可以控制每次处理的数据量,因此更容易管理内存。
      • 总结:map适用于简单的转换操作,而mapPartitions适用于复杂的转换操作,当数据量较大时,map针对每个元素都进行单独处理的特性会导致过高的性能和内存开销。
val storyPath = "E:\\BigData\\projects\\scala01\\data\\story.txt"
// 按顺序形成四个分区
sc.textFile(storyPath,4)
// mapPartitions()的第一个参数是应用于每个分区的函数,第二个参数`preservePartitioning`指示是否保持父RDD的分区器设置。如果设置为`true`,Spark将使用相同的分区器来创建结果RDD。.mapPartitions(_.flatMap(_.split("^[a-zA-Z]+")).map((_,1)),true).reduceByKey(_+_).foreach(println)
  • mapPartitionsWithIndex
sc.textFile("hdfs://single01:9000/hadoop/data/movies.csv", 4).mapPartitionsWithIndex((parIx, it) => { // (parIx,it) => (分区索引,迭代器)// 对第一个分区,删除第一行 => 即删除全文的首行if (parIx == 0) {it.drop(1)}it.flatMap(_.lat2).toArray.groupBy(_._1).map(tp2=>(tp2._1,tp2._2.size)).toIterator // mapPartitionsWithIndex()需要迭代器作为返回类型}).reduceByKey(_+_) // 在不同分区间对具有相同键的值进行汇总。.foreach(println)

七、Spark优化

数据的本地化读取

SparkContext会从NameNode获取数据片存储在哪些DataNode上面,SparkContext在建任务的时候会通过Cluster Manager获取这些位置机器的Executor,并直接从DataNode读取数据,实现数据的本地化读取。

请添加图片描述

八、拓展

数据处理提取指标 基本思路:
  1. 查询集群资源 - 确认可用的机器数量每台机器的配置(CPU核心数、线程数、内存大小)。这有助于了解集群的计算能力和分配任务的基础。

  2. 数据和指标概览 - 明确要提取的若干个指标,并了解这些指标涉及的数据及其规模

  3. 检查分组聚合操作 - 确定是否需要对数据进行分组和聚合。

  4. 处理数据倾斜 - 分组聚合操作可能会导致数据倾斜,即某些分组的数据量远大于其他分组。通过数据抽样来评估倾斜程度,并根据需要启用倾斜优化配置。

set hive.groupby.skewindata=true;
  1. 优化并行处理 - 分析各个数据处理阶段(stage)的依赖关系,确定是否可以通过并行处理来优化性能。
set hive.exec.parallel=true;

附:3、4、5属于常见思路,还可以存在有其他思路。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/5078.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring-Mybatis-Xml管理(动态sql语句,sql语句复用)

目录 前置条件 动态SQL语句 动态删除数据 1.集合类型:数组 2.集合类型: List 型 SQL语句重用 说明 &#x1f9e8;前置条件 已经创建了实体类(这边举个例子) 实体类User表 表中的字段名User实体类的属性值id (bigint auto increment) 长整型 自动增长private Long iduser…

day17-day20_项目实战项目部署

万信金融 项目部署 目标&#xff1a; 理解DevOps概念 能够使用Docker Compose部署项目 理解持续集成的作用 会使用Jenkins进行持续集成 1 DevOps介绍 1.1 什么是DevOps DevOps是Development和Operations两个词的缩写&#xff0c;引用百度百科的定义&#xff1a; DevOps…

《C语言深度解剖》(10):数组指针、指针数组和数组指针数组

&#x1f921;博客主页&#xff1a;醉竺 &#x1f970;本文专栏&#xff1a;《C语言深度解剖》《精通C指针》 &#x1f63b;欢迎关注&#xff1a;感谢大家的点赞评论关注&#xff0c;祝您学有所成&#xff01; ✨✨&#x1f49c;&#x1f49b;想要学习更多C语言深度解剖点击专栏…

重学java 26.面向对象 内部类⭐

“别担心&#xff0c;你一定能如愿。” —— 24.4.29 1.什么时候使用内部类&#xff1a; 当一个事物的内部&#xff0c;还有一个部分需要完整的结构去描述&#xff0c;而内部的完整结构又只为外部事物提供服务&#xff0c;那么整个内部的完整结构最好使用内部类 比如&#xff1…

人工智能论文:BERT和GPT, GPT-2, GPT-3 的简明对比和主要区别

在BERT的论文里面&#xff1a; 2018.10 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding&#xff0c;BERT已经解释了BERT&#xff0c;GPT&#xff0c;ELMo的区别。 *ELMo为双向RNN&#xff0c;请忽略。 主要区别&#xff1a; BERT使用的是…

49. 【Android教程】HTTP 使用详解

在你浏览互联网的时候&#xff0c;绝大多数的数据都是通过 HTTP 协议获取到的&#xff0c;也就是说如果你想要实现一个能上网的 App&#xff0c;那么就一定会和 HTTP 打上交道。当然 Android 发展到现在这么多年&#xff0c;已经有很多非常好用&#xff0c;功能非常完善的网络框…

信息系统项目管理师0078:安全系统(5信息系统工程—5.4安全工程—5.4.2安全系统)

点击查看专栏目录 文章目录 5.4.2安全系统1.安全机制2.安全服务3.安全技术5.4.2安全系统 信息安全保障系统一般简称为信息安全系统,它是“信息系统”的一个部分,用于保证“业务应用信息系统”正常运营。现在人们已经明确,要建立一个“信息系统”,就必须要建立一个或多个业务…

hive使用hplsql进行etl或其它数据加工

参照 https://cwiki.apache.org/confluence/pages/viewpage.action?pageId59690156 http://www.hplsql.org/doc Hive HPL/SQL&#xff0c;即Hive Hybrid Procedural SQL一个开源工具&#xff0c;它为hive实现了过程性的SQL功能&#xff0c;类似Oracle的PLSQL。从hive 2.0.0开…

RustGUI学习(iced)之小部件(四):如何使用单选框radio部件?

前言 本专栏是学习Rust的GUI库iced的合集&#xff0c;将介绍iced涉及的各个小部件分别介绍&#xff0c;最后会汇总为一个总的程序。 iced是RustGUI中比较强大的一个&#xff0c;目前处于发展中&#xff08;即版本可能会改变&#xff09;&#xff0c;本专栏基于版本0.12.1. 概述…

Python量化炒股的获取数据函数—get_concept()

查询股票所属的概念板块函数get_concept()&#xff0c;利用该函数可以查询一只或多只股票所属的概念板块&#xff0c;其语法格式如下&#xff1a; get_concept(security, dateNone)security&#xff1a;标的代码。类型为字符串&#xff0c;形式如‘000001.XSHE’&#xff0c;或…

k8s安装nginx Ingress超详细指南

在本全面的 Ingress 指南中&#xff0c;您将学习如何在 Kubernetes 上设置 Nginx Ingress控制器并使用 DNS 配置 Ingress。 目前有两种 Nginx Ingress 控制器。 kubernetes 社区的 Nginx Ingress 控制器Nginx Inc 开发的 Nginx Ingress 控制器 我们将使用 Kubernetes 社区 N…

使用QT完成如图的游戏登录界面 使用信号和槽完成密文明文密码转换,重置账号和密码,登录校验 详细代码在主页下载

头文件: #ifndef LOGINWIDGET_H #define LOGINWIDGET_H #include <QLineEdit> #include <QPushButton> #include <QWidget> class LoginWidget : public QWidget {Q_OBJECT public: LoginWidget(QWidget *parent = 0); ~LoginWidget(); public slots: …

【银角大王——Django课程——用户表的基本操作】

Django课程——用户表的基本操作 模板的继承用户管理用户列表展示新建用户Django组件原始方法【麻烦&#xff0c;太原始】form组件modelform组件 使用modelsform组件编写添加页面 模板的继承 &#xff08;1&#xff09;先写一个页面模板————这个案例中的模板基本上就是一个…

JAVA基础——集合框架(List与Set)

数据结构 什么是数据结构 数据结构就是用来装数据以及数据与之间关系的一种集合。如何把相关联的数据存储到计算机&#xff0c;为后续的分析提供有效的数据源&#xff0c;是数据结构产生的由来。数据结构就是计算机存储、组织数据的方式。好的数据结构&#xff0c;让我们做起事…

【统计推断】-01 抽样原理之(三)

文章目录 一、说明二、抽样分布三 均值抽样分布3.1 有限母体无放回抽样3.2 有限母体有放回抽样3.3 无限母体 四、比例抽样分布五、和差抽样分布 一、说明 上文中叙述母体和抽样的设计&#xff1b;以及抽样分布的概念&#xff0c;本篇将这种关系定量化&#xff0c;专门针对抽样的…

练习题(2024/4/29)

在深度优先遍历中&#xff1a;有三个顺序&#xff0c;前中后序遍历 这里前中后&#xff0c;其实指的就是中间节点的遍历顺序&#xff0c;只要记住 前中后序指的就是中间节点的位置就可以了。 如图 1二叉树的前序遍历 给你二叉树的根节点 root &#xff0c;返回它节点值的 前…

Linux学习之Tcp与Udp

目录 UDP Udp协议的格式 UDP的传输特性 UDP的缓冲区 基于UDP的应用层协议 TCP协议 TCP的报文格式 1.ACK确认应答机制 2.超时重传 3.TCP的链接管理机制 为什么要三次握手呢&#xff1f; 理解TIME_WAIT状态 流量控制&#xff08;可靠性效率&#xff09; 滑动窗口 拥塞…

CTFHub-Web-SSRF

CTFHub-Web-SSRF-WP 一、内网访问 1.题目提示说访问127.0.0.1的flag.php&#xff0c;在URL后面添加路径没想到直接访问成功 二、伪协议读取文件 1.题目提示说访问Web目录下的flag.php&#xff0c;联想到Web目录一般存放于/var/www/html/里&#xff0c;去修改URL尝试进行访问…

stm32f103c8t6学习笔记(学习B站up江科大自化协)-UNIX时间戳、BKPRTC

UNIX时间戳 UNIX时间戳最早是在UNIX系统使用的&#xff0c;所以叫做UNIX时间戳&#xff0c;之后很多由UNIX演变而来的系统也继承了UNIX时间戳的规定&#xff0c;目前linux&#xff0c;windows&#xff0c;安卓这些操作系统的底层计时系统都是用UNIX时间戳 时间戳这个计时系统和…

Java对接高德api搜索POI 2.0 关键字搜索

目录 一、注册账号 二、搜索小demo 1.首先要引入依赖 2. 然后查看打印结果即可 三、搜索接口代码 1.引入依赖 2.yml配置 2.Controller 3.静态工具类 四、运行测试 一、注册账号 高德开放平台 | 高德地图API 注册高德开发者&#xff1b;去控制台创建应用&#xff…