【面试必备】java写spark好不好

并发编程三大特性

原子性

一个操作或者多次操作,要么所有的操作全部都得到执行并且不会受到任何因素的干扰而中断,要么所有的操作都执行,要么都不执行

对于基本数据类型的访问,读写都是原子性的【long和double可能例外】。

如果需要更大范围的原子性保证,可以使用synchronized关键字满足。

可见性

当一个变量对共享变量进行了修改,另外的线程都能立即看到修改后的最新值

volatile保证共享变量可见性,除此之外,synchronizedfinal都可以 实现可见性。

synchronized:对一个变量执行unclock之前,必须先把此变量同步回主内存中。

final:被final修饰的字段在构造器中一旦被初始化完成,并且构造器没有把this的引用传递出去,其他线程中就能够看见final字段的值。

有序性

即程序执行的顺序按照代码的先后顺序执行【由于指令重排序的存在,Java 在编译器以及运行期间对输入代码进行优化,代码的执行顺序未必就是编写代码时候的顺序】,volatile通过禁止指令重排序保证有序性,除此之外,synchronized关键字也可以保证有序性,由【一个变量在同一时刻只允许一条线程对其进行lock操作】这条规则获得。

CPU缓存模型是什么

高速缓存为何出现?

计算机在执行程序时,每条指令都是在CPU中执行的,而执行指令过程中,势必涉及到数据的读取和写入。由于程序运行过程中的**临时数据是存放在主存(物理内存)**当中的,这时就存在一个问题,由于CPU执行速度很快,而从内存读取数据和向内存写入数据的过程跟CPU执行指令的速度比起来要慢的多,因此如果任何时候对数据的操作都要通过和内存的交互来进行,会大大降低指令执行的速度。

为了解决CPU处理速度和内存不匹配的问题,CPU Cache出现了。

图源:JavaGuide

缓存一致性问题

当程序在运行过程中,会将运算需要的数据从主存复制一份到CPU的高速缓存当中,那么CPU进行计算时就可以直接从它的高速缓存读取数据和向其中写入数据,当运算结束之后,再将高速缓存中的数据刷新到主存当中。

在单线程中运行是没有任何问题的,但是在多线程环境下问题就会显现。举个简单的例子,如下面这段代码:

i = i + 1;

按照上面分析,主要分为如下几步:

  • 从主存读取i的值,复制一份到高速缓存中。
  • CPU执行执行执行对i进行加1操作,将数据写入高速缓存。
  • 运算结束后,将高速缓存中的数据刷新到内存中。

多线程环境下,可能出现什么现象呢?

  • 初始时,两个线程分别读取i的值,存入各自所在的CPU高速缓存中。
  • 线程T1进行加1操作,将i的最新值1写入内存。
  • 此时线程T2的高速缓存中i的值还是0,进行加1操作,并将i的最新值1写入内存。

最终的结果i = 1而不是i = 2,得出结论:如果一个变量在多个CPU中都存在缓存(一般在多线程编程时才会出现),那么就可能存在缓存不一致的问题。

如何解决缓存不一致

解决缓存不一致的问题,通常来说有如下两种解决方案【都是在硬件层面上提供的方式】:

通过在总线加LOCK#锁的方式

在早期的CPU当中,是通过在总线上加LOCK#锁的形式来解决缓存不一致的问题。因为CPU和其他部件进行通信都是通过总线来进行的,如果对总线加LOCK#锁的话,也就是说阻塞了其他CPU对其他部件访问(如内存),从而使得只能有一个CPU能使用这个变量的内存。比如上面例子中 如果一个线程在执行 i = i +1,如果在执行这段代码的过程中,在总线上发出了LCOK#锁的信号,那么只有等待这段代码完全执行完毕之后,其他CPU才能从变量i所在的内存读取变量,然后进行相应的操作。这样就解决了缓存不一致的问题。

但,有一个问题,在锁住总线期间,其他CPU无法访问内存,导致效率低下,于是就出现了下面的缓存一致性协议。

通过缓存一致性协议

较著名的就是Intel的MESI协议,MESI协议保S证了每个缓存中使用的共享变量的副本是一致的。

当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的【嗅探机制:每个处理器通过嗅探在总线上传播的数据来检查自己的缓存的值是否过期】,那么它就会从内存重新读取

基于MESI一致性协议,每个处理器需要不断从主内存嗅探和CAS不断循环,无效交互会导致总线带宽达到峰值,出现总线风暴

JMM内存模型是什么

JMM【Java Memory Model】:Java内存模型,是java虚拟机规范中所定义的一种内存模型,Java内存模型是标准化的,屏蔽掉了底层不同计算机的区别,以实现让Java程序在各种平台下都能达到一致的内存访问效果

它描述了Java程序中各种变量【线程共享变量】的访问规则,以及在JVM中将变量存储到内存和从内存中读取变量这样的底层细节。

注意,为了获得较好的执行性能,Java内存模型并没有限制执行引擎使用处理器的寄存器或者高速缓存来提升指令执行速度,也没有限制编译器对指令进行重排序。也就是说,在java内存模型中,也会存在缓存一致性问题和指令重排序的问题。

JMM的规定

所有的共享变量都存储于主内存,这里所说的变量指的是【实例变量和类变量】,不包含局部变量,因为局部变量是线程私有的,因此不存在竞争问题

每个线程都有自己的工作内存(类似于前面的高速缓存)。线程对变量的所有操作都必须在工作内存中进行,而不能直接对主存进行操作。

每个线程不能访问其他线程的工作内存。

Java对三大特性的保证

原子性

在Java中,对基本数据类型的变量的读取和赋值操作是原子性操作,即这些操作是不可被中断的,要么执行,要么不执行。

为了更好地理解上面这句话,可以看看下面这四个例子:

x = 10;  	//1
y = x;   	//2
x ++;    	//3
x = x + 1;  //4
  1. 只有语句1是原子性操作:直接将数值10赋值给x,也就是说线程执行这个语句的会直接将数值10写入到工作内存中
  2. 语句2实际包含两个操作:先去读取x的值,再将x的值写入工作内存,虽然两步分别都是原子操作,但是合起来就不能算作原子操作了。
  3. 语句3和4表示:先读取x的值,进行加1操作,写入新的值

需要注意的点:

  • 在32位平台下,对64位数据的读取和赋值是需要通过两个操作来完成的,不能保证其原子性。在目前64位JVM中,已经保证对64位数据的读取和赋值也是原子性操作了。
  • Java内存模型只保证了基本读取和赋值是原子性操作,如果要实现更大范围操作的原子性,可以通过synchronized和Lock来实现。

可见性

Java提供了volatile关键字来保证可见性。

当一个共享变量被volatile修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值。

另外,通过synchronized和Lock也能够保证可见性,synchronized和Lock能保证同一时刻只有一个线程获取锁然后执行同步代码,并且在释放锁之前会将对变量的修改刷新到主存当中。因此可以保证可见性。

有序性

在Java内存模型中,允许编译器和处理器对指令进行重排序,但是重排序过程不会影响到单线程程序的执行,却会影响到多线程并发执行的正确性。

在Java里面,可以通过volatile关键字来保证有序性,另外也可以通过synchronized和Lock来保证有序性。

Java内存模型具备一些先天的有序性,前提是两个操作满足happens-before原则,摘自《深入理解Java虚拟机》:

  • 程序次序规则:一个线程内,按照代码顺序,书写在前面的操作先行发生于书写在后面的操作【让程序看起来像是按照代码顺序执行,虚拟机只会对不存在数据依赖性的指令进行重排序,只能保证单线程中执行结果的正确性,多线程结果正确性却无法保证】
  • 锁定规则:一个unLock操作先行发生于后面对同一个锁额lock操作
  • volatile变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作
  • 传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C
  • 线程启动规则:Thread对象的start()方法先行发生于此线程的每个一个动作
  • 线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生
  • 线程终结规则:线程中所有的操作都先行发生于线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值手段检测到线程已经终止执行
  • 对象终结规则:一个对象的初始化完成先行发生于他的finalize()方法的开始

如果两个操作的执行次序无法从happens-before原则推导出来,那么它们就不能保证它们的有序性,虚拟机可以随意地对它们进行重排序。

volatile解决的问题

  • 保证了不同线程对共享变量【类的成员变量,类的静态成员变量】进行操作是时的可见性,一个线程修改了某个变量的值,新值对其他线程来说是立即可见的

  • 禁止指令重排序。

举个简单的例子,看下面这段代码:

//线程1
boolean volatile stop = false;
while(!stop){doSomething();
}
//线程2
stop = true;
  1. 线程1和2各自都拥有自己的工作内存,线程1和线程2首先都会将stop变量的值拷贝一份放到自己的工作内存中,
  2. 共享变量stop通过volatile修饰,线程2将stop的值改为true将会立即写入主内存。
  3. 线程2写入主内存之后,导致线程1工作内存中缓存变量stop的缓存行无效。
  4. 线程1的工作内存中缓存变量stop的缓存行无效,导致线程1会再次从主存中读取stop值。

volatile保证原子性吗?怎么解决?

volatile无法保证原子性,如对一个volatile修饰的变量进行自增操作i ++,无法保证多线程下结果的正确性。

解决方法:

  • 使用synchronized关键字或者Lock加锁,保证某个代码块 在同一时刻只能被一个线程执行。
  • 使用JUC包下的原子类,如AtomicInteger等。【Atomic利用CAS来实现原子操作】。

volatile的实现原理

下面这段话摘自《深入理解Java虚拟机》:

观察加入volatile关键字和没有加入volatile关键字时所生成的汇编代码发现,加入volatile关键字时,会多出一个lock前缀指令。

lock前缀指令实际上相当于一个内存屏障(也成内存栅栏),内存屏障会提供3个功能:

  • 它确保指令重排序时不会把其后面的指令排到内存屏障之前的位置,也不会把前面的指令排到内存屏障的后面;即在执行到内存屏障这句指令时,在它前面的操作已经全部完成;
  • 它会强制将对缓存的修改操作立即写入主存;
  • 如果是写操作,它会导致其他CPU中对应的缓存行无效。

volatile和synchronized的区别

volatile变量读操作的性能消耗与普通变量几乎没有什么差别,但是写操作则会慢一些,因为它需要在本地代码中插入许多内存屏障指令来保证处理器不发生乱序执行。不过即便如此,大多数场景下volatile的总开销仍然要比锁来的低

  • volatile只能用于变量,而synchronized可以修饰方法以及代码块。
  • volatile能保证可见性,但是不能保证原子性。synchronized两者都能保证。如果只是对一个共享变量进行多个线程的赋值,而没有其他的操作,推荐使用volatile,它更加轻量级。
  • volatile 关键字主要用于解决变量在多个线程之间的可见性,而 synchronized 关键字解决的是多个线程之间访问资源的同步性。

volatile的使用条件

使用volatile必须具备两个条件【保证原子】:

  • 对变量的写操作不依赖于当前值。
  • 该变量没有包含在具有其他变量的不变式中。

Java面试核心知识点笔记

其中囊括了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、数据库、数据结构等大量知识点。

蚂蚁金服(Java研发岗),26岁小伙斩获三面,收获Offer定级P6

Java中高级面试高频考点整理

蚂蚁金服(Java研发岗),26岁小伙斩获三面,收获Offer定级P6

更多Java进阶知识笔记文档分享,这些对于面试还是学习来说都是一份不错的学习资料

有需要的朋友可以戳这里即可免费领取

蚂蚁金服(Java研发岗),26岁小伙斩获三面,收获Offer定级P6

最后还分享Java进阶学习及面试必备的视频教学

蚂蚁金服(Java研发岗),26岁小伙斩获三面,收获Offer定级P6

更多Java进阶知识笔记文档分享,这些对于面试还是学习来说都是一份不错的学习资料

有需要的朋友可以戳这里即可免费领取

[外链图片转存中…(img-ujMXkyia-1626689158699)]

最后还分享Java进阶学习及面试必备的视频教学

[外链图片转存中…(img-EN32CykJ-1626689158701)]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/385582.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【面试必备】java面试题视频讲解

二、我们先来看看这份笔记到底有什么 1、先把kubernetes跑起来(先跑起来创建kubernetes集群部署应用访问应用Scale应用滚动更新) 2、重要概念 3、部署kubernetes Cluster(安装docker安装 kubelet.kubeadm和 kubectll用kubeadm 创建cluster&a…

【面试总结】java测试工程师培训

阿里P8级架构师核心理论落地篇 再造淘宝,贯穿全系,阿里团队代码落地,详细每个版本迭代,拒绝2-3个月PPT架构师再造淘宝之咚宝-技术支撑-完整搭建DevOps再造淘宝之咚宝-统一规则-代码规范落地解析再造淘宝之咚宝搭建基础服务再造淘…

进程组的应用

一、实验1 题目:利用进程扇完成一个小实验。该进程扇有 1 个父进程和 3 个子进程,我们希望达到图 1 中的效果,即将进程 0 (父进程)和进程 1 设置成一组,假设为组 1,将进程 2 和 进程 3 设置成另一个组,假设…

【原理+实战+视频+源码】docker映射端口教程

阿里巴巴Java岗面试题分享 1.HashMap 的内部结构?内部原理?和 HashTable 的区别,假如发⽣了 hash 碰撞,如何设计能让遍历效率⾼? 2.讲一讲讲讲 ConcurrentHashMap吧。 3.讲一下JVM虚拟机内存结构,以及它…

前台进程组、后台进程组

一、前台进程组、后台进程组 cat | cat & cat | cat | cat 输出结果&#xff1a; 二、主要函数应用 1. tcgetpgrp函数原型&#xff1a; #include <unistd.h> pid_t tcgetpgrp(int fd);返回值&#xff1a;若成功&#xff0c;返回前台进程组ID, 若出错&#xff0c;…

【原理+实战+视频+源码】docker权限参数

一面&#xff1a; 个人介绍加项目介绍20分钟 微服务架构是什么&#xff0c;它的优缺点&#xff1f; ACID CAP BASE理论 分布式一致性协议&#xff0c;二段、三段、TCC&#xff0c;优缺点 RPC过程 服务注册中心宕机了怎么办&#xff1f; 微服务还有其他什么组件 分布式架…

【孤儿进程】孤儿进程组、守护进程

一、孤儿进程组 1. 孤儿进程的定义&#xff1a; 定义1&#xff1a;该进程组的每个成员的父进程要么是该组的成员&#xff0c;要么在其它会话中。 定义2&#xff1a;一个进程不是孤儿进程组的条件是——该组有一个进程&#xff0c;其父进程在属于同一会话的另一个组中。 只要能…

【吐血整理】用java编写一个登陆界面

结构化数据、非结构化数据与半结构化数据 文章的开始&#xff0c;聊一下结构化数据、非结构化数据与半结构化数据&#xff0c;因为数据特点的不同&#xff0c;将在技术上直接影响存储引擎的选型。 首先是结构化数据&#xff0c;根据定义结构化数据指的是由二维表结构来逻辑表…

【大牛疯狂教学】cdhkafka打开的文件描述符临界阈值

基本知识 1.学会分析源码 程序员每天都和代码打交道。经过数年的基础教育和职业培训&#xff0c;大部分程序员都会「写」代码&#xff0c;或者至少会抄代码和改代码。但是&#xff0c;会读代码的并不在多数&#xff0c;会读代码又真正读懂一些大项目的源码的&#xff0c;少之…

线程清理函数

一、线程清理函数 #include <pthread.h> void ptread_clean_push(void (*rtn) (void *), void *arg); 注册清理函数&#xff0c;押栈 void ptread_clean_pop(int excute); 清理函数&#xff0c;出栈 分析&#xff1a;这两个函数是成对出现的…

【大牛疯狂教学】mysqlinnodb和myisam

02 JVM 线程JVM内存区域JVM运行时内存垃圾回收与算法JAVA四种引用类型GC分代收集算法 VS 分区收集算法GC垃圾收集器JAVA IO/NIOJVM类加载器 03 JAVA集合 接口继承关系和实现LISTSETMAP 04 JAVA多线程并发 JAVA并发知识库JAVA线程实现/创建方式4种线程池线程生命周期&#xf…

【大牛疯狂教学】深入拆解java虚拟机百度云

Java基础核心笔记总结 由于篇幅限制&#xff0c;我就只以截图展示目录内容以及部分笔记内容&#xff0c;获取完整版王者级核心宝典只需要点击点赞关注即可获取领取方式&#xff01; 在这个部分我们总结了Java的基础知识&#xff0c;涵盖了&#xff1a;概述、开发环境、开发环境…

【大牛系列教学】docker.service配置文件详情

01 阿里中间件&#xff08;四面&#xff0c;Java岗&#xff09; 1.1 Java中间件一面 技术一面考察范围 重点问了Java线程锁&#xff1a;synchronized 和ReentrantLock相关的底层实现 线程池的底层实现以及常见的参数 数据结构基本都问了一遍&#xff1a;链表、队列等 Java内存…

【大牛系列教学】java面试常考的编程题

1. 面试官&#xff1a;工作中使用过Zookeeper嘛&#xff1f;你知道它是什么&#xff0c;有什么用途呢&#xff1f; 小菜鸡的我&#xff1a; 有使用过的&#xff0c;使用ZooKeeper作为dubbo的注册中心&#xff0c;使用ZooKeeper实现分布式锁。ZooKeeper&#xff0c;它是一个开…

中断的系统调用

系统调用可分为两类&#xff1a;慢速系统调用和其他系统调用 慢速系统调用&#xff1a;可能会使进程永远阻塞的一类&#xff0c;如果在阻塞期间收到一个信号&#xff0c;该系统调用就被中断&#xff0c;不再继续执行(早期)&#xff1b;也可以设定系统调用是否重启。如&#xf…

【好文推荐】java模板引擎性能

01. 基础架构&#xff1a;一条SQL查询语句是如何执行的&#xff1f; MySQL 的逻辑架构图 02. 日志系统&#xff1a;一条SQL更新语句是如何执行的&#xff1f; 之前你可能经常听DBA同事说&#xff0c;MySQL可以恢复到半个月内任意一秒的状态&#xff0c;惊叹的同时&#xff0c;…

函数sigqueue

一、函数sigqueue sigqueue函数原型&#xff1a; 函数作用&#xff1a;新的发送信号系统调用&#xff0c;主要是针对实时信号提出的支持信号带有参数&#xff0c;与函数sigaction&#xff08;&#xff09;配合使用 int sigqueue(pid_t pid, int signo, const union sigval v…

【好文推荐】mysql创建数据库语句utf-8

性能调优 影响MySQLServer 性能的相关因素 商业需求对性能的影响系统架构及实现对性能的影响Query语句对系统性能的影响Schema设计对系统的性能影响硬件环境对系统性能的影响 MySQL 数据库锁定机制 MySQL锁定机制简介各种锁定机制分析合理利用锁机制优化MySQL MySQL数据库Qu…

函数setjump和longjmp

一、主要函数应用 函数setjmp 原型&#xff1a; #include <setjmp.h> Int setjmp(jmp_buf env);返回值&#xff1a;若直接调用则返回0&#xff0c;若从longjmp调用返回则返回非0值的longjmp中的val值 分析&#xff1a; 返回值&#xff1a;若直接调用则返回0&#xf…

java接口的定义与实现实验报告,赶紧收藏备战金三银四!

一、对Kafka的认识 1.Kafka的基本概念 2.安装与配置 3.生产与消费 4.服务端参数配置 二、生产者 1.客户端开发 2.原理分析 3.重要的生产者参数 三、消费者 1.消费者与消费组 2.客户端开发 四、主题与分区 1.主题的管理 2.初识KafkaAdminCilent 3.分区的管理 4.如何…