【金三银四】微软java后端社招

分布式系统特性与衡量标准

透明性:使用分布式系统的用户并不关心系统是怎么实现的,也不关心读到的数据来自哪个节点,对用户而言,分布式系统的最高境界是用户根本感知不到这是一个分布式系统

可扩展性:分布式系统的根本目标就是为了处理单个计算机无法处理的任务,当任务增加的时候,分布式系统的处理能力需要随之增加。简单来说,要比较方便的通过增加机器来应对数据量的增长,同时,当任务规模缩减的时候,可以撤掉一些多余的机器,达到动态伸缩的效果

可用性与可靠性:一般来说,分布式系统是需要长时间甚至7*24小时提供服务的。可用性是指系统在各种情况对外提供服务的能力,简单来说,可以通过不可用时间与正常服务时间的必知来衡量;而可靠性而是指计算结果正确、存储的数据不丢失。

高性能:不管是单机还是分布式系统,大家都非常关注性能。不同的系统对性能的衡量指标是不同的,最常见的:高并发,单位时间内处理的任务越多越好;低延迟:每个任务的平均时间越少越好。这个其实跟操作系统CPU的调度策略很像

一致性:分布式系统为了提高可用性可靠性,一般会引入冗余(复制集)。那么如何保证这些节点上的状态一致,这就是分布式系统不得不面对的一致性问题。一致性有很多等级,一致性越强,对用户越友好,但会制约系统的可用性;一致性等级越低,用户就需要兼容数据不一致的情况,但系统的可用性、并发性很高很多。

组件、理论、协议

假设这是一个对外提供服务的大型分布式系统,用户连接到系统,做一些操作,产生一些需要存储的数据,那么在这个过程中,会遇到哪些组件、理论与协议呢

用一个请求串起来

用户使用Web、APP、SDK,通过HTTP、TCP连接到系统。在分布式系统中,为了高并发、高可用,一般都是多个节点提供相同的服务。那么,第一个问题就是具体选择哪个节点来提供服务,这个就是负载均衡(load balance)。负载均衡的思想很简单,但使用非常广泛,在分布式系统、大型网站的方方面面都有使用,或者说,只要涉及到多个节点提供同质的服务,就需要负载均衡。

通过负载均衡找到一个节点,接下来就是真正处理用户的请求,请求有可能简单,也有可能很复杂。简单的请求,比如读取数据,那么很可能是有缓存的,即分布式缓存,如果缓存没有命中,那么需要去数据库拉取数据。对于复杂的请求,可能会调用到系统中其他的服务。

承上,假设服务A需要调用服务B的服务,首先两个节点需要通信,网络通信都是建立在TCP/IP协议的基础上,但是,每个应用都手写socket是一件冗杂、低效的事情,因此需要应用层的封装,因此有了HTTP、FTP等各种应用层协议。当系统愈加复杂,提供大量的http接口也是一件困难的事情。因此,有了更进一步的抽象,那就是RPC(remote produce call),是的远程调用就跟本地过程调用一样方便,屏蔽了网络通信等诸多细节,增加新的接口也更加方便。

一个请求可能包含诸多操作,即在服务A上做一些操作,然后在服务B上做另一些操作。比如简化版的网络购物,在订单服务上发货,在账户服务上扣款。这两个操作需要保证原子性,要么都成功,要么都不操作。这就涉及到分布式事务的问题,分布式事务是从应用层面保证一致性:某种守恒关系。

上面说道一个请求包含多个操作,其实就是涉及到多个服务,分布式系统中有大量的服务,每个服务又是多个节点组成。那么一个服务怎么找到另一个服务(的某个节点呢)?通信是需要地址的,怎么获取这个地址,最简单的办法就是配置文件写死,或者写入到数据库,但这些方法在节点数据巨大、节点动态增删的时候都不大方便,这个时候就需要服务注册与发现:提供服务的节点向一个协调中心注册自己的地址,使用服务的节点去协调中心拉取地址。

从上可以看见,协调中心提供了中心化的服务:以一组节点提供类似单点的服务,使用非常广泛,比如命令服务、分布式锁。协调中心最出名的就是chubby,zookeeper。

回到用户请求这个点,请求操作会产生一些数据、日志,通常为信息,其他一些系统可能会对这些消息感兴趣,比如个性化推荐、监控等,这里就抽象出了两个概念,消息的生产者与消费者。那么生产者怎么讲消息发送给消费者呢,RPC并不是一个很好的选择,因为RPC肯定得指定消息发给谁,但实际的情况是生产者并不清楚、也不关心谁会消费这个消息,这个时候消息队列就出马了。简单来说,生产者只用往消息队列里面发就行了,队列会将消息按主题(topic)分发给关注这个主题的消费者。消息队列起到了异步处理、应用解耦的作用。

上面提到,用户操作会产生一些数据,这些数据忠实记录了用户的操作习惯、喜好,是各行各业最宝贵的财富。比如各种推荐、广告投放、自动识别。这就催生了分布式计算平台,比如Hadoop,Storm等,用来处理这些海量的数据。

最后,用户的操作完成之后,用户的数据需要持久化,但数据量很大,大到按个节点无法存储,那么这个时候就需要分布式存储:将数据进行划分放在不同的节点上,同时,为了防止数据的丢失,每一份数据会保存多分。传统的关系型数据库是单点存储,为了在应用层透明的情况下分库分表,会引用额外的代理层。而对于NoSql,一般天然支持分布式。

一个简化的架构图

下面用一个不大精确的架构图,尽量还原分布式系统的组成部分(不过只能体现出技术,不好体现出理论)

Docker步步实践

目录文档:

①Docker简介

②基本概念

③安装Docker

④使用镜像:

⑤操作容器:

⑥访问仓库:

⑦数据管理:

⑧使用网络:

⑨高级网络配置:

⑩安全:

⑪底层实现:

⑫其他项目:

图片转存中…(img-aE0jzHRs-1626689072582)]

⑫其他项目:

[外链图片转存中…(img-Ht2MaPFs-1626689072583)]

有需要完整版源码+笔记的朋友点击这里免费获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/385585.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【面试必会】java虚拟机原理

如何才可以进大厂? 答案其实也很简单,能力学历。不知道大家有没有发现,大厂的一些部门对于学历要求已经放低了,阿里的一些部门同样也招大专学历的程序员,当然肯定也是因为他的能力足够出色。 对于准备秋招的你来说&a…

函数exec

exec函数族 1. 执行指定目录下的程序 #include <unistd.h> int execl(const char *path, const char *arg, ...);返回值&#xff1a;若出错&#xff0c;返回-1&#xff1b;若成功&#xff0c;不返回 分析&#xff1a; path: 要执行的程序的绝对路径变参arg: 要执行的…

【面试必备】java写spark好不好

并发编程三大特性 原子性 一个操作或者多次操作&#xff0c;要么所有的操作全部都得到执行并且不会受到任何因素的干扰而中断&#xff0c;要么所有的操作都执行&#xff0c;要么都不执行。 对于基本数据类型的访问&#xff0c;读写都是原子性的【long和double可能例外】。 …

【面试必备】java面试题视频讲解

二、我们先来看看这份笔记到底有什么 1、先把kubernetes跑起来&#xff08;先跑起来创建kubernetes集群部署应用访问应用Scale应用滚动更新&#xff09; 2、重要概念 3、部署kubernetes Cluster&#xff08;安装docker安装 kubelet.kubeadm和 kubectll用kubeadm 创建cluster&a…

【面试总结】java测试工程师培训

阿里P8级架构师核心理论落地篇 再造淘宝&#xff0c;贯穿全系&#xff0c;阿里团队代码落地&#xff0c;详细每个版本迭代&#xff0c;拒绝2-3个月PPT架构师再造淘宝之咚宝-技术支撑-完整搭建DevOps再造淘宝之咚宝-统一规则-代码规范落地解析再造淘宝之咚宝搭建基础服务再造淘…

进程组的应用

一、实验1 题目&#xff1a;利用进程扇完成一个小实验。该进程扇有 1 个父进程和 3 个子进程&#xff0c;我们希望达到图 1 中的效果&#xff0c;即将进程 0 (父进程)和进程 1 设置成一组&#xff0c;假设为组 1&#xff0c;将进程 2 和 进程 3 设置成另一个组&#xff0c;假设…

【原理+实战+视频+源码】docker映射端口教程

阿里巴巴Java岗面试题分享 1.HashMap 的内部结构&#xff1f;内部原理&#xff1f;和 HashTable 的区别&#xff0c;假如发⽣了 hash 碰撞&#xff0c;如何设计能让遍历效率⾼&#xff1f; 2.讲一讲讲讲 ConcurrentHashMap吧。 3.讲一下JVM虚拟机内存结构&#xff0c;以及它…

前台进程组、后台进程组

一、前台进程组、后台进程组 cat | cat & cat | cat | cat 输出结果&#xff1a; 二、主要函数应用 1. tcgetpgrp函数原型&#xff1a; #include <unistd.h> pid_t tcgetpgrp(int fd);返回值&#xff1a;若成功&#xff0c;返回前台进程组ID, 若出错&#xff0c;…

【原理+实战+视频+源码】docker权限参数

一面&#xff1a; 个人介绍加项目介绍20分钟 微服务架构是什么&#xff0c;它的优缺点&#xff1f; ACID CAP BASE理论 分布式一致性协议&#xff0c;二段、三段、TCC&#xff0c;优缺点 RPC过程 服务注册中心宕机了怎么办&#xff1f; 微服务还有其他什么组件 分布式架…

【孤儿进程】孤儿进程组、守护进程

一、孤儿进程组 1. 孤儿进程的定义&#xff1a; 定义1&#xff1a;该进程组的每个成员的父进程要么是该组的成员&#xff0c;要么在其它会话中。 定义2&#xff1a;一个进程不是孤儿进程组的条件是——该组有一个进程&#xff0c;其父进程在属于同一会话的另一个组中。 只要能…

【吐血整理】用java编写一个登陆界面

结构化数据、非结构化数据与半结构化数据 文章的开始&#xff0c;聊一下结构化数据、非结构化数据与半结构化数据&#xff0c;因为数据特点的不同&#xff0c;将在技术上直接影响存储引擎的选型。 首先是结构化数据&#xff0c;根据定义结构化数据指的是由二维表结构来逻辑表…

【大牛疯狂教学】cdhkafka打开的文件描述符临界阈值

基本知识 1.学会分析源码 程序员每天都和代码打交道。经过数年的基础教育和职业培训&#xff0c;大部分程序员都会「写」代码&#xff0c;或者至少会抄代码和改代码。但是&#xff0c;会读代码的并不在多数&#xff0c;会读代码又真正读懂一些大项目的源码的&#xff0c;少之…

线程清理函数

一、线程清理函数 #include <pthread.h> void ptread_clean_push(void (*rtn) (void *), void *arg); 注册清理函数&#xff0c;押栈 void ptread_clean_pop(int excute); 清理函数&#xff0c;出栈 分析&#xff1a;这两个函数是成对出现的…

【大牛疯狂教学】mysqlinnodb和myisam

02 JVM 线程JVM内存区域JVM运行时内存垃圾回收与算法JAVA四种引用类型GC分代收集算法 VS 分区收集算法GC垃圾收集器JAVA IO/NIOJVM类加载器 03 JAVA集合 接口继承关系和实现LISTSETMAP 04 JAVA多线程并发 JAVA并发知识库JAVA线程实现/创建方式4种线程池线程生命周期&#xf…

【大牛疯狂教学】深入拆解java虚拟机百度云

Java基础核心笔记总结 由于篇幅限制&#xff0c;我就只以截图展示目录内容以及部分笔记内容&#xff0c;获取完整版王者级核心宝典只需要点击点赞关注即可获取领取方式&#xff01; 在这个部分我们总结了Java的基础知识&#xff0c;涵盖了&#xff1a;概述、开发环境、开发环境…

【大牛系列教学】docker.service配置文件详情

01 阿里中间件&#xff08;四面&#xff0c;Java岗&#xff09; 1.1 Java中间件一面 技术一面考察范围 重点问了Java线程锁&#xff1a;synchronized 和ReentrantLock相关的底层实现 线程池的底层实现以及常见的参数 数据结构基本都问了一遍&#xff1a;链表、队列等 Java内存…

【大牛系列教学】java面试常考的编程题

1. 面试官&#xff1a;工作中使用过Zookeeper嘛&#xff1f;你知道它是什么&#xff0c;有什么用途呢&#xff1f; 小菜鸡的我&#xff1a; 有使用过的&#xff0c;使用ZooKeeper作为dubbo的注册中心&#xff0c;使用ZooKeeper实现分布式锁。ZooKeeper&#xff0c;它是一个开…

中断的系统调用

系统调用可分为两类&#xff1a;慢速系统调用和其他系统调用 慢速系统调用&#xff1a;可能会使进程永远阻塞的一类&#xff0c;如果在阻塞期间收到一个信号&#xff0c;该系统调用就被中断&#xff0c;不再继续执行(早期)&#xff1b;也可以设定系统调用是否重启。如&#xf…

【好文推荐】java模板引擎性能

01. 基础架构&#xff1a;一条SQL查询语句是如何执行的&#xff1f; MySQL 的逻辑架构图 02. 日志系统&#xff1a;一条SQL更新语句是如何执行的&#xff1f; 之前你可能经常听DBA同事说&#xff0c;MySQL可以恢复到半个月内任意一秒的状态&#xff0c;惊叹的同时&#xff0c;…

函数sigqueue

一、函数sigqueue sigqueue函数原型&#xff1a; 函数作用&#xff1a;新的发送信号系统调用&#xff0c;主要是针对实时信号提出的支持信号带有参数&#xff0c;与函数sigaction&#xff08;&#xff09;配合使用 int sigqueue(pid_t pid, int signo, const union sigval v…