操作系统高频面试知识总结 part1

操作系统

1.什么是操作系统？
2.并发与并行？
3.同步与异步？
4.阻塞和非阻塞？
5.什么是进程？
6.什么是线程？
7.进程与线程的区别？
8.进程地址空间？
9.进程常见状态？
10.进程间通信？
11.线程间通信？
12.线程切换需要保存哪些上下文？

1.什么是操作系统？

负责管理和协调计算机硬件资源，为应用程序提供环境和服务的组件。
包括：资源管理、进程管理、文件管理、用户界面、错误检测和恢复。

2.并发与并行？

并发(Concurency)是指系统能够处理多个任务的能力，这并不意味着这些任务一定会同时进行。并发的任务可能会交错进行，因此并发可以在单核CPU上实现。这是因为CPU可以通过时间片轮转或其他任务切换策略，在各个任务之间快速切换，给人以它们在同时进行的错觉。一个简单的例子就是我们的操作系统，它可以在运行大量应用程序(如我们的浏览器，文档编辑器，音乐播放器等)同时，保持系统稳定和响应，尽管实际上，那些进程并不总是“同时“运行。

并行(Paralelism)则是指系统同时执行多个任务的能力。并行显然需要硬件的支持，如多核或多处理器。在这种情况下，多个任务确实可以在同一时间内进行。例如，现代的多核CPU可以让我们在看电影的同时进行视频编码，每一个任务在不同的处理器核心上执行，这就是并行。

整体而言，如果你有两个线程在单核心的CPU上，那么可能会通过交错执行达到并发。如果你的电脑有多个核心或处理器，你就可以在多个核心或处理器上同时执行多个线程达到并行。

3.同步与异步？

它们主要涉及到程序的运行方式和时间管理。
1.同步(Synchronous)操作是在一个操作完成之前，不进行下一个操作。这是一种阻塞调用，也就是说，进行某项操作的过程中，不得不停下来等待，直到这个操作完成。例如，当你在核对大批量的数据时，你需要等待所有数据都加载完毕才能继续进行下一项操作，这就是同步。

2.异步(Asynchronous)操作是不需要立刻得到结果，即使未完成也可进行其它操作。这是一种非阻塞调用，也就是说，还没得到结果，就继续做别的事情，不会因为单一操作的等待而阻塞，例如，你去网上订一张火车票，由干网站照名器繁忙，订票需要-些时间，但是你不会就一直盯着屏幕等，而是可以一边浏览新闻或者查看其他信息一边等待订票结果，这就是异步操作。

4.阻塞和非阻塞？

阻塞是指任务在等待某个操作完成时，暂停自己的执行，并等待操作完成后再继续执行。在阻塞状态下，任务会一直等待，直到所需的资源或结果就绪。在此期间，任务不能执行其他操作。例如，当一个线程调用阻塞式IO操作时，它会被挂起，直到IO操作完成后才能继续执行。

非阻塞是指任务在等待某个操作完成时，不会暂停自己的执行，而是立即返回，继续执行其他任务。非阻塞的任务会周期性地查询所需资源或结果的状态，判断是否就绪，从而决定是否继续执行。例如，在进行非阻塞式IO操作时，任务会立即返回，并周期性地检查IO操作的状态，直到IO完成后再处理结果，

5.什么是进程？

正在执行的程序实例，拥有独立的内存空间和系统资源，每个进程都有自己的指令序列、数据和执行环境。
进程创建是通过操作系统调度和管理，当程序被执行，操作系统系统会为其创建一个独立的进程。其主要特征包括：
独立性：内存空间和系统资源是独立的；
执行状态：运行、就绪、阻塞等不同状态，根据进程调度算法决定执行顺序；
上下文切换：操作系统需要在不同的进程直接进行切换，进程可以通过上下文切换保存和恢复执行环境；
通信与同步：可以通过进程间通信实现信息交互和共享，可以通过同步机制实现协调与合作。

6.什么是线程？

线程是进程的一部分，是进程的一个执行单元，线程更轻量级。可以在同一个进程中并发执行。线程共享进程的内存和系统资源，每个线程有独立的程序计数器和栈空间，但是可以访问共享的数据和全局变量。

线程的主要特征包括：
并发执行: 多个线程可以在不同的处理器或核心上同时执行，从而实现并发性。
共享内存: 线程之间共享同一个进程的地址空间，可以互相访问和修改共享数据。
轻量级: 相对于进程来说，线程的创建、销毁和切换开销较小，执行效率更高。
协作与通信:线程之间可以通过共享内存进行通信和协作，也可以使用同步机制控制线程的执行顺序。

7.进程与线程的区别？

它们有以下几个主要区别:

1.资源占用
进程:每个进程拥有独立的内存空间和系统资源，如文件描述符、打开的文件等。进程间的通信需要使用进程间通信（IPC）。
线程:多个线程共享同一个进程的内存空间和系统资源，线程之间可以通过共享内存进行通信。

2.调度和切换:
进程:进程是独立的执行实体，操作系统以进程为单位进行调度，进程的切换开销相对较大。
线程:线程是进程的一部分，线程的调度和切换开销较小，因为它们共享进程的上下文。

3.并发性和并行性
进程:多个进程可以并发执行，每个进程都有自己的地址空间，可以在多个处理器或核心上并行执行。
线程:多个线程可以在同一个进程内并发执行，共享进程的地址空间，可以在同一个处理器或核心上并行执行。

4.用户态与内核态
进程:进程切换涉及到用户态到内核态的切换，需要较高的权限和开销。
线程:线程切换只涉及用户态的切换，开销较小。

5. 创建和销毁
进程:创建和销毁进程的开销较大，包括分配独立的内存空间、初始化数据结构等。
线程:创建和销毁线程的开销相对较小，线程依赖于进程的内存和资源完成创建过程。

进程是独立的执行实体，拥有独立的内存空间和系统资源。而线程是进程内的执行单元，共享进程的内存空间和系统资源。线程的切换和通信开销较小，并发性更高。选择使用进程还是线程，取决于具体的应用需求。

8.进程地址空间？

进程的地址空间是指操作系统为每个进程分配的虚拟内存空间，用于存储进程的代码、数据和堆栈等信息。进程的地址空间通常分为以下几个部分:
1.代码段(Text Segment): 也称为程序段，用于存放进程的可执行代码。该部分通常是只读的，包含了程序的指令集，如函数循环、条件语句等。

2.数据段(Data Segment):用于存储全局变量、静态变量和常量等数据。数据段可以分为初始化的数据段(Initialized DataSegment)和未初始化的数据段(Uninitialized Data segment)。

初始化的数据段包含了已经初始化的全局变量和静态变量等数据，存储在静态存储区，通常是可读写的。
未初始化的数据段，也称为BSS段(Block Started by Symbol)，包含了未初始化的全局变量和静态变量等数据，存储在静态存储区，通常是可读写但初始值为0。

3.堆(Heap): 堆是动态分配的内存空间，用于存储动态分配的数据。堆空间通常由程序员通过动态内存分配函数(如malloc() new)进行管理，用于存储动态数组、链表等动态数据结构。堆的大小和生命周期由程序员显式控制，需要在不再使用时手动释放。

4.栈(Stack):栈用于存储函数调用时相关的信息，如局部变量、函数参数、返回地址等。栈的生命周期与函数的调用和返回有关，每当调用一个函数时，在栈上会创建一个新的栈帧用于保存函数的信息，当函数返回时，栈帧会被销毁。

9.进程常见状态？

1.运行状态(Running): 正在CPU上执行指令的进程处于运行状态
2.等待状态(Waiting): 也称作阻塞状态。当进程需要某些资源以继续运行(例如，等待用户输入或等待文件读取)时，它将转入等待状态。直到所需资源可用时，才会被重新放入可运行队列。
3.就绪状态(Ready): 当进程已经准备好在CPU上运行，但由于其他进程正在CPU上运行，而暂时无法运行，此时就处于就绪状态。就绪状态的进程会被放在队列中，等待CPU资源。
4.创建状态(New): 当进程刚被创建但还未被调度到运行时，它处于创建状态。
5.终止状态(Terminated): 一个进程完成了它的全部工作，或者被其他进程杀死，或者出现异常终止时，它就处于终止状态。此时，操作系统将回收进程占用的资源并销毁该进程。

10.进程间通信？

进程间通信(inter Process Communication，IPC)是一个进程与另一个进程传输和分享数据的机制。
主要有以下几种方式:
1.管道(Pipe): 管道是最早的进程间通信机制，数据可以在亲缘关系进程间单向流动。管道的优点是简单易用，但缺点是数据只能在有亲缘关系的进程之间传输，并且是无格式的字节流，需要进程自行解析。

2.消息队列(Message Queue): 消息队列是一种先进先出的队列结构，允许进程将消息发送到队列，并允许其他进程根据消息的优先级从队列中读取。优点是可以在无关进程间传输数据，支持数据的优先级设定。缺点是数据读写需要系统调用，消耗相对较高，复杂消息可能需要额外处理逻辑。

3.共享内存(Shared Memory): 共享内存允许多个进程访问同一块内存空间，是最快的IPC方式。优点是无需系统调用，直接读写内存，效率较高。缺点是需要手动解决进程间的同步问题，开发难度相对较高。

4.信号(Signal):信号是一种简单的进程间通信方式，用来通知接收进程有某事件发生。它的优点是简单，可以异步地通知事件。缺点是信息量有限，只能传递一个数量，不能携带更复杂的信息。

5.套接字(ocket):套接字可以在不同机器上的进程间通信。它的优点是可以进行跨机器的通信，通用性强。缺点是开发相对复杂，数据读写需要系统调用，效率较低。

6.信号量(Semaphore):信号量常用于多个进程间的同步和互斥问题。

11.线程间通信？

线程间的通信方式通常利用同一个进程下线程所共享的资源来实现。主要有以下几种方式
1.锁机制(Locks): 当多个线程需要访问共享资源时，可以使用锁机制来避免并发问题。一个线程在访问资源时可以“锁定"该资源，阻止其他线程的访问，直到该线程释放锁。锁机制简单而直接，但必须小心处理，否则可能导致死锁。

2.信号量(Semaphores): 信号量是一个更为高级的同步机制，可以控制多个线程对共享资源的访问。信号量有一个计数器和一个等待队列组成，计数器表示可用的资源数目。优点是可以控制资源的同时访问数，缺点是使用不当也可能导致死锁。

3.条件变量(Condition variables): 条件变量是另一种同步机制，允许一个线程等待某个条件满足。当条件满足时，可以通知一个或多个正在等待的线程。条件变量通常与互斥锁一起使用。优点是能够实现更复杂的同步，如按顺序访问等。缺点是使用不当可能导致死锁或饥饿现象。

4.事件驱动(Eventdriven):在事件驱动的模型中，线程之间通过等待和触发事件来进行通信。这种方式不仅适用于线程间的通信，也可以用于进程或异步输入/输出等的通信。优点是适应性强，可以应对多种不同的通信需求。缺点是需要编程模型支持且在设计和实现上可能较为复杂。

5.线程本地存储(Thread-Local Storage，TLS): 有些变量是线程不安全的，例如静态变量，全局变量等，这些变量如果在多线程环境下共享，可能会造成不可预料的结果。为了解决这个问题，我们可以为每个线程提供一份该变量的副本，这就是线程本地存储。此方案的优点是能避免资源竞争，缺点是会增加内存的使用。