大家好,我叫徐锦桐,个人博客地址为www.xujintong.com。平时记录一下学习计算机过程中获取的知识,还有日常折腾的经验,欢迎大家来访。
这里记录了,手写操作系统项目中关于进程的部分。
进程四要素
首先进程有四要素。
- 有一段程序代其执行
- 有进程专用的系统堆栈空间
- 在内核有task_struct数据结构
- 进程有独立的存储空间,拥有专有的用户空间
如果具备前三条缺少第四条,那就称为线程。如果完全没有用户空间,就称为 内核线程 。如果共享用户空间就称为用户线程。
进程初始化
手写操作系统项目的进程初始化的源代码如下:
```cpp
/*** @brief 初始化任务*/
int task_init (task_t * task, const char * name, int flag ,uint32_t entry, uint32_t esp) {ASSERT(task != (task_t *)0);int err = tss_init(task, flag, entry, esp);if (err < 0) {log_printf("init task failed.\n");return err;}// 任务字段初始化kernel_strncpy(task->name, name, TASK_NAME_SIZE);task->state = TASK_CREATED;task->sleep_ticks = 0;task->parent = (task_t *)0;task->heap_start = 0;task->heap_end = 0;task->time_ticks = TASK_TIME_SLICE_DEFAULT;task->slice_ticks = task->time_ticks;task->state = 0;list_node_init(&task->all_node);list_node_init(&task->run_node);list_node_init(&task->wait_node);// 文件相关kernel_memset(task->file_table, 0, sizeof(task->file_table));// 插入就绪队列中和所有的任务队列中irq_state_t state = irq_enter_protection();task->pid = (uint32_t)task;list_insert_last(&task_manager.task_list, &task->all_node);irq_leave_protection(state);return 0;
}
接下来,我为你讲解这个进程初始化函数的各个部分。
初始化TSS
TSS前置知识
TSS是x86系统上的一个结构,保存了当前任务的状态信息,比如运行到了哪,当前任务的寄存器,CPU用来进行任务调度。
当进行任务切换的时候,就把TSS取出来然后恢复要切换的任务的状态。TR寄存器中存储着当前运行进程的TSS结构。进程的task_struct
结构中存储着该进程的tss结构,源码如下:
typedef struct _task_t {...tss_t tss; // 任务的TSS段int tss_sel; // tss选择子
}task_t;
下面是TSS的具体结构,具体的各个结构内容我们就不过多叙述了,如果真想要了解各个位所代表的是什么,大家可以看IA-32手册。
注: TSS是x86系统的特性,在当前64位操作系统已经被抛弃。
项目中TSS初始化
我们的项目中并没有用到这么多的,只用到了一部分。具体项目源码如下:
/*** tss描述符*/
typedef struct _tss_t {uint32_t pre_link; // 没用到uint32_t esp0, ss0, esp1, ss1, esp2, ss2;uint32_t cr3;uint32_t eip, eflags, eax, ecx, edx, ebx, esp, ebp, esi, edi;uint32_t es, cs, ss, ds, fs, gs;uint32_t idt; // 没用到uint32_t iomap; // 没用到
}tss_t;
首先给出项目中tss初始化的源码。
static int tss_init (task_t * task, int flag ,uint32_t entry, uint32_t esp) {// 为TSS分配GDTint tss_sel = gdt_alloc_desc();if (tss_sel < 0) {log_printf("alloc tss failed.\n");return -1;}segment_desc_set(tss_sel, (uint32_t)&task->tss, sizeof(tss_t),SEG_P_PRESENT | SEG_DPL0 | SEG_TYPE_TSS);// tss段初始化kernel_memset(&task->tss, 0, sizeof(tss_t));// 分配内核栈,得到的是物理地址uint32_t kernel_stack = memory_alloc_page(); // 分配一页内存 用于中断、系统异常、系统调用if (kernel_stack == 0) {goto tss_init_failed;}// 根据不同的权限选择不同的访问选择子int code_sel, data_sel;if (flag & TASK_FLAGS_SYSTEM) {code_sel = KERNEL_SELECTOR_CS;data_sel = KERNEL_SELECTOR_DS;} else {// 注意加了RP3,不然将产生段保护错误code_sel = task_manager.app_code_sel | SEG_CPL3;data_sel = task_manager.app_data_sel | SEG_CPL3;}task->tss.eip = entry;task->tss.esp = esp ? esp : kernel_stack + MEM_PAGE_SIZE;task->tss.esp0 = kernel_stack + MEM_PAGE_SIZE;// task->tss.ss = data_sel;task->tss.ss0 = KERNEL_SELECTOR_DS;task->tss.eip = entry;task->tss.es = task->tss.ds = task->tss.ss = task->tss.fs = task->tss.gs = data_sel; // 全部采用同一数据段stask->tss.cs = code_sel;task->tss.eflags = EFLGAGS_IF | EFLGAGS_DEFAULT;task->tss.iomap = 0;// 页表初始化uint32_t page_dir = memory_create_uvm();if (page_dir == 0) {goto tss_init_failed;}task->tss.cr3 = page_dir;task->tss_sel = tss_sel;return 0;
tss_init_failed:// 如果创建页表失败gdt_free_sel(tss_sel);if (kernel_stack) {memory_free_page(kernel_stack);}return -1;
}
首先通过int tss_sel = gdt_alloc_desc()
代码分配一个GDT(GDT表是从第一项开始的,第0项不分配)。gdt_alloc_desc()
源码如下:
/*** 分配一个GDT推荐表符*/
int gdt_alloc_desc() {mutex_lock(&mutex);// 跳过第0项for (int i = 1; i < GDT_TABLE_SIZE; i ++ ) {segment_desc_t * desc = gdt_table + i;if (desc->attr == 0) {mutex_unlock(&mutex);return i * sizeof(segment_desc_t);}}mutex_unlock(&mutex);return -1;
}
可以看到就是遍历一下GDT表,看哪个表项没有被分出去,然后分配给当前TSS。
初始化task_struct结构
操作系统为每个进程分配一个task_struct
结构,用以描述该进程,也就相当于一个进程的简历,写了进程的信息,进程的状态、父进程、进程的pid,进程的名字等等。
/*** @brief 任务控制块结构*/
typedef struct _task_t {// uint32_t * stack;// 这是个枚举数据类型,递增的宏定义,默认第一个为0,每次加1.enum {TASK_CREATED,TASK_RUNNING,TASK_SLEEP,TASK_READY,TASK_WAITTING, // 等待时间TASK_ZOMBIE, // 将死状态}state;int pid; // 进程的pidstruct _task_t * parent; // 父进程uint32_t heap_start; // 堆的顶层地址uint32_t heap_end; // 堆结束地址int status; // 进程执行结果int sleep_ticks; // 睡眠时间int time_ticks; // 设置计数器 时间片int slice_ticks; // 递减时间片计数file_t * file_table[TASK_OFILE_NR]; // 记录进程打开了哪些文件 任务最多打开的文件数量char name[TASK_NAME_SIZE]; // 任务名字list_node_t run_node; // 运行相关结点list_node_t wait_node; // 等待队列list_node_t all_node; // 所有队列结点tss_t tss; // 任务的TSS段int tss_sel; // tss选择子
}task_t;
linux源码中的task_struct
描述符,里面包含很多的变量。我这个操作系统知识demo级别的,所以用到的并不多。
可以看到我们是用pid来区分不同的进程,task_struct
里面还有该进程的名字,该进程的堆栈空间地址。
进程初始化有一部分就是初始化task_struct
这个结构中的信息。
将当前任务插入到所有任务队列中
关于这个代码list_insert_last(&task_manager.task_list, &task->all_node);
,这个是将当前任务加入所有任务队列中去。
task_manager是个task_manager_t
的结构类型。结构的源码如下:
typedef struct _task_manager_t {task_t * curr_task; // 当前运行的任务list_t ready_list; // 就绪队列list_t task_list; // 保存所有已经创建好的进程 所有已创建任务的队列list_t sleep_list; // 睡眠队列 延时队列task_t first_task; // 内核任务task_t idle_task; // 空闲任务int app_code_sel; // 任务代码段选择子int app_data_sel; // 应用任务的数据段选择子
}task_manager_t;
这里面记录了当前运行的任务,就绪队列,已创建好的所有进程队列等等关于进程的队列。
进程切换
进程切换,项目中就只切换了两个进程,一个init_task
和一个first_task
。就两个进程就好说了,切换的时候传入两个task_struct
的地址,然后利用长跳指令跳到新的进程的TSS结构,这个TSS结构包含了新进程的上下文信息,硬件(硬件根据选择子判断是不是TSS结构)会自动将这些信息加载到各个寄存器中。
任务切换中,cpu会把当前寄存器的数据保存到当前(旧的)tr寄存器所指向的tss数据结构里,然后把新的tss数据复制到当前寄存器里。这些操作是通过cpu的硬件实现的
task_init(&init_task, (uint32_t)init_task_entry, (uint32_t)&init_task_stack[1024]);task_init(&first_task, 0, 0); // 后面两个参数为0:first_task跑起来后已经运行,不需要从tss中加载初始化的值,因此里面的值无所谓,后面切换的时候也会保存状态。write_tr(first_task.tss_sel); // 对任务寄存器tr进行初始化int count = 0;for (;;) {log_printf("int main %d", count++);task_switch_from_to(&first_task, &init_task);}
先初始化的两个任务,然后将当前任务的tss选择子存到TR寄存器中。task_switch_from_to(&first_task, &init_task);
就是从first_task切换到init_task。
void switch_to_tss (int tss_sel) {far_jump(tss_sel, 0);
}static inline void far_jump (uint32_t selector, uint32_t offset) {uint32_t addr[] = {offset, selector};__asm__ __volatile__("ljmpl *(%[a])"::[a]"r"(addr));
}void task_switch_from_to (task_t * from, task_t * to) {// 简单的用jmp到对应的tss选择子进行任务切换switch_to_tss(to->tss_sel);// simple_switch(&from->stack, to->stack);
}
就是长跳到另一个进程的tss位置,然后硬件会自动将当前TSS中的信息加载到各个寄存器,将tss位置存到TR寄存器中。