点击蓝字
关注我们
一位国外的软件工程师分享了这么一篇博文:Writing a simple 16 bit VM in less than 125 lines of C(用不到 125 行 C 语言编写一个简单的 16 位虚拟机)。
博文地址:
https://www.andreinc.net/2021/12/01/writing-a-simple-vm-in-less-than-125-lines-of-c
改博文用图文代码的方式详细描述了实现的具体过程,包含每一条指令的含义。
虚拟机
在计算领域,VM(虚拟机)是一个术语,指的是模拟/虚拟化计算机系统/架构的系统。
从广义上讲,有两类虚拟机:
系统虚拟机,可完全替代真实机器。它们实现了足够的功能,允许操作系统在它们上运行。他们可以共享和管理硬件,有时多个环境可以在同一台物理机器上运行而不会相互阻碍。
进程虚拟机更简单,旨在在与平台无关的环境中执行计算机程序。JVM是进程虚拟机的一个很好的例子。
本文描述的是一个简单的进程虚拟机,旨在在独立于平台的环境中执行简单的计算机程序。该虚拟机基于LC-3 计算机体系结构,能够解释和执行 LC3 汇编代码(的子集)。
该虚拟机实现了:中断处理、优先级、进程、状态寄存器 (PSR)、特权模式、主管堆栈、用户堆栈等最基本的硬件内容。
冯诺依曼模型
受 LC-3 启发的 VM 与当今大多数通用计算机一样,基于冯诺依曼计算机模型,它将具有三个主要组件:CPU、主存储器、输入/输出设备。
CPU是中央处理器的缩写,是控制和操作数据的“电路”。此外,CPU 分为三层:ALU、CU和寄存器。
ALU 代表算术/逻辑单元,代表实际携带数据指令的电路(加法、异或、除法等操作)。
CU 是Control Unit的缩写,协调 CPU 上的活动。
寄存器是位于 CPU 级别的可快速访问的“插槽”。ALU 对寄存器进行操作。它们数量很少(这是一个相对的说法,因为它取决于架构),因此可以在 CPU 中加载的数据量是有限的。我们使用寄存器与主存储器交互。一个典型的场景包括将内存位置加载到寄存器中,执行一些更改,然后将数据放回内存中。
实现虚拟机原理
虚拟机功能如下:
我们将程序加载到主存中;
在RPC寄存器中,我们保存当前需要执行的指令;
我们从指令中获取操作码(前 4 位),并在此基础上解码其余参数。
我们执行与给定指令相关的方法;
我们增加RPC并继续下一条指令;
实现的具体过程,可以参看原博文。
这里附上开源代码:
#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <string.h>
#include <stdbool.h>#include "vm_dbg.h"#define NOPS (16)#define OPC(i) ((i)>>12)
#define DR(i) (((i)>>9)&0x7)
#define SR1(i) (((i)>>6)&0x7)
#define SR2(i) ((i)&0x7)
#define FIMM(i) ((i>>5)&01)
#define IMM(i) ((i)&0x1F)
#define SEXTIMM(i) sext(IMM(i),5)
#define FCND(i) (((i)>>9)&0x7)
#define POFF(i) sext((i)&0x3F, 6)
#define POFF9(i) sext((i)&0x1FF, 9)
#define POFF11(i) sext((i)&0x7FF, 11)
#define FL(i) (((i)>>11)&1)
#define BR(i) (((i)>>6)&0x7)
#define TRP(i) ((i)&0xFF)bool running = true;typedef void (*op_ex_f)(uint16_t i);
typedef void (*trp_ex_f)();enum { trp_offset = 0x20 };
enum regist { R0 = 0, R1, R2, R3, R4, R5, R6, R7, RPC, RCND, RCNT };
enum flags { FP = 1 << 0, FZ = 1 << 1, FN = 1 << 2 };uint16_t mem[UINT16_MAX] = {0};
uint16_t reg[RCNT] = {0};
uint16_t PC_START = 0x3000;static inline uint16_t mr(uint16_t address) { return mem[address]; }
static inline void mw(uint16_t address, uint16_t val) { mem[address] = val; }
static inline uint16_t sext(uint16_t n, int b) { return ((n>>(b-1))&1) ? (n|(0xFFFF << b)) : n; }
static inline void uf(enum regist r) {if (reg[r]==0) reg[RCND] = FZ;else if (reg[r]>>15) reg[RCND] = FN;else reg[RCND] = FP;
}
static inline void add(uint16_t i) { reg[DR(i)] = reg[SR1(i)] + (FIMM(i) ? SEXTIMM(i) : reg[SR2(i)]); uf(DR(i)); }
static inline void and(uint16_t i) { reg[DR(i)] = reg[SR1(i)] & (FIMM(i) ? SEXTIMM(i) : reg[SR2(i)]); uf(DR(i)); }
static inline void ldi(uint16_t i) { reg[DR(i)] = mr(mr(reg[RPC]+POFF9(i))); uf(DR(i)); }
static inline void not(uint16_t i) { reg[DR(i)]=~reg[SR1(i)]; uf(DR(i)); }
static inline void br(uint16_t i) { if (reg[RCND] & FCND(i)) { reg[RPC] += POFF9(i); } }
static inline void jsr(uint16_t i) { reg[R7] = reg[RPC]; reg[RPC] = (FL(i)) ? reg[RPC] + POFF11(i) : reg[BR(i)]; }
static inline void jmp(uint16_t i) { reg[RPC] = reg[BR(i)]; }
static inline void ld(uint16_t i) { reg[DR(i)] = mr(reg[RPC] + POFF9(i)); uf(DR(i)); }
static inline void ldr(uint16_t i) { reg[DR(i)] = mr(reg[SR1(i)] + POFF(i)); uf(DR(i)); }
static inline void lea(uint16_t i) { reg[DR(i)] =reg[RPC] + POFF9(i); uf(DR(i)); }
static inline void st(uint16_t i) { mw(reg[RPC] + POFF9(i), reg[DR(i)]); }
static inline void sti(uint16_t i) { mw(mr(reg[RPC] + POFF9(i)), reg[DR(i)]); }
static inline void str(uint16_t i) { mw(reg[SR1(i)] + POFF(i), reg[DR(i)]); }
static inline void rti(uint16_t i) {} // unused
static inline void res(uint16_t i) {} // unused
static inline void tgetc() { reg[R0] = getchar(); }
static inline void tout() { fprintf(stdout, "%c", (char)reg[R0]); }
static inline void tputs() {uint16_t *p = mem + reg[R0];while(*p) {fprintf(stdout, "%c", (char)*p);p++;}
}
static inline void tin() { reg[R0] = getchar(); fprintf(stdout, "%c", reg[R0]); }
static inline void tputsp() { /* Not Implemented */ }
static inline void thalt() { running = false; }
static inline void tinu16() { fscanf(stdin, "%hu", ®[R0]); }
static inline void toutu16() { fprintf(stdout, "%hu\n", reg[R0]); }
trp_ex_f trp_ex[8] = { tgetc, tout, tputs, tin, tputsp, thalt, tinu16, toutu16 };
static inline void trap(uint16_t i) { trp_ex[TRP(i)-trp_offset](); }
op_ex_f op_ex[NOPS] = { /*0*/ br, add, ld, st, jsr, and, ldr, str, rti, not, ldi, sti, jmp, res, lea, trap };
void start(uint16_t offset) { reg[RPC] = PC_START + offset;while(running) {uint16_t i = mr(reg[RPC]++);op_ex[OPC(i)](i);}
}
void ld_img(char *fname, uint16_t offset) {FILE *in = fopen(fname, "rb");if (NULL==in) {fprintf(stderr, "Cannot open file %s.\n", fname);exit(1); }uint16_t *p = mem + PC_START + offset;fread(p, sizeof(uint16_t), (UINT16_MAX-PC_START), in);fclose(in);
}
int main(int argc, char **argv) {ld_img(argv[1], 0x0);fprintf(stdout, "Occupied memory after program load:\n");fprintf_mem_nonzero(stdout, mem, UINT16_MAX);start(0x0); // START PROGRAMfprintf(stdout, "Occupied memory after program execution:\n");fprintf_mem_nonzero(stdout, mem, UINT16_MAX);fprintf(stdout, "Registers after program execution:\n");fprintf_reg_all(stdout, reg, RCNT);return 0;
}
开源代码地址:
https://github.com/nomemory/lc3-vm
*声明:本文于网络整理,版权归原作者所有,如来源信息有误或侵犯权益,请联系我们删除或授权事宜。
戳“阅读原文”我们一起进步