在《从汇编层看64位程序运行——参数传递的底层实现》中,我们看到了栈帧中的变量是分为两种:
- 局部非静态变量。
- 调用超过6个参数的函数时,从第7个参数开始的入参。
比如下面的代码
void foo10(int a, int b, int c, int d, int e, int f, int g, int h, int i, int j) {a = a + 5;b = b + 5;c = c + 5;d = d + 5;e = e + 5;f = f + 5;g = g + 5;h = h + 5;i = i + 5;j = j + 5;int sum = a + b + c + d + e + f + g + h + i + j;sum = sum + 5;
}int main() {int a = 10;int b = 20;int c = 30;int d = 40;int e = 50;int f = 60;int g = 70;int h = 80;int i = 90;int j = 100;foo10(a, b, c, d, e, f, g, h, i, j);return 0;
}
我们着重看main函数的反汇编
可以看到所有栈上变量都是通过rbp寄存器来表达。
我们知道rbp和rsp寄存器都是表达栈上地址的,但是为什么栈上变量不使用rsp寄存器表达?如上图中,下面的语句通过给rsp减小0x30,让栈扩大。这样诸如-0x28(%rbp)表达变量a的方式,也可以通过+0x08(%rsp)的形式来表达。而且加法表达法更符合人们的认知!
0x000055555555535a <+8>: sub $0x30,%rsp
那为什么不选择rsp而要选择rbp呢?
这个原因我们在《从汇编层看64位程序运行——栈帧(Stack Frame)边界》中提过一句:
栈顶指针寄存器(rsp)不仅可以被直接设置,还会随着栈上Push和Pop的操作而改变。这个特性和rbp有很大不同,rbp只能直接被设置,栈上Push和Pop操作并不会直接导致rbp的值发生变动。
上面这句说说明,在一个函数汇编层,rbp寄存器基本是稳定的。这样表达另外一个变量时也就是稳定的。
比如变量a,用rbp表达,就可以一直是-0x28(%rbp)。
而rsp寄存器会因为有一些压栈和出栈行为,导致其一直变动。这样表达另外一个变量时就是不稳定的。比如在压栈前,变量a可以表达为+0x08(%rsp);如果发生了诸如0x00005555555553bb处的压栈行为,变量a的表达就要变成+0x10(%rsp),这对于汇编的阅读和编写会造成很大的麻烦。
我们调试下该程序,观察下rsp、rbp以及栈上变化。
刚进入main函数时,寄存器信息如下:
可以看到rsp和rbp寄存器值一样。
+8执行完,rsp寄存器的值因为直接修改而发生改变。这是编译器让rsp的进行改变的,表达这个函数需要0x30的栈上空间存储局部变量(a,b,c,d,e,f,g,h,i,j)。
我们通过下面指令查看栈上的空间
x /16xw $rsp
我们让所有的变量初始化完成,然后再查看栈上变量的变化,可以看到栈上数值已经发生了改变。
我们在让程序执行到+105处,此时第7个参数还没被压栈。我们查看此时rsp、rbp的值,可以看到没有任何变化。
执行第7个参数压栈,可以看到rsp的值发生了变动。
相应的栈上数值也发生了变动
我们将所有的参数都压栈,然后观察rsp和rbp的变化
可以看到rbp没有任何变化,rsp一直在变。这意味着ebp相对于个变量的距离随着代码运行是一致的;而rsp和变量的距离是一直在变的。
通过上述分析,我们就能理解为什么栈上变量使用rbp表达,而不使用rsp表达了。
也正因为rbp寄存器的重要性,我们在函数开始处,总能看到如下代码
push %rbp就是要保存上一个栈帧的rbp寄存器。这是因为本函数的栈上变量起始地址也要用rbp来表达,于是我们看到mov %rsp,%rbp来构建本函数的rbp。
当函数执行完时,一般又有如下的代码
它是将之前保存的,上一个栈帧的rbp的值从栈中弹出到rbp寄存器中,从而还原上一栈帧的rbp。这样调用者函数中的局部非静态变量就可以继续使用rbp寄存器正确表达了。