x86-64 System V ABI保证在调用之前进行16字节的堆栈对齐,因此,允许libc系统将其用于16字节的对齐加载/存储.如果您破坏了ABI,那么当事情崩溃时,这就是您的问题.
在进入某个函数时,在调用推送了一个返回地址之后,RSP -8会对齐16个字节,再按一次将使您可以调用另一个函数.
当然,通过使用奇数次压入或使用sub rsp,16 * n 8来保留堆栈空间,GCC当然通常没有问题.只要您仅读取变量而不分配变量,就可以将带有asm(“ rsp”)的register-asm局部变量与asm(“ rsp”)配合使用.
您说您正在使用GCC7.3. I put your code on the Godbolt compiler explorer并使用-O3,-O2,-O1和-O0进行编译.它在所有优化级别上都遵循ABI,使之成为以sub rsp,8开头的主函数,并且直到函数结束时才修改函数内部的RSP(调用除外).
我检查过的clang和gcc的所有其他版本和优化级别也是如此.
这是gcc7.3 -O3的代码源:请注意,除了在函数体内读取RSP以外,它对RSP均无任何作用,因此,如果使用有效的RSP(16字节对齐-8)调用main,则main的所有功能还将使用16字节对齐的RSP进行调用. (并且它永远不会发现sp& 8为真,因此它永远不会首先调用system.)
# gcc7.3 -O3
main:
sub rsp, 8
xor eax, eax
mov edi, OFFSET FLAT:.LC0
mov rsi, rsp # read RSP.
call printf
test spl, 8 # low 8 bits of RSP
je .L2
mov edi, OFFSET FLAT:.LC1
call puts
mov edi, OFFSET FLAT:.LC2
call system
.L2:
xor eax, eax
add rsp, 8
ret
如果您以某种非标准方式呼叫main,则违反了ABI.而且您不在问题中解释它,所以这不是MCVE.
正如我在Does the C++ standard allow for an uninitialized bool to crash a program?中所述,允许编译器发出利用目标平台ABI所做的任何保证的代码.这包括使用movaps进行16字节的加载/存储,以利用传入的对齐保证来在堆栈上复制内容.
gcc不能像clang那样完全优化if(),这是错过的优化.
但是clang确实将其视为未初始化的变量.我认为,它没有在asm语句中使用它,因此本地寄存器asm(“ rsp”)对clang无效. Clang在第一个printf调用之前不修改RSI,所以clang的main实际上打印argv,根本不读取RSP.
允许Clang执行此操作:register-asm本地vars唯一受支持的用法是使“ r”(var)Extended-asm约束选择所需的寄存器. (https://gcc.gnu.org/onlinedocs/gcc/Local-Register-Variables.html).
该手册并不意味着仅仅在其他时间使用这样的变量可能会有问题,因此我认为,根据书面规则,该代码通常应该是安全的,并且可以在实践中使用.
手册确实说过使用调用优先寄存器(如x86上的“ rcx”)会导致变量被函数调用所破坏,所以也许使用rsp的变量会受到编译器生成的push / pop的影响吗?
这是一个有趣的测试用例:在Godbolt链接上查看.
// gcc won't compile this: "error: unable to find a register to spill"
// clang simply copies the value back out of RDX before idiv
int sink;
int divide(int a, int b) {
register long long int dx asm ("rdx") = b;
asm("" : "+r"(dx)); // actually make the compiler put the value in RDX
sink = a/b; // IDIV uses EDX as an input
return dx;
}
没有asm(“”:“ r”(dx));, gcc会很好地进行编译,根本不会将b放入RDX中.