揭示C语言函数调用的本质解析

C语言是面向过程的,而C++是面向对象的C和C++的区别:

C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得到输出(或实现过程(事务)控制)。

C++,首要考虑的是如何构造一个对象模型,让这个模型能够契合与之对应的问题域,这样就可以通过获取对象的状态信息得到输出或实现过程(事务)控制。 所以C与C++的最大区别在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进,是因为“ 设计这个概念已经被融入到C++之中 ”。

首先对会涉及到的一些CPU寄存器和汇编的基础知识罗列一下:

  • 16位、32位、64位的CPU寄存器名称有所不同,比如指令地址寄存器ip,在16位中叫ip,32位中叫eip,64位叫rip

  • 32位的汇编指令通常以l结尾,比如movl相当于mov的含义

  • ebp : 堆栈基地址 寄存器,这个寄存器保存的是当前执行绪的栈底地址

  • esp : 堆栈栈顶 寄存器,这个寄存器保存的是当前执行绪的栈顶地址

  • eip : 指令地址 寄存器,这个寄存器保存的是指令所在的地址,CPU会不断的根据eip所指向的指令去内存取指令并执行,并自行累加取下一条指令逐条执行。eip无法直接赋值,callretjmp等指令可以起到修改eip的作用

  • %用于直接寻址寄存器,$用于表示立即数。movl $8, %eax表示把立即数8存到eax

  • ()用于内存间接寻址,比如movl $10, (%esp)表示将立即数10保存到esp所指向的内存地址中

  • 8(%ebp)表示先找到 ebp所指向的地址值+8后得到的地址

  • 栈地址值是向下增长的,即栈顶从高地址向低地址移动

准备工作

准备一段C代码:

int g(int x) {     return x+5; } int f(int x) {     return g(x); } int main(void) {     return f(10)+1; }

使用实验楼环境

编译成汇编代码

使用如下命令编译上面的c代码

gcc -S -o main.s main.c -m32

去掉不重要的部分后,得到:

汇编代码结果为:

g: pushl %ebp movl %esp, %ebp movl 8(%ebp), %eax addl $5, %eax popl %ebp ret f: pushl %ebp movl %esp, %ebp subl $4, %esp movl 8(%ebp), %eax movl %eax, (%esp) call g leave ret main: pushl %ebp movl %esp, %ebp subl $4, %esp movl $10, (%esp) call f addl $1, %eax leave ret

分析

具体的逐步分析,这里就省了,老师课上讲的很详细了,这里主要是要进行思考和归纳。

首先,我们看到3个C函数对应生成了3个部分的汇编代码,分别用函数名作为标号隔开了

int g(int x) -> g: int f(int x) -> f: int main(void) -> main:

我们知道程序是从main函数开始执行的,那么当程序被加载并运行时,上面的汇编代码会被加载到内存的某一个区域。而且,CPU中的很多寄存器都会初始化,当然其中最重要的是eip,因为eip是指向下一条将要执行的命令所在的内存地址,所以此时的eip应该指向main标号下的pushl %ebp

main: eip ->  pushl %ebp

程序开始执行…

我们捆绑着看,首先先看这两条:

pushl %ebp movl %esp, %ebp

再观察一下整个代码,有没有发现不仅仅是main函数,函数fg的开头也是这两个指令。分析一下,不难得出,这两条指令是指将当前栈基地址压栈后,重新将基地址定位到栈顶,这个含义其实是保存好当前的基地址,重新开始一个新的栈。由于函数可以调函数,这里的当前基地址,实际上是上一个函数的栈基地址。例如,在f函数中的这两句指令,实际上保存的是main函数的栈基地址。

接着来分析两句:

subl $4, %esp movl $10, (%esp)

对照C代码不难发现,这是参数进栈,将立即数10,保存到栈顶(esp所指向的内存地址是栈顶)。而在f函数中也可以发现类似的语句:

subl $4, %esp movl 8(%ebp), %eax movl %eax, (%esp)

所以,我们可以得出结论是,在调用函数前需要把参数逐个压栈,而压栈的顺序根据笔者的测试是从右向左的。

接着调用call指令,跳转到f函数,我们知道call指令等同于下面的伪代码:

pushl %eip+1 movl %eip f

即把call指令的后一条指令进栈后,将eip赋值为目标函数的第一个指令地址。这样做显而易见:当所调用的函数结束后,需要返回当前函数继续执行,所以必须要保存下一条指令,否则回来的时候就找不到了。

来到f函数,首先是保存main函数的栈基地址,然后需要调用g函数,于是需要参数先进栈:

subl $4, %esp movl 8(%ebp), %eax movl %eax, (%esp)

这里重点思考一下,f函数是如何获得main函数传递过来的参数的,我们看到

movl 8(%ebp), %eax

为什么参数是从8(%ebp)中获得的呢?我们知道8(%ebp)表示的是以ebp为基准向栈底回溯8个字节得到,为什么是8个字节呢?

回想一下,在main函数中完成了参数进栈后做了两件事情:

  1. 由于call f指令的作用,call f下一条指令的地址被压栈了,这占用率4个字节

  2. 进入f函数后,立即将main函数的栈基地址进栈了,而且将ebp靠向了栈顶esp,这又占用了4个字节

于是通过8(%ebp)可以找到前一个函数的第一个整型参数的值。

一张图告诉你怎么回事:

看过了进入函数,调用函数的过程,再看一下函数是如何退出的。观察mainf不难发现,退出函数使用的是如下指令

leave ret

leave指令相当于如下指令:

movl %ebp, %esp popl %ebp
  • 第一条语句是将esp重置到ebp,可以理解为清空当前函数所使用的栈

  • 第二条语句是将栈顶值赋值给ebp,并弹出,栈顶值是什么呢?通过上面的分析不难发现,此时的栈顶值实际上是前一个函数的栈基地址,所以第二条语句的意思就是把ebp恢复到前一个函数的栈基地址

接着ret就是相当于,恢复指令指向:

popl %eip

为什么g函数没有leave呢?因为g函数内部没有任何的变量声明和函数调用栈一直都是空的,所以编译器优化了指令

总结

最后,通过这个例子,总结一下函数调用的过程:

进入函数:

  1. 当前栈基地址压栈(当前栈基地址实际上是前一个函数的栈基地址)

调用其他函数:

  1. 参数从右到左进栈

  2.  下一条指令地址进栈

退出函数:

  1. 栈顶esp归位,回到本函数的ebp

  2.  基地址回退到上一个函数的基地址

  3.  eip退回到上一个函数即将要执行的那条语句的地址上

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/531174.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C语言/C++编程学习:不找C/C++的工作也要学C/C++的原因

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

【网络攻防】精通C语言的黑客才是真正的黑客!

精通C语言的黑客才是真正的黑客 黑客界,有两样重要的课程,一是计算机的本质,二是编译原理。相对于汇编等底层语言,它简单;相对于其它高级语言,它更为接近计算机;同样它对黑客的两大课程很有帮助…

我两小时学完指针,你学会数组/指针与函数需要多久?

数组与函数: 这段函数中 函数的参数是数组,注意数组作为函数参数时,数组名和数组元素个数时分别传递的。 指针与函数: 这段函数中的参数是指针变量,传入的是数组的数组名或者首元素的地址,然后用引领操作…

C语言发展历史,C语言特点,C语言利于弊,入门须知三招

C语言是面向过程的,而C++是面向对象的 这些是C/C能做的 服务器开发工程师、人工智能、云计算工程师、信息安全(黑客反黑客)、大数据 、数据平台、嵌入式工程师、流媒体服务器、数据控解、图像处理、音频视频开发工程…

程序员怎么看待C语言?最伟大?最落后?

一,前言 对我来说,C语言应该可以算得上是世界上最伟大的编程语言。全中国口气最大的程序员,业界称之为“垠神”,曾经发过文章吐槽过业界各种主流的编程语言(对Java,的Python稍微宽容一些)&…

如何学习C语言?就是这么简单粗暴!

C语言是面向过程的,而C++是面向对象的。 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理…

C/C++对编程的重要性!其他编程语言都是弟弟!

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

C语言其实不难,只是你没有找对方法!

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

想学好C语言?先把基础打好再说吧!

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

C语言新手最常见的问题!你在这里跌倒过吗?

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

用C语言做出你自己的七夕表白程序!

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

C语言/C++编程的起源与能力学习

C语言是面向过程的,而C++是面向对象的 C和C的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得…

Windows下设置自动关机的命令指示符

(请先看置顶博文)https://blog.csdn.net/GenuineMonster/article/details/104495419 Windows定时操作命令:superR,输入:??:??shutdown -s ”??“代表时间…

Ubuntu16.04amp;amp;Windows 10双系统安装教程(UEFI模式)

相信来这里的各位,都是想在Windows 10的PC上安装Linux Ubuntu16.04,来达到双系统并用的目的。 那么接下来,我就在默认已安装Windows 10的基础上介绍如何以UEFI的方式安装Ubuntu16.04!我的PC是联想小新潮7000—13。在装双系统之前…

Linux Ubuntu16.04界面美化

(请先看置顶博文)本博打开方式,请详读_liO_Oil的博客-CSDN博客_怎么把androidstudio卸载干净 很多人在安装系统之后可能对其外观、主题或是桌面壁纸不满意,本文给大家介绍几种美化方法和插件! 1.可以将左侧的“热区”…

Linux16.04和Windows 10双系统下,解决时间不一致问题

装完双系统,你可能会发现某一个系统的时间与现在时间不一致(中国相差八个小 时),那么如何解决这个问题呢? 1.将某一个系统的设置时间更新方式设置为“手动”,而不是“从互联网自动获取”。 2.进入PC的BIO…

基于Vitual Box建立虚拟机,虚拟机系统为Linux Ubuntu16.04

相比于为PC机安装双系统,安装虚拟机在达到相同目的的时候显得更为方便。 那本文就详细的为大家介绍如何在Windows 10的系统下,安装Vitual Box,进而安装虚拟机。 一、下载Vitual Box虚拟机制作软件及镜像文件 Vitual Box网址为:…

ROS安装过程和配置过程(可能出现的问题及解决方法)

(请先看置顶博文)本博打开方式,请详读_liO_Oil的博客-CSDN博客_怎么把androidstudio卸载干净 准备学习ROS,所以在Linux Ubuntu16.04 的系统下安装ROS (建议初学者,先在虚拟机里进行学习和实践&#xff0c…

C语言(CED)排序算法总结。比较完整和详细

排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存 内部排序算法有:直接插入排序,折半插入排…

C语言:表白(多彩小心心)

&#xff08;请先看置顶博文&#xff09;本博打开方式&#xff0c;请详读_liO_Oil的博客-CSDN博客_怎么把androidstudio卸载干净 #include <stdio.h> #include <math.h> #include <stdlib.h> #define I 20 #define R 340 #include <string.h> int ma…