你所不知道的关于库函数和系统调用的那些事

系统调用和库函数的区别

相信大家在面试或者刷面试题的时候经常能看到这样的问题,“简述一下系统调用和库函数的区别”。

系统调用是操作系统提供给用户的接口,能让用户空间的程序有入口访问内核。而库函数数一组标准函数,比如复合 POSIX 或者 sysv 标准的函数。
在 linux 内核中,系统调用是专门提供给用户态程序调用的接口,内核通常是不会主动调用这些函数的。而不同操作系统中系统调用的实现都不相同。
库函数遵循标准,主要是为了考虑移植性问题。同时,库函数大多都有缓存机制,且有些库函数会调用系统调用来实现。我们看下 《Expert C Programming》 一书中的教科书式的回答。

库函数系统调用
所有的 ANSI C 编译器版本中,C 函数库都是相同的各个操作系统的系统调用是不同的
它调用函数库中的一个程序它调用系统内核的服务
在用户地址空间执行在内核地址空间执行
它的运行时间属于 ”用户“时间它的运行时间属于 ”系统“时间
属于过程调用,开销较小需要切换到内核上下文环境中然后再切换回来,开销较大
在 C 函数库libc中有大约300多个程序在 UNIX 中大约有 90 个系统调用(MS-DOS 中少一些)
记录与 UNIX OS man page 的第二节记录与 UNIX OS man page 的第三节
典型的 C 函数库调用:fopen, system, fprintf典型的系统调用:open, chdir, write, fork, brk

库函数调用通常比行内展开的代码慢(可以理解成内联), 这是因为存在函数调用开销。但是系统调用需要从用户态切换到内核态,再切换回用户态的过程,会比库函数调用还慢。

特别需要注意一点,system 是库函数而不是系统调用。

以上列出的这个区别,应该是很完善的答案了,如果在面试环节遇到这个问题,这么回答肯定是不错的。那么,通常我们在 linux 系统中看到的 manpage 的 第 2 章节,就是系统调用的介绍,第三章节就是库函数的介绍,那么分别调用这两个章节的函数的话,比如

int open(const char *pathname, int flags);
FILE *fopen(const char *path, const char *mode);

那编译器在编译的时候是如何处理的呢?系统调用是操作系统提供的接口的话,编译器在编译的时候需要链接吗?

我们来浅浅的分析一下。

实例解析

我们来看一个简单的 c 代码的例子

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <fcntl.h>#define FILENAME "test.txt"void test_system_call() {int fd = open(FILENAME, O_RDWR);close(fd);
}void test_standard_libs() {FILE* fp = fopen(FILENAME, "rw");fclose(fp);
}int main(int argc, char *argv[])
{test_system_call();test_standard_libs();return 0;
}

上面这个程序,分别调用了系统调用 open 和标准库函数 fopen。可以通过 man 2 open 和 man 3 fopen 看下这两个函数的详细介绍。我们先看下 man man 中对章节的介绍。

DESCRIPTIONman is the system's manual pager.  Each page argument given to man is normally the name of a program, utility or function.  The manual page asso‐ciated  with  each  of  these arguments is then found and displayed.  A section, if provided, will direct man to look only in that section of themanual.  The default action is to search in all of the available sections following a pre-defined order ("1 n l 8 3 2 3posix 3pm 3perl 5 4 9 6 7"by  default,  unless  overridden  by the SECTION directive in /etc/manpath.config), and to show only the first page found, even if page exists inseveral sections.The table below shows the section numbers of the manual followed by the types of pages they contain.1   Executable programs or shell commands2   System calls (functions provided by the kernel)3   Library calls (functions within program libraries)4   Special files (usually found in /dev)5   File formats and conventions eg /etc/passwd6   Games7   Miscellaneous (including macro packages and conventions), e.g. man(7), groff(7)8   System administration commands (usually only for root)9   Kernel routines [Non standard]

可以看到,第二章节就是系统调用,第三章节就是库函数。

使用 gcc 进行编译,使用 debug 模式

gcc -g test.c -o test

用 readelf 看下符号

$ readelf -sW test
Symbol table '.dynsym' contains 7 entries:Num:    Value          Size Type    Bind   Vis      Ndx Name0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND1: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND fclose@GLIBC_2.2.5 (2)2: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND close@GLIBC_2.2.5 (2)3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND __libc_start_main@GLIBC_2.2.5 (2)4: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND __gmon_start__5: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND open@GLIBC_2.2.5 (2)6: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND fopen@GLIBC_2.2.5 (2)
......

结果是不是跟想象中的有点不太一样。我们发现,无论是 fopen 还是 open 都是 GLIBC 的符号。也就是说,这里所谓的系统调用 open 函数,其实仅仅是 libc 中的一个函数定义。

换句话说,manpage 中的第二章节,是一个系统调用的描述,封装了对kernel系统调用的接口。

The section describes all of the system calls(requests for kernel to perform operations).

而编译后的二进制文件 test 也仅仅依赖 libc.so 库

$ readelf -dW test | grep NEEDED0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]

从这里可以看出,编译器在编译时,只需要知道 open 或者 fopen 的头文件,这些头文件是 glibc 提供的。在链接器链接时,这些函数实际的定义都是在 libc.so 中,通过共享库的链接方式进行链接,这些符号都是动态符号,需要进行地址重定位的,而跟kernel没什么关系。

那么 libc 中的描述的系统调用到底是什么呢,我们来看下 open 这个系统调用。

open 在 libc 中的实现

sysdeps/unix/sysv/linux/open.c 有如下实现

/* Open FILE with access OFLAG.  If O_CREAT or O_TMPFILE is in OFLAG,a third argument is the file protection.  */
int
__libc_open (const char *file, int oflag, ...)
{int mode = 0;if (__OPEN_NEEDS_MODE (oflag)){va_list arg;va_start (arg, oflag);mode = va_arg (arg, int);va_end (arg);}return SYSCALL_CANCEL (openat, AT_FDCWD, file, oflag, mode);
}weak_alias (__libc_open, open)

weak_alias 是一个宏,用于创建弱符号别名。这里是将 __libc_open 这个符号创建为 open 的弱别名。也就是说,如果其他模块提供了 open 的实现,那么在链接时,链接器会使用该版本的 open 实现而不是 __libc_open

__libc_open 中,调用了宏 SYSCALL_CANCEL,该宏在 sysdeps/unix/sysdep.h 中进行了定义。

#define SYSCALL_CANCEL(...) \({									     \long int sc_ret;							     \if (NO_SYSCALL_CANCEL_CHECKING)					     \sc_ret = INLINE_SYSCALL_CALL (__VA_ARGS__); 			     \else								     \{									     \int sc_cancel_oldtype = LIBC_CANCEL_ASYNC ();			     \sc_ret = INLINE_SYSCALL_CALL (__VA_ARGS__);			     \LIBC_CANCEL_RESET (sc_cancel_oldtype);				     \}									     \sc_ret;								     \})

核心调用就是 INLINE_SYSCALL_CALL,我用来分析下 open 这个实现中整个宏展开的一个过程。

INLINE_SYSCALL_CALL (__VA_ARGS)
==> INLINE_SYSCALL_CALL(openat, AT_FDCWD, file, oflag, mode)

这些宏定义在 sysdeps/unix/sysdep.h 中可以找到,

INLINE_SYSCALL_CALL (openat, AT_FDCWD, file, oflag, mode)
==> __INLINE_SYSCALL_DISP (__INLINE_SYSCALL, openat, AT_FDCWD, file, oflag, mode)
==> __SYSCALL_CONCAT (__INLINE_SYSCALL, __INLINE_SYSCALL_NARGS(openat, AT_FDCWD, file, oflag, mode))(openat, AT_FDCWD, file, oflag, mode)

来分析一下 __INLINE_SYSCALL_NARGS 这个宏

#define __INLINE_SYSCALL_NARGS_X(a,b,c,d,e,f,g,h,n,...) n
#define __INLINE_SYSCALL_NARGS(...) \__INLINE_SYSCALL_NARGS_X (__VA_ARGS__,7,6,5,4,3,2,1,0,)

这个宏的作用是计算参数的个数,数字和字母参数就是占位符的作用。把上面的宏展开就是

__INLINE_SYSCALL_NARGS(openat, AT_FDCWD, file, oflag, mode)
==> __INLINE_SYSCALL_NARGS_X (openat, AT_FDCWD, file, oflag, mode,7,6,5,4,3,2,1,0,)

参数对应关系如下所示

a -> openat
b -> AT_FDCWD
c -> file
d -> oflag
e -> mode
f -> 7
g -> 6
h -> 5
n -> 4

n 就是最终结果,为 4。所以上面的宏继续展开就是

__SYSCALL_CONCAT (__INLINE_SYSCALL, __INLINE_SYSCALL_NARGS(openat, AT_FDCWD, file, oflag, mode))(openat, AT_FDCWD, file, oflag, mode)
==> __SYSCALL_CONCAT (__INLINE_SYSCALL, 4)(openat, AT_FDCWD, file, oflag, mode)
==> __INLINE_SYSCALL4 (openat, AT_FDCWD, file, oflag, mode)
==> INLINE_SYSCALL (openat, 4, AT_FDCWD, file, oflag, mode)

sysdeps/unix/sysv/sysdep.h 中可以找到

/* Define a macro which expands into the inline wrapper code for a systemcall.  It sets the errno and returns -1 on a failure, or the syscallreturn value otherwise.  */
#undef INLINE_SYSCALL
#define INLINE_SYSCALL(name, nr, args...)				\({									\long int sc_ret = INTERNAL_SYSCALL (name, nr, args);		\__glibc_unlikely (INTERNAL_SYSCALL_ERROR_P (sc_ret))		\? SYSCALL_ERROR_LABEL (INTERNAL_SYSCALL_ERRNO (sc_ret))		\: sc_ret;								\})

INLINE_SYSCALL 也是一个封装的宏函数,关键调用的是 INTERNAL_SYSCALL 这个宏函数。我们看下 arm 架构下这个宏的实现。在 sysdeps/unix/sysv/linux/arm/sysdep.h

#define INTERNAL_SYSCALL(name, nr, args...)			\INTERNAL_SYSCALL_RAW(SYS_ify(name), nr, args)

具体实现就在 INTERNAL_SYSCALL_RAW 这个宏函数中了。
请添加图片描述

可以看到,libc 中的实现,实际调用的是 syscall 汇编指令。

通过 man syscall 可以查看下简介系统调用的描述

Architecture calling conventionsEvery  architecture has its own way of invoking and passing arguments to the kernel.  The details for various architectures are listed in the twotables below.The first table lists the instruction used to transition to kernel mode, (which might not be the fastest or best way to transition to the kernel,so  you  might  have  to refer to vdso(7)), the register used to indicate the system call number, and the register used to return the system callresult.arch/ABI   instruction          syscall #   retval Notes───────────────────────────────────────────────────────────────────arm/OABI   swi NR               -           a1     NR is syscall #arm/EABI   swi 0x0              r7          r0arm64      svc #0               x8          x0blackfin   excpt 0x0            P0          R0i386       int $0x80            eax         eaxia64       break 0x100000       r15         r8     See belowmips       syscall              v0          v0     See belowparisc     ble 0x100(%sr2, %r0) r20         r28s390       svc 0                r1          r2     See belows390x      svc 0                r1          r2     See belowsparc/32   t 0x10               g1          o0sparc/64   t 0x6d               g1          o0x86_64     syscall              rax         rax    See belowx32        syscall              rax         rax    See below

这张表列出了不同系统传递给kernel的指令。在 arm/EABI 架构中,就是 swi 0x0,这与上面这个内嵌汇编中的调用是一样的。而在 arm 汇编中,@ syscall 表示注释,说明这是一条系统调用的指令。而第二张表,描述了不同架构传递给系统调用的参数所使用的寄存器。

 The second table shows the registers used to pass the system call arguments.arch/ABI      arg1  arg2  arg3  arg4  arg5  arg6  arg7  Notes──────────────────────────────────────────────────────────────────arm/OABI      a1    a2    a3    a4    v1    v2    v3arm/EABI      r0    r1    r2    r3    r4    r5    r6arm64         x0    x1    x2    x3    x4    x5    -blackfin      R0    R1    R2    R3    R4    R5    -i386          ebx   ecx   edx   esi   edi   ebp   -ia64          out0  out1  out2  out3  out4  out5  -mips/o32      a0    a1    a2    a3    -     -     -     See belowmips/n32,64   a0    a1    a2    a3    a4    a5    -parisc        r26   r25   r24   r23   r22   r21   -s390          r2    r3    r4    r5    r6    r7    -s390x         r2    r3    r4    r5    r6    r7    -sparc/32      o0    o1    o2    o3    o4    o5    -sparc/64      o0    o1    o2    o3    o4    o5    -x86_64        rdi   rsi   rdx   r10   r8    r9    -x32           rdi   rsi   rdx   r10   r8    r9    -

我们关注 arm/EABI 架构,可以使用 7 个参数,分别对应 r0 - r6 一共 7 个寄存器。来分析下上图中的代码。_a1 对应寄存器 r0,而 _nr 表示系统调用号,对应寄存器 r7。这个系统调用号是什么意思呢?

在分析上面的宏展开时,最终调用的是

INTERNAL_SYSCALL_RAW(SYS_ify(name), nr, args)

_nr = name;

这个 name 就是 SYS_ify(name) 的值,而 SYS_ify 这个宏定义为

#define SYS_ify(syscall_name) (__NR_##syscall_name)

展开就是 __NR_openat,这个就是系统调用号,在 linux 系统头文件 asm-generic/unistd.h 中定义

#define __NR_openat 56

回到上面的问题。其余参数的传递就是通过

LOAD_ARGS_##nr (args)
ASM_ARGS_##_nr

来实现的,这里的 nr 的值是 4,可以从上面的宏展开分析得知。

ASM_ARGS_4 展开
==> ASM_ARGS_3, "r" (_a4)
==> ASM_ARGS_2, "r" (_a3), "r" (_a4)
==> ASM_ARGS_1, "r" (_a2), "r" (_a3), "r" (_a4)
==> ASM_ARGS_0, "r" (_a1), "r" (_a2), "r" (_a3), "r" (_a4)
==> , "r" (_a1), "r" (_a2), "r" (_a3), "r" (_a4)

这样,open 这个系统调用,使用 swi 0x0 指令,输出到 r0 寄存器对应的变量 _a1 中,_nr 对应寄存器 a7 为系统调用号,其余输入参数 _a1 - _a4 对应寄存器 r1 - r4。当调用 swi 0x0 指令时,会触发一个软中断,cpu 会暂停当前程序的执行,而跳转到 kernel 中去执行这个中断处理函数,执行相应的操作。

总结

我们通常使用的系统调用,在 manpage 第二章节所描述的函数,其实是 libc 中封装的函数,这个函数就是对应系统调用的描述,以一个 c 函数的形式提供给用户使用。而实际的实现,是在 libc 中根据特定架构提供的指令以汇编的形式实现的。比如上面分析的系统调用 open,是通过 swi 0x0 这个软中断来触发的,而系统调用号以及软中断的处理过程,是在 kernel 中实现的。

这就可以解释上面那个 test 程序了。编译器在实际编译的时候,不管是库函数 fopen 还是系统调用 open 都是当做一个外部函数符号来处理的。在链接器进行链接的时候,在 libc.so 中找到了函数定义并链接。而程序运行时,动态链接器加载 libc.so 并对 open 和 fopen 进行地址重定位,当执行 open 或者 fopen 时跳转到 libc.so 中对应的函数处执行。

今天的分享就到这里,我是猫步旅人,一个对 kernel 和编译器感兴趣的程序员。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/667173.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

90.网游逆向分析与插件开发-游戏窗口化助手-项目需求与需求拆解

内容参考于&#xff1a;易道云信息技术研究院VIP课 上一个内容&#xff1a;实现物品使用策略的功能-CSDN博客 项目需求&#xff1a; 在游戏窗口化时&#xff0c;可以在游戏之外弹出一个窗口&#xff0c;可以隐藏或者显示游戏窗口&#xff0c;显示游戏人物的基本状态&#xff…

LeetCode--代码详解 2.两数相加

2.两数相加 题目 难度&#xff1a;中等 给你两个 非空 的链表&#xff0c;表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的&#xff0c;并且每个节点只能存储 一位 数字。 请你将两个数相加&#xff0c;并以相同形式返回一个表示和的链表。 你可以假设除了数…

【JavaScript + CSS】随机生成十六进制颜色

效果图 实现 <template><div class"year_area"><div class"year_list"><el-row :span"24"><div :class"showAll"><el-col :span"5" v-for"(item, index) in defaulList" :key&…

电动汽车充放电V2G模型(matlab代码)

目录 1 主要内容 1.1 模型背景 1.2 目标函数 1.3 约束条件 2 部分代码 3 效果图 4 下载链接 1 主要内容 本程序主要建立电动汽车充放电V2G模型&#xff0c;采用粒子群算法&#xff0c;在保证电动汽车用户出行需求的前提下&#xff0c;为了使工作区域电动汽车尽可能多的消…

迁移学习实现图片分类任务

导入工具包 import time import osimport numpy as np from tqdm import tqdmimport torch import torchvision import torch.nn as nn import torch.nn.functional as Fimport matplotlib.pyplot as plt %matplotlib inline# 忽略烦人的红色提示 import warnings warnings.fi…

okhttp 的 拦截器

拦截器有很多作用&#xff0c;实现就是责任链模式&#xff0c;细节&#xff0c;等我有时间补上。 后面有时间更新一下。 OkHttp最核心的工作是在 getResponseWithInterceptorChain() 中进行&#xff0c;在进入这个方法分析之前&#xff0c;我们先来了 解什么是责任链模式&…

Java split 分割字符串避坑

使用split进行字符串分割时需要注意2点 1、特殊字符作为分隔符时需要使用\\进行转义(如\\ -> \\\\; | -> \\| ) 特殊字符 .$|()[{^?*\\ 例如对"|"分隔 未转义 String str "01|02|03"; String[] strArr str.split("|");System.out.…

点击按钮打开自定义iframe弹窗

1、效果 点击按钮打开弹窗&#xff1a; 打开弹窗后&#xff1a; 2、代码 <!DOCTYPE html> <html><head><title>iframe弹窗</title><style>/* 使用媒体查询来实现响应式设计 */media (min-width: 768px) {.popup {width: 80%; /* 设置…

【c/python】GtkBox

一、GtkBox及C语言示例 GtkBox是一个容器部件&#xff0c;用于在GTK&#xff08;GIMP Toolkit&#xff09;应用程序中水平或垂直地排列多个子部件。以下是一个简单的例子&#xff0c;展示了如何在一个基本的GTK应用程序中使用GtkBox来垂直排列两个按钮&#xff1a; 首先&#…

用Python Tkinter打造的精彩连连看小游戏【附源码】

文章目录 连连看小游戏&#xff1a;用Python Tkinter打造的精彩游戏体验游戏简介技术背景MainWindow类:职责:方法:Point类: 主执行部分:完整代码&#xff1a;总结&#xff1a; 连连看小游戏&#xff1a;用Python Tkinter打造的精彩游戏体验 在丰富多彩的游戏世界中&#xff0c…

左旋字符串的三种方法,并判断一个字符串是否为另外一个字符串旋转之后的字符串。(strcpy,strncat,strcmp,strstr函数的介绍)

一. 实现一个函数&#xff0c;可以左旋字符串中的k个字符。 例如&#xff1a; ABCD左旋一个字符得到BCDA ABCD左旋两个字符得到CDAB 通过分析&#xff0c;可以知道实际的旋转次数&#xff0c;其实是k%&#xff08;字符串长度&#xff09;。假设一个字…

西瓜书学习笔记——流形学习(公式推导+举例应用)

文章目录 等度量映射&#xff08;仅保留点与其邻近点的距离&#xff09;算法介绍实验分析 局部线性嵌入&#xff08;不仅保留点与其邻近点的距离还要保留邻近关系&#xff09;算法介绍实验分析 等度量映射&#xff08;仅保留点与其邻近点的距离&#xff09; 算法介绍 等度量映…

树莓派5一键安装C++版本OpenCV

安装环境 本人当前的安装环境&#xff1a; 树莓派5Raspberry Pi os (64-bit) Debian12 Bookworm 镜像下载地址 我这里是将镜像安装好后直接安装opencv&#xff0c;如果不是刚安装好的镜像需要注意是否有openCV的python之类的安装过&#xff0c;不然可能出现编译错误 一、扩展内…

SpringBoot中数据库的连接及Mybatis的配置和使用

目录 1 在pom.xml中引入相关依赖 2 对数据库进行配置 2.1 配置application.yml 2.2 idea连接数据库 (3.2.1有用到) 3 Mybatis的使用 3.1 测试文件的引入 3.2 使用 3.2.1 使用注解(有小技巧(✪ω✪)) 3.2.2 使用动态sql 1 在pom.xml中引入相关依赖 <dependencies&g…

海外多语言盲盒开发:打破语言障碍,连接全球消费者

随着全球化的加速和互联网的普及&#xff0c;语言障碍成为了影响跨国交流和商业活动的重要因素。为了满足跨国市场的需求&#xff0c;海外多语言盲盒开发成为了一个新兴的领域。本文将探讨海外多语言盲盒开发的意义、现状和未来发展。 一、海外多语言盲盒开发的意义 在全球化…

RedHat8.4安装邮件服务器

一、配置发件服务器 1.1 根据现场IP&#xff0c;配置主机名 vim /etc/hosts 192.168.8.120 mail.test.com 将主机名更改为邮件服务器域名mail.test.com 1.2 关闭防火墙&#xff0c;禁止开机启动 systemctl stop firewalld systemctl disable firewalld 1.3 关闭selinux v…

基于springboot就业信息管理系统源码和论文

随着信息化时代的到来&#xff0c;管理系统都趋向于智能化、系统化&#xff0c;就业信息管理系统也不例外&#xff0c;但目前国内仍都使用人工管理&#xff0c;市场规模越来越大&#xff0c;同时信息量也越来越庞大&#xff0c;人工管理显然已无法应对时代的变化&#xff0c;而…

InnoDB 锁系统(小白入门)

1995年 &#xff0c;MySQL 1.0发布&#xff0c;仅供内部使用&#xff01; 开发多用户、数据库驱动的应用时&#xff0c;最大的一个难点是&#xff1a;一方面要最大程度地利用数据库的并发访问&#xff0c;另一方面还要确保每个用户能以一致性的方式读取和修改数据。 MVCC 并发…

基于python+控制台的员工信息管理系统

基于python控制台的员工信息管理系统 一、系统介绍二、效果展示三、其他系统实现四、获取源码 一、系统介绍 1.添加职工数据 2.显示职工数据 3.查询职工数据 4.修改职工数据 5.删除职工数据 6.保存职工数据 7.排序职工数据 8.统计职工工资数据 9.退出 二、效果展示 三、其他系…

从搜索引擎到答案引擎:LLM驱动的变革

在过去的几周里&#xff0c;我一直在思考和起草这篇文章&#xff0c;认为谷歌搜索正处于被颠覆的边缘&#xff0c;它实际上可能会影响 SEO 作为业务牵引渠道的可行性。 考虑到谷歌二十多年来的完全统治地位&#xff0c;以及任何竞争对手都完全无力削弱它&#xff0c;坦率地说&…