Linux内核的格式化打印函数是printk(),它与printf()函数是类似的,都是根据格式字符串把可变参数列表转化成字符序列,然后输出到控制台。
printf()是打印到标准输出stdout。
printk()是打印到控制台终端。在使用串口线连接嵌入式硬件时,就是打印到电脑的串口终端软件,例如minicom。
转化可变参数列表这一步,这两个函数是一样的,都是调用vsnprintf()函数。
区别是内核没法调用C库,只能另外写一个简单的实现。
vsnprintf()的实现,依靠的是C语言处理可变参数的类型valist,以及使用它的三个宏:vastart,vaarg,vaend。
它们都定义在头文件里。
我在电脑上调试时,直接把siskavalist定义为了C库的valist,如上图。
5-10行注释掉的部分,是32位C语言的valist定义。
snprintf的代码就这么几行,使用vastart获取参数列表的开头,然后调用vsnprintf()打印出来,最后使用vaend。
对格式串的解析在vsnprintf()里,带n的printf系列函数可以标示缓冲区的大小,避免字符串溢出。
vsnprintf()的实现:
buf,缓冲区的地址。
size,缓冲区的大小。
fmt,格式串。
ap,可变参数列表,开始时指向它的第1个元素。
先把字符的计数设置为0,size -1是为了给末尾的'\0'留一个位置,然后遍历格式串fmt。
130-133,不是%则直接打印到缓冲区。
135-139,是%则查看下一个,如果也是%则打印到缓冲区,所以%%会打印%。
141-145,查看是否是十六进制的前缀。
147-151,查看是否是长整型的前缀。
153开始的switch语句是对格式参数的解析:
154,c表示打印1个字符,它是按照int存储在参数里的,所以vaarg的类型选int。
157-162,根据是否有前缀选择普通整型或长整型,有符号的。
163-168,同上,无符号的。
169-181,十六进制的整数,根据格式参数选择是否打印0x前缀,是否长整型。
183,p表示打印指针,其中空指针会打印null。
185-188,浮点数,全按double处理。
190,字符串,它的内容也是一个'\0'结尾的char*字符列表。
197,移动到格式串的下一个字符,继续判断while条件。
这时无论格式串到了末尾'\0',还是缓冲区只剩了最后1个'\0'的空间,都会退出while循环,避免缓冲区越界。
200行,填充结尾的'\0',返回转化的字符总数。
siskaulong2a()函数,是把无符号长整型转换为字符串的函数,普通的整型也用它转换,编译器会自动把unsigned int类型升级到unsigned long。
打印字符会改变当前缓冲区的字符计数,所以参数传了int* pn,即计数的指针。它既是输入参数,也是输出参数。
num %10先获取个位数,然后 num /10去掉个位数,下一次就是获取十位数,以此类推,直到为0。具体的字符要加上'0'。
这么打印出来的数字字符串是反着的,低位先被打印,所以19-23行的while再把它正过来。我们在第6行提前记录了这串字符的起始位置。
siskalong2a(),有符号的打印除了负数时要先打印1个负号之外,其他的与无符号的一样。
siskadouble2a(),浮点数都是有符号的,负数也要先打印1个负号,然后先取整数部分,再取小数部分,把它们都当整数打印,中间打印小数点。
小数部分这里用了6位有效数字。
siskahex2a(),十六进制的都按无符号处理,除了从10的余数变成16的余数之外,与unsigned long的区别只有67行,即大于9的从'a'开始显示,9以内的加上'0'显示。
x -10+ 'a',就是10-15要显示的字符,10对应'a',15对应'f'。
如果带前缀打印十六进制,就先打印0x,占2个字符的空间。
siskap2a(),指针都带0x前缀,按十六进制打印,空指针显示null。
siskastr2a(),字符串按原样打印。
main()函数,和测试结果。
下图第2张是缓冲区不足时的打印,第1张是缓冲区1024字节的打印。
Linux使用bochs模拟BIOS读磁盘
先调用这个函数把数据转化到缓冲区里,然后通过串口线打印出来,就是printk()。
如果通过标准输出stdout打印出来,就是printf()。
如果通过FILE* fp 文件句柄打印出来,就是fprintf()。
还可以继续添加格式字符,让它支持更多的数据类型。
但在linux内核里,实际上连浮点数都尽量不用,支持有符号和无符号的整数以及字符串,基本就够用了。
想了解更多精彩内容,快来关注闲聊代码
PS:在32位的堆栈传参模式下,格式串const char* fmt后面就是参数列表,所以只要取格式串的地址&fmt,加上4字节就是下一个参数的地址,然后根据格式串里%之后的类型字符依次打印就行。
32位是按4字节对齐,char、short这种不到4字节的类型也是转化为4字节压栈,double、long long这种按8字节压栈。
64位是用寄存器传前6个参数,多于6个的按堆栈传参,而且还是整数与浮点数分开传,整数使用rdi、rsi、rdx、rcx、r8、r9,浮点数使用xmm0、xmm1、xmm2,一直到xmm7。
如果参数是printf("%d,%f\n",1,2.71)这样,rdi是格式串,rsi是整数1,xmm0是浮点数2.71。
如果自己实现vastart,vaarg的话,需要让printf()函数先调用自己实现的printf(),这样才能自己控制寄存器参数的存放顺序,然后在printf()里在调用vsnprintf()。
否则,只能依赖gcc提供的valist,vastart,vaarg,vaend,因为寄存器参数在这种情况下怎么保存,是编译器的权限范围。
而寄存器参数的保存方式,则关系到valist的实现。