哈喽,我是杰克吴,继续记录我的学习心得。
一、关于兴趣的几点思考
1. 享受不是兴趣,愿意付出才是:
兴趣很容易跟享受混淆。享受是被动的,无需付出;而兴趣则要求你甘愿为了这件事情付出努力。
2.任何事情,接触皮毛的时候不要谈兴趣:
在我开始公众号写文章之前,只是粗浅地觉得这个事不难我可以尝试一下,而事实上,持续写作的难度和意义超乎大多数人的想象。
任何事情,先做到 60 分,再谈是否喜欢。
3. 兴趣和爱好不太一样:
区别在于你是否需要且愿意通过刻意练习以收获这个兴趣,以及这件事是否能给你带来持续的成就感。
吃喝玩乐(旅游,逛街,买买买)是爱好,不是兴趣。纯粹的看电影是爱好,但是认真地写影评(经历了思考与分享)则算是兴趣。表面看上去都是同一件事,但是不同人会发展成不一样的结果。
最开始时可能只是爱好,但是随着你的持续思考和投入,可能会发展为你的理想职业。
4. 兴趣可以带有功利性:
那些看似功利的标准(例如高考、面试),存在很多偏差的部分,但不可否认,在绝大多数情况下,它们提供了较为高效和正确的努力方向。
把自己热爱的事情用来挣钱,非常好。只凭自己的兴致去做,确实会有更多愉悦,但这也是最廉价、最轻易的喜欢了,问题是,你很难真正做得好。你真的喜欢这个事,你会主动争取做好,赢得市场才会给你带来更长久的愉悦感。
二、模块机制快速入门 (1)
目录:
1. 内核模块的使用
2. 内核模块的文件格式
3. EXPORT_SYMBOL 是如何实现符号导出的?
4. 相关参考
基于 Linux-4.14 + Arm-v7。
1. 内核模块的使用
最简单的内核模块:
#include <linux/init.h>
#include <linux/module.h>static char *name = "embedded hacker";
module_param(name, charp, S_IRUGO); // 指定模块可以接收的参数static void print_hello(void)
{printk(KERN_INFO "Hello World, %s\n", name);
}static int __init hello_init(void)
{printk(KERN_INFO "Hello World init\n");print_hello();return 0;
}
module_init(hello_init);static void __exit hello_exit(void)
{printk(KERN_INFO "Hello World exit\n ");
}
module_exit(hello_exit);EXPORT_SYMBOL(print_hello); // 导出符号 print_hello
MODULE_AUTHOR("es-hacker"); // 指定作者
MODULE_LICENSE("GPL v2"); // 指定 license
MODULE_DESCRIPTION("A simple Hello World Module"); // 指定模块的描述信息
MODULE_ALIAS("a simplest module"); // 指定模块的别名
运行效果:
$ insmod hello.ko // 加载模块
Hello World init // 加载模块时,module_init() 里的函数被调用
Hello World, embedded hacker$ rmmod hello // 卸载模块
Hello World exit // 卸载模块时,module_exit() 里的函数被调用$ insmod hello.ko name=Jack // 指定模块参数
Hello World init
Hello World, Jack$ rmmod hello
Hello World exit
到此,内核模块的使用方法就介绍完毕了,非常简单易用。
接下来是痛苦的部分:探索一下背后的实现机制。
2. 内核模块的文件格式
可以用 file
命令确定一个文件的格式:
$ file hello.ko
hello.ko: ELF 32-bit LSB relocatable, ARM, EABI5 version 1 (SYSV), BuildID[sha1]=2feb2cb1328c0a9113658d6e90ac20d7e4c56384, not stripped
内核模块的格式为 ELF ( Executable and Linkable Format ):
目前不需要全面了解 ELF 文件格式的所有技术细节,只需要结合 Linux 源码中定义的 ELF 相关数据结构,简单了解一下 ELF 的构造即可。
静态的 ELF 文件视图总体上可分为 3 部分:
头部的 ELF header;
中间的 Section;
尾部的 Section header table
1) ELF header 部分:
作用:描述整个 ELF 文件。
组成:Linux 内核里的数据结构定义如下,注释部分为内核模块机制相关的的成员。
typedef struct elf32_hdr{unsigned char e_ident[EI_NIDENT];/* 文件类型 */Elf32_Half e_type;Elf32_Half e_machine;Elf32_Word e_version;/* Entry point */Elf32_Addr e_entry;Elf32_Off e_phoff;/* Section header table 在文件中的偏移量 */Elf32_Off e_shoff;Elf32_Word e_flags;Elf32_Half e_ehsize;Elf32_Half e_phentsize;Elf32_Half e_phnum;/* Section header table 中 entry 的大小 */Elf32_Half e_shentsize;/* Section header table 中有多少个 entry */Elf32_Half e_shnum;Elf32_Half e_shstrndx;
} Elf32_Ehdr;
实践:
$ # readelf hello.ko -h # [-h|--file-header]
ELF Header:Magic: 7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00 Class: ELF32Data: 2's complement, little endianVersion: 1 (current)OS/ABI: UNIX - System VABI Version: 0Type: REL (Relocatable file)Machine: ARMVersion: 0x1Entry point address: 0x0Start of program headers: 0 (bytes into file)Start of p headers: 59648 (bytes into file)Flags: 0x5000000, Version5 EABISize of this header: 52 (bytes)Size of program headers: 0 (bytes)Number of program headers: 0Size of p headers: 40 (bytes)Number of p headers: 52Section header string table index: 51
2) Section 部分:
作用:对应人们常说的各种数据段、代码段等,术语是 p。
组成:ELF 文件的主体,位于文件视图中间部分的一个连续区域中。但是当模块被内核加载时,会根据各自属性被重新分配到新的内存区域。
3) Section header table 部分:
作用:每一个条目(术语叫 entry) 就是一个 Section header,负责描述 Section;
组成:由若干个 Section header entry 组成,Linux 内核里的数据结构定义如下 (注释部分为内核模块机制相关的的成员):
typedef struct elf32_shdr {Elf32_Word sh_name;Elf32_Word sh_type;Elf32_Word sh_flags;/* 对应的 p 在内存中的实际地址。初始值为0,当模块被内核加载时,会被修改为 p 在内存中的实际地址 */Elf32_Addr sh_addr;/* p 在文件视图中的偏移量 */Elf32_Off sh_offset;/* p 在文件视图中的大小 */Elf32_Word sh_size;Elf32_Word sh_link;Elf32_Word sh_info;Elf32_Word sh_addralign;Elf32_Word sh_entsize;
} Elf32_Shdr;
实践:
$ readelf hello.ko -S # [-S|--p-headers|--ps]
There are 52 p headers, starting at offset 0xe900:Section Headers:[Nr] Name Type Addr Off Size ES Flg Lk Inf Al[ 0] NULL 00000000 000000 000000 00 0 0 0[ 1] .note.gnu.build-i NOTE 00000000 000034 000024 00 A 0 0 4[ 2] .text PROGBITS 00000000 000058 000000 00 AX 0 0 1[...][ 5] .init.text PROGBITS 00000000 000070 00001c 00 AX 0 0 4[...][ 7] .exit.text PROGBITS 00000000 00008c 00000c 00 AX 0 0 4[...][ 9] __ksymtab PROGBITS 00000000 000098 000008 00 A 0 0 4[...][25] __ksymtab_strings PROGBITS 00000000 0001f1 00000c 00 A 0 0 1[26] __param PROGBITS 00000000 000200 000014 00 A 0 0 4[27] .rel__param REL 00000000 00b9e4 000020 08 I 49 26 4[28] __versions PROGBITS 00000000 000214 000100 00 A 0 0 4[29] .data PROGBITS 00000000 000314 000004 00 WA 0 0 4[...][48] .ARM.attributes ARM_ATTRIBUTES 00000000 00b21a 000031 00 0 0 1[49] .symtab SYMTAB 00000000 00b24c 000520 10 50 75 4[50] .strtab STRTAB 00000000 00b76c 0001cd 00 0 0 1[51] .shstrtab STRTAB 00000000 00e6e4 00021b 00 0 0 1Key to Flags:W (write), A (alloc), X (execute), M (merge), S (strings)I (info), L (link order), G (group), T (TLS), E (exclude), x (unknown)O (extra OS processing required) o (OS specific), p (processor specific)
这里只截取模块加载相关的部分 p header,现在有个初步印象就好,后续使用到了相关的 secition header,再做进一步的研究分析。
内核模块自身并不会使用到上述数据结构 (elf32_hdr、elf32_shdr),它们是给内核模块加载器在加载模块时使用的。
3. EXPORT_SYMBOL() 是如何实现符号导出的?
EXPORT_SYMBOL() 系列宏用来向外界导出一个符号。内核和内核模块通过符号表的形式向外部世界导出符号的相关信息。
为什么要导出符号?
如果没有独立存在的内核模块,作为单一的 Linux 内核映像,就没必要导出符号了。对于静态编译链接而成的内核映像而言,所有的符号引用都会在静态链接阶段完成。
有了内核模块之后,独立编译链接的内核模块要使用到内核提供的基础设施(即调用内核函数,例如 printk)的话,就必须要解决符号引用问题 (unresolved symbol)。
可以用
nm
命令来查看一个模块中出现的未定义符号:
$ nm hello.o -u # [-u|--undefined-only]U __aeabi_unwind_cpp_pr0U param_ops_charpU printkU __this_module
处理 unresolved symbol 问题的本质是在模块加载期间找到该符号在内存中的实际地址。
从全局上看,EXPORT_SYMBOL 的完整实现包括 3 部分:
EXPORT_SYMBOL 的定义部分
链接脚本链接器部分
使用导出符号部分
EXPORT_SYMBOL 的定义:
// include/linux/export.h
#define EXPORT_SYMBOL(sym) __EXPORT_SYMBOL(sym, "")/* For every exported symbol, place a struct in the __ksymtab p */
#define ___EXPORT_SYMBOL(sym, sec) \extern typeof(sym) sym; \__CRC_SYMBOL(sym, sec) \static const char __kstrtab_##sym[] \__attribute__((p("__ksymtab_strings"), aligned(1))) \= VMLINUX_SYMBOL_STR(sym); \static const struct kernel_symbol __ksymtab_##sym \__used \__attribute__((p("___ksymtab" sec "+" #sym), used)) \= { (unsigned long)&sym, __kstrtab_##sym }
以 hello.ko 为例,EXPORT_SYMBOL(print_hello) 本质上就是定义了 2 个变量:
static const char __kstrtab_print_hello[] = "print_hello"static const struct kernel_symbol __ksymtab_print_hello = {(unsigned long)&print_hello,__kstrtab_print_hello,
};
变量1: char []
用于保存符号名;
被放置在名为 "__ksymtab_strings" 的 p 中;
变量2: struct kernel_symbol
用于保存符号名与地址;
被放置在名为 "___ksymtab+print_hello" 的 p 中;
根据 scripts/module-common.lds 里的定义:
SECTIONS {[...]__ksymtab 0 : { *(SORT(___ksymtab+*)) }[...]
}
"___ksymtab+print_hello" 会被转换为 "__ksymtab",这样就跟我们用 readelf hello.ko -S 查看到的 p 对应上了。
为了让内核可以通过上述 __ksymtab p 找到被导出的符号,链接器必须导出 p 的地址:
include/asm-generic/vmlinux.lds.h/* Kernel symbol table: Normal symbols */ \__ksymtab : AT(ADDR(__ksymtab) - LOAD_OFFSET) { \VMLINUX_SYMBOL(__start___ksymtab) = .; \KEEP(*(SORT(___ksymtab+*))) \VMLINUX_SYMBOL(__stop___ksymtab) = .; \} /* Kernel symbol table: strings */ \__ksymtab_strings : AT(ADDR(__ksymtab_strings) - LOAD_OFFSET) { \*(__ksymtab_strings) \}
在 kernel/module.c 中,可以看到下列声明:
/* Provided by the linker */
extern const struct kernel_symbol __start___ksymtab[];
extern const struct kernel_symbol __stop___ksymtab[];
[...]
这些变量会在内核或者内核模块查找某个符号时被使用。
EXPORT_SYMBOL 和 EXPORT_SYMBOL_GPL 导出符号的可见性:
从这里开始重头戏模块加载的分析了,鉴于大多数人的注意力无法在一篇文章里上集中太久,更多的内容将放在后面的文章里。建议大家可以先自行阅读相关书籍,不是自己理解到的东西是消化不了的。
4. 相关参考
Linux 设备驱动开发详解,第 4 章节
深入 Linux 设备驱动程序内核机制,第 1 章节
深入 Linux 内核架构,第 7 章节
深入理解 Linux 内核,第20 章节、附录2
5. 更多值得关注的知识点
模块的加载
模块的参数传递机制
模块之间的依赖关系
模块中的版本控制机制
...
三、思考技术,也思考人生
要学习技术,更要学习如何生活。
你和我各有一个苹果,如果我们交换苹果的话,我们还是只有一个苹果。但当你和我各有一个想法,我们交换想法的话,我们就都有两个想法了。
推荐阅读:
专辑|Linux文章汇总
专辑|程序人生
专辑|C语言
嵌入式Linux
微信扫描二维码,关注我的公众号