《用“芯”探核:基于龙芯的Linux内核探索解析》是一本基于龙芯平台,结合源代码来探索和解析Linux-5.x内核的书。
市面上解析Linux 内核的经典书籍已有不少,尤其是被称为Linux 内核领域的“四库全书”:《Linux 内核设计与实现》 《Linux设备驱动程序》 《深入理解Linux 内核》和《Linux内核源代码情景分析》。
但是,一方面,大多数已有书籍是基于X86 或者ARM 体系结构的;另一方面,大多数已有书籍基于2.4 版本或者2.6 版本的Linux 内核,虽然近年来有了许多不错的原创新书。
同时,一直以来,从事龙芯内核开发工作的“标准教程”是《龙芯处理器用户手册》、《MIPS 体系结构透视》和《深入理解Linux 内核》。然而,《龙芯处理器用户手册》不涉及Linux 内核;《MIPS 体系结构透视》讲述的是传统的MIPS 处理器,离真正的龙芯差距太大;而《深入理解Linux 内核》所使用的内核版本又过于陈旧。
因此,正如中科院计算所研究员张福新在推荐语中说的:“这本基于龙芯平台的内核开发书籍的出版,恰逢其时。”
本书作者:陈华才
博士,高级工程师。现任江苏航天龙梦信息技术有限公司副总工程师,负责龙芯3 号处理器的内核开发。作为Linux内核中MIPS/ 龙芯3 号的Maintainer,向Linux 内核官方提交了大量的代码。
为什么写这本书?
我是谁?我就是一个既爱Linux也爱龙芯的开发者。十六年前开始接触Linux内核,十二年前开始接触龙芯电脑,十年前加入龙芯产业化基地,十年来伴随着龙芯一起成长,如今已成为Linux内核中龙芯3号的Maintainer。
有人说,“干一行,爱一行”,但我觉得“爱一行,干一行”更加符合可持续发展。龙芯和Linux都是我所爱,研究起来动力十足。一直以来,我在阅读内核源代码时都有做笔记的习惯,因为人脑毕竟容量有限,在知识体系不断扩张的过程中,笔记是必不可少的。我做笔记的方法以“代码摘抄+适度精简+注释解析”为主,但是随着时间的发展和内核版本的升级,笔记总量越来越大,不同版本中的同名函数也已经变得面目全非。于是,我经常不得不在笔记中记录源代码的多个版本,并且在代码片段的开始处加上版本标识。虽然说笔记主要是给自己看的,但正如热力学第二定律所昭示的一样,笔记的可读性已经不可避免地越来越差了(熵值太大)。
于是乎,便萌生了整理笔记并编写成书的想法。最初的想法成型于2013~2014年,但真正开始动笔的时候是2015年。在写书的过程中,解析方法尽量保留了笔记中精简代码的特点,但在内核版本的选择上全部采用了最新的LTS版本(长期维护稳定版本),即5.4.x版本。
用“芯”探核 基于龙芯的Linux内核探索解析
这本书选择了哪些内容?
全书以龙芯平台为重点,主要解析Linux 内核源代码。首先对龙芯处理器和Linux 内核进行概括性的介绍,并引入一种快速而有效的代码阅读方法,即“先观其大略,再咬文嚼字”。
操作系统是整个计算机的管理者,其本质上是一个大型软件平台,顺着程序的执行流程一起前进是自然而然的事情。因此,从Linux内核在龙芯计算机上的启动过程开始研究Linux 内核是一个比较好的切入点,以此获得一个对龙芯处理器和Linux 内核的宏观印象。
内核是操作系统中最基础、最重要的部分,其三大基本功能分别是中断/异常处理、内存管理、进程管理。这3章内容尽量遵循“从基础到上层”和“广度优先深度其次”的写作原则,更方便读者根据自己的需求安排阅读顺序。Linux内核支持X86、ARM、MIPS、PowerPC等多种体系结构,但对上层应用提供了基本一致的操作接口。因此,内核的三大基本功能中一部分是体系结构相关的特定内容,一部分是体系结构无关的通用框架。
由于Linux 是一体化内核操作系统,因此设备驱动也放在内核层实现。设备驱动所涵盖的范围非常广泛,本书不可能面面俱到,只选取了两种常用的典型设备驱动——Radeon 显卡与E1000E 网卡,来做举例性的原理说明。
Linux内核博大精深,本书虽然洋洋洒洒几百页,然而在两千多万行源代码实不过是沧海一粟。虽然我试图让内容覆盖更加全面,但也只是涉及了内核启动、异常中断、内存管理、进程管理、设备驱动和电源管理等几个常见话题,而对于文件系统、网络协议等方面的内容几乎只字未提。
怎样阅读上千万行的源代码?
阅读软件源代码是每个开发者的必由之路,尤其是内核开发者。因为内核开发在很大程度上并不是重新发明轮子,而是深入理解并尽量复用现有的内核设计框架,然后参照相似的功能模块去添加或改写某项需要的功能。在对内核整体框架以及某些子系统融会贯通以后,才有可能站在巨人的肩膀上去改进框架本身,实现自主创新。
阅读代码有“广度优先”和“深度优先”两种方式。代码好比一棵树,“广度优先”就是说我们要先找到主干,然后搞清楚主干上有几根树枝,再去某条感兴趣的树枝上寻找有意义的叶子;而“深度优先”指的是是碰到第一根树枝,就赶紧深入进去把所有的叶子给找出来。本书建议以广度优先为主,但在适当的时候也需要兼顾深度。因此,本书使用“树形视图”和“链式视图”来解析内核源代码,而这也是我以及我的同事在日常工作中常使用的方法。树形视图具有广度,能够快速理解大型函数的主干;链式视图具有深度,能够直观理解重点函数的调用。
(树形视图)
(链式视图)
在很多现有的书籍中,都会使用流程图来描述代码逻辑。然而,流程图虽然直观,但是其描述能力有限(尤其是缺乏树形视图的层次化表达能力),往往很难精确描述一个函数的执行过程。而一个费尽心机画出来的精确的流程图,往往又会因为其复杂性而失去了直观的功能。并且,单靠流程图并不能完全理解源代码,而是需要将源代码与流程图两相对照。
因此,本书尽量用精简版的源代码(即树形视图和链式视图)来代替流程图,一方面可以快速理解多级函数的复杂调用关系,另一方面可以不需要在源代码和流程图之间反复切换。
本书除了引入树形视图和链式视图,在开篇第1章首先介绍了“先观其大略,再咬文嚼字”的代码阅读方法。具体来说分为四个步骤,即“找准入口点”“理清主脉络”“顾名思义看功能”“理解补丁文件”。
从2015年开始动笔,到如今《用“芯”探核:基于龙芯的Linux内核探索解析》一书成型,其中的曲折艰辛实在是不足为外人道矣。在写书过程中,当我试图将一个基本原理向众人阐述明白的时候,才发现,其实之前自己只是似懂非懂。甚至可以说,写书最大的受益者是自己,因为整个知识体系真正得到了全面的升华。
谨以此书,献给一起为信息产业自主化而奋斗的同仁们。也希望此书,能给读者带来实质性的收获。