Linux Kernel Module加载卸除过程分析

文章参考的代码信息

内核: Linux v5.12-rc6
架构: X86

Kernel Module的加载过程

读取kernel module到内存(kernel/module.c)

内核中用于module load的系统调用有两个：finit_module和init_module。区别在于，finit_module接受的是一个fd，init_module直接从内存中复制。这两个调用是内核模块加载的入口，最终都会调用到load_module。加载过程中使用的管理结构为struct load_info，kernel module在内核内存中的地址，是通过__vmalloc申请出来的，被记录在info->hdr。

检查签名是否存在

module_sig_check

读取info->hdr末尾的一部分，并进行校验。检验结束后，更新info->len。
elf_validity_check

校验ELF相关的内容

处理并加载section(setup_load_info)

读取modinfo section

.modinfo这个section中放入module相关的一些描述信息。通过readelf -p .modinfo xxx.ko可以读出相应的信息，包括version，description，author等信息。
遍历各个section，获取符号表信息(strtb和symtb)，这一过程中，需要根据info->hdr和section中的offset，计算出真正的内存地址
读取.gnu.linkonce.this_module section
尝试读取__versions section，并更新info->index.vers

查看是否是被禁止加载的模块(blacklisted)

读取kernel中的module blacklist，这一过程中判断的依据是info->name，如果info->name在blacklist中，则不加载该模块。

更新各个section的地址

二进制中的section记录的是内存offset，以info->hdr为基准，进行重定位。

清除vers和info相关section中的SHF_ALLOC标记，后续过程中将不会分配内存。

检查module中的version信息是否存在

find_symbol

从已经加载的kernel和module符号中，寻找name为module_layout的符号，并获取到相应的信息。
进行crc和version校验

根据读取到的section信息，对内存进行分配

check_modinfo

对vermagic进行校验，如果不是由内核本身维护的module，设置污染标记(内核会打印'loading out-of-tree module taints kernel')

检查module的编译信息

检查是否有live-patch(check_modinfo_livepatch)

设置license(set_license)
module_frob_arch_sections

这个函数设置了weak属性，允许arch层重定义该函数，X86中未找到相关定义。

module_enforce_rwx_sections

检查各个section的flag
清除per-cpu sections标记中的SHF_ALLOC
将.data..ro_after_init标记为SHF_RO_AFTER_INIT(read only after init)
将__jump_table标记为SHF_RO_AFTER_INIT
遍历各个section，将section划分成两部分，分别是core part和init part。init part将在初始化完成后丢弃，从而节省内存。对于每个part，又细分为四类，分别是text，ro，ro_after_init，other，细分是为了后面设置内存页的权限。
设置core和init的符号表(layout_symtab)
move_module

根据7和8获取到的core和init的信息，将需要的信息从二进制中复制到core和init中，此时获得的地址，便是最终的运行地址。这一步执行结束后，mod变量被正确赋值。

初步加载kernel module

内核中管理module的结构为struct module

初始化一个struct module，并更新状态为MODULE_STATE_UNFORMED
查看kernel中是否已经加载相关module
更新module_addr_min和module_addr_max
将struct module插入到kernel的list中，此时，该module开始被kernel识别并管理
校验签名

module运行现场的初始化

分配内存给percpu section
初始化mod的依赖管理结构(source_list和target_list)
引用计数置为1
初始化mod->param_lock

find_module_sections

获取存有元数据的section，包括导出的符号表，crc校验参数等等
校验license和version(check_module_license_and_versions)
设置Module的描述信息(从.modinfo section中读取的内容)

simplify_symbols

这一步比较重要，进行符号表偏移的计算。对于SHN_UNDEF的符号，将在内核中进行查找，查找成功后，更新相应的依赖关系。对于weak属性的符号，会做进一步的检查和处理。对于除SHN_COMMON，SHN_ABS，SHN_LIVEPATCH，SHN_UNDEF之外的一般符号，依据符号的偏移以及所属section的基址，计算出符号的内存地址。

section重定位

apply_relocations

进行符号的重定位，有一类特殊的section，记录了对应section的relocation信息。relocation的计算分为三步： 1. 计算二进制中重定位部分的内存位置(src) 2. 根据type，计算内存中重定位部分的内存地址(dst) 3. 校验dst部分是否全为0，如果是，执行write(dst, src, size)
post_relocation
1. 对exception table进行排序
2. 执行符号表的拷贝工作(此时的符号表位置已经计算出来) return module_finalize(info->hdr, info->sechdrs, mod);
3. arch相关的结束动作()
刷新cache(flush_module_icache)，获取module的运行参数

开始运行module前的准备

查看是否有重复的符号
对init和core部分的四个类别section进行内存权限设置
设置module状态为MODULE_STATE_COMING
对内核的通知链发出一个通知，此后状态为MODULE_STATE_GOING
解析参数
设置sys相关的文件(mod_sysfs_setup)

开始运行module

如果注册了init，执行init函数
对内核的通知链发出一个通知，此后状态为MODULE_STATE_LIVE
mod计数减一
释放init区域

Kernel Module的卸载过程

检查是否有权限进行卸载
从用户参数中获取所要卸载的模块name
根据name寻找相应的module结构(find_module)
检查是否有其他模块依赖待卸载模块
执行module的exit函数
释放module占据的资源，更新内核的管理数据

参考

elf header
深入Linux设备驱动内核机制(陈学松著)第一章