第七章：链接

链接（Linking）是将各种代码和数据片段收集并组合成一个单一的文件的过程。合成的文件可以被加载（load）到内存中执行。该过程由链接器（Linker）程序自动执行。链接存在三种类型：

执行于编译时（Compile Time），即在源代码被翻译成机器代码时
执行于加载时（Load Time），即程序被加载器（Loader）加载到内存并执行时
执行于运行时（Run Time），即由应用程序来执行

链接的存在，使得分离编译（Separate Compilation）成为可能。一个大型应用程序可以分解成若干个小的模块，只需要对这些模块进行修改编译，然后通过链接器将其组合成大的可执行文件就行。

本章讨论的范围从传统的静态链接（static linking），到加载时动态链接（dynamic linking）共享库（shared library），再到运行时动态链接共享库。 CMU的ICS+课程不要求动态链接，于是本整理的关注点也多在静态链接。本文使用的环境：运行Linux的x86-64系统，使用标准的ELF-64目标文件格式。一个重要的工具是readelf命令，可惜我不会。

7.1 概念强化

7.1.1 静态链接

我们可以通过gcc -c a.c生成可重定位目标文件a.o（relocatable object file）。而把所有所需的可重定位目标文件完全链接生成的可加载和运行的文件叫做可执行目标文件（executable object file）。比如gcc main.o func.o -o out后便可./out了。以上这个行为我们称之为静态链接（static linking）。

为了生成可执行文件，链接器要完成两项重要工作：

符号解析（symbol resolution）：将每个符号引用和一个符号定义关联起来。符号是函数、全局变量和静态变量（被static关键词修饰的变量）
重定位（relocation）：由于编译器和汇编器生成的代码和数据节是从地址0开始的，所以链接器需要对代码、数据节、符号分配内存地址，并且修改所有对这些符号的引用来使它们指向内存位置。链接器只需利用汇编器产生的重定位条目（Relocation Entry）的指令便可完成重定位。

7.1.2 目标文件

7.1.1已经讲过了可重定位目标文件以及可执行目标文件，还有一种目标文件叫做共享目标文件（shared object file），这是一种特殊类型的可重定位目标文件，可以在加载时或运行时被动态地加载进内存并链接。

目标文件是按照特定的目标文件格式进行组织的。 Windews中使用可移植可执行（Portable Executable，PE）格式，Max OS-X使用Mach-O格式，x86-64 Linux和Unix使用可执行可链接格式（Executable and Linkable Format，ELF）。 csapp采用的是ELF格式。利用readelf命令可以分析目标文件。

7.2 可重定位目标文件

上图是可重定位目标文件的ELF格式，接下来逐一解释每个节（section）。

ELF头（ELF header）：包含生成该目标文件的系统的字大小和字节顺序、ELF头的大小、目标文件类型、机器类型、节头部表的文件偏移，以及节头部表中条目的大小和数目。
.text：已编译程序的机器代码
.rodata：只读数据(read-only data)，比如跳转表等等
.data：保存已初始化的全局变量和静态变量。局部变量在运行时只保存在栈中，不出现在.data和.bss中
.bss：保存未初始化的全局变量和静态变量，以及被初始化为0的全局变量和静态变量。在目标文件中.bss不占据实际的空间，只是一个占位符。之所以要将初始化和未初始化分成两个节，因为在目标文件中，未初始化变量不需要占据任何实际的磁盘空间，运行时，再在内存中分配这些变量，初始值为0。
.symtab：符号表，存放在程序中定义和引用的函数和变量的符号信息。不包含局部局部变量条目，因为该变量是由栈管理的
.rel.text：包含了一系列需要在链接时修改的地址。通常来说，那些调用外部函数或者引用全局变量的指令需要被修改。在可执行目标文件中通常无该节。
.rel.data：.包含了那些被引用或者修改的全局变量的重定位信息。在可执行目标文件中通常无该节。
.debug：调试符号表，其条目是程序中定义的局部变量和类型定义，程序汇总定义和引用的全局变量，以及原始的C源文件。只有在编译时加入-g才会生成
.line：原始C源程序中的行号和.text节中机器指令之间的映射。只有在编译时加入-g才会生成
.strtab：字符串表，包括.symtab和.debug节中的符号表，以及节头部中的节名字
节头部表（Section Header Table）：给出不同节的大小和位置等其他信息

7.3 再议符号和符号表

7.3.1 符号

之前提过符号（symbol）是函数、全局变量和静态变量。根据符号定义和引用的情况，还可以将其分成以下类型：

全局链接器符号：在当前可重定位目标模块中定义，并能被其他模块引用的符号。对应于非静态的函数和全局变量。
外部链接器符号：在别的可重定位目标模块中定义，并被当前模块引用的符号。对应于在其他模块中定义的非静态的函数和全局变量。
局部链接器符号：只在当前可重定位目标模块定义和引用的符号。对应于静态的函数和全局变量，这些符号在当前模块中任何位置都可见，但不能被别的模块引用。

7.3.2 符号表

符号表.symtab中的每个条目具有以下格式

section说明该符号保存在哪个节中。特别的，有三个伪节（Pseudosection）：ABS：不该被重定位的符号；UNDEF：未定义的符号，即在当前可重定位目标文件中引用，但在别的地方定义的符号； COMMON：表示未被分配位置的未初始化的全局变量，此时value给出对齐要求，size给出最小的大小。.bss与COMMON的区别约定如下：

COMMON：未初始化的全局变量
.bss：未初始化的静态变量，初始化为0的全局和静态变量

7.4 再议符号解析

在了解符号表后，可以给出更明确的定义：链接器符号解析是将每个符号引用与输入的所有可重定位目标文件的符号表中的一个确定的符号定义关联起来。对于局部符号和静态符号，以上工作比较容易。但是对于全局符号，可能会碰到在多个可重定位目标文件中定义相同名字的全局符号。于是符号解析的关键在于解决该冲突。

7.4.1 解析多重定义的全局符号

编译器会向汇编器输出每个全局符号是强（Strong）还是弱（Weak），而汇编器会把这些信息隐式编码在可重定位目标文件的符号表中。函数和已初始化的全局符号是强符号，未初始化的全局符号是弱符号。然后链接器通过以下规则来处理在多个可重定位目标文件中重复定义的全局符号：

不允许有多个同名的强符号，如果存在，则链接器会报错
如果有一个强符号和多个弱符号同名，则符号选择强符号的定义
如果有多个弱符号同名，符号就随机选择一个弱符号的定义

我们从编译器的角度来看，当编译器看到一个弱全局符号时，它并不确定是否会在别的文件中对该符号进行定义，也无法确定链接器会采用多重定义的哪个定义。所以编译器将未初始化的全局符号放在COMMON表中，让链接器去决定。而当全局符号初始化为0时，它就是一个强全局符号，根据规则1可知该符号是唯一的，所以编译器可以直接将其分配到.bss中。而对于静态变量，由于其符号也是唯一的，所以编译器也可以直接将其放到.bss或.data中。

7.4.2 静态库链接与解析引用

静态库的链接

利用gcc -c addvec.c multvec.c得到addvec.o和multvec.o
利用ar rcs libvector.a addvec.o multvec.o得到静态库libvector.a
利用gcc -static -o prog2c main2.o ./libvector.a 使得静态库与main.o链接
等价于gcc -static -o prog2c main.o -L. -lvector

静态库的解析引用

命令行中的文件顺序是有要求的。但是这个符合直观认识，就直接举个例子。比如p.o -> libx.a -> liby.a且liby.a -> libx.a -> p.o。“a -> b”意思指a中引用的全局符号在b中定义。输入命令行的正确顺序为：gcc p.o libx.a liby.a libx.a

7.5 再议重定位

当链接器完成符号解析时，所有符号引用都能和一个符号定义关联起来了。此时链接器直到代码和数据节的确切大小，准备开始重定位工作。也就是合并节以及分配运行时的地址。具体如下：

重定位节和符号定义。链接器将所有目标模块中相同类型的节合并成同一类型的新的聚合节，比如将所有输入目标模块的.data节聚合成可执行文件中的.data节，其他节也如此操作。此时链接器知道代码节和数据节的确切大小，就将运行时内存地址赋给新的聚合节，以及输入模块定义的每个符号。此时程序的每条指令和全局变量都有唯一的运行时内存地址了。
重定位节内的符号引用。记得之前可重定位目标文件中，由于编译器和汇编器并不知道符号的运行时内存地址，所以使用一个占位符来设置符号引用的地址。而当前链接器已为符号分配了内存地址，所以链接器需要修改代码节和数据节中对每个符号的引用，使它们指向正确的运行时内存地址。

7.6.1 重定位条目

当汇编器生成目标模块时，它无法确定数据和代码最终会放在内存的什么位置，也无法确定该模块引用外部定义的函数和全局变量的位置，所以汇编器先用占位符来占领位置，然后对地址未知的符号产生一个重定位条目（Relocation Entry）。代码的重定位条目会保存在.rel.text节中，已初始化数据的重定位条目会保存在rel.data节中。重定位条目的数据结构如下所示

其中，offset表示要修改符号引用的内存地址；type表示重定位的类型，有R_X86_64_PC32（32位相对地址）和R_X86_64_32（32位绝对地址）；symbol是符号表的索引值，表示引用的符号，可以通过该符号获得真实的内存地址； addend是一个有符号常数，有些重定位需要使用这个参数来修改引用位置。

7.6.2 重定位符号引用

看书P691-P695，详细地讲了一个例子（不想动脑子了

7.7 可执行目标文件

通过以上符号解析和重定位过程，链接器已将可重定位目标文件和库合并成一个可执行目标文件了。目标文件的ELF格式如下所示：

ELF头：描述了文件的总体格式，还包括程序的入口点（Entry Point），即当程序运行时要执行的第一条指令的地址。
.init：定义了一个小函数_init，程序的初始化代码会调用
.text、.rodata和.data和可重定位目标文件中的类似，只是这里被重定位到了最终的运行时内存地址
由于可执行目标文件是完全链接的，已经不需要重定位了，所以不需要.rel节了

段头部表（Segment Header Table）：包括页大小、虚拟地址内存段（节）、段大小等等。描述了可执行文件连续的片到连续的内存段的映射关系，如下图所示是通过OBJDUMP显示的prog的段头部表

在可执行目标文件中，根据不同数据节对读写执行的不同要求，将不同的数据节分成了两个段：代码段和数据段。其中代码段包含ELF头、段头部表、.init、.text和.rodata，数据段包括.data和.bss。然后段头部表中就描述了代码段和数据段到内存段的映射关系，其中off是目标文件中的偏移，表示要从目标文件的什么位置开始读取该段； vaddr/paddr是内存地址，表示要将该段加载到的内存地址；align是对齐要求；filesz是目标文件中的段大小，则通过off和filesz就能确定我们要加载的段的内容； memsz是内存中的段大小，表示我们养将目标文件中的该段加载到多大的内存空间中；flags表示该段运行时的访问权限。

比如第1行、第2行描述的就是代码段，表示将目标文件中从0x0开始的0x69c个字节数据保存到从0x400000开始的，大小为0x69c字节的内存空间中，并具有读和可执行权限。第3行、第4行描述的是数据段，表示将目标文件从0xdf8开始的0x228个字节数据保存到从0x600df8开始的，大小为0x230字节的内存空间中，并具有读写权限。

为了使得程序执行时，目标文件中的段能高效地传送到内存中，要求vaddr mod align = off mod align

7.8 加载可执行目标文件

当我得到可执行目标文件prog时，我们可以在shell中输入./prog。

由于prog不是内置的shell命令，所以shell会认为prog是一个可执行目标文件，就通过调用execve函数来调用内核中的加载器（Loader）。则加载器会在可执行目标文件的段头部表的引导下，将可执行文件中的数据段和代码段复制到对应的内存位置，然后加载器会创建如下运行时内存映射：

代码段和数据段：x86-64通常将代码段保存在0x400000处，所以会将可执行目标文件的代码段和数据段映射为如上形式。注意：这里数据段为了满足对齐要求，会和代码段之间存在间隙。
运行时堆：在数据段之后会有一个运行时堆，是通过调用malloc库动态往上增长的
共享库：在堆之后是一个共享库的内存映射区域
用户栈：用户栈是从最大的合法用户地址开始，向较小的地址增长。在第八章有更详细的用户栈结构
内核：最上方的是位内核中的数据和代码保留的，是操作系统驻留在内存的位置

注意：链接器通常会使用地址空间布局随机化（ASLR）来修改堆、共享库和栈的地址，但是会保持三者相对位置不变。

随后加载器会跳转到程序的入口点，也就是_start函数的地址。然后_start函数调用系统启动函数__libc_start_main，该函数初始化执行环境，并调用用户层的main函数。其中，_start定义在系统目标文件ctrl.o，__libc_start_main定义在libc.so中。

7.9 动态库

静态库具有以下缺点：需要定期维护和更新，并且几乎所有C程序都会使用标准I/O函数，则运行时这些函数的代码会被复制到每个运行进程的文本段中，占用大量的内存资源。

为了解决静态库的问题提出了共享库（Shared Library），它是一个目标模块，不会在产生可执行目标文件时将数据段和代码段复制到可执行目标文件中进行静态链接，而是等到程序要加载时或要运行时才进行链接。我们可以提供最新的共享库，使得可执行目标文件可以直接和最新的共享库在加载或运行时链接，无需重新产生可执行目标文件。共享库由动态链接器（Dynamic Linker）加载到任意的内存地址，并和一个在内存中的程序链接起来。该过程称为动态链接（Dynamic Linking）。动态链接器本身就是一个共享目标，Linux中为ld-linux.so。

共享库的“共享”具有两层含义：

在任意文件系统中，一个库只有一个.so文件，所有引用该共享库的可执行目标文件都共享该.so文件中的代码和数据，不像静态库的内容会被复制到可执行目标文件中。
在内存中，一个共享库的.text节可以被不同正在运行的进程共享。

具体的实例以及背后的PIC机制，这里就不再讨论了。

7.10 库打桩

Linux链接器支持库打桩（Library Interpositioning）技术，允许你截获对共享库函数的调用，替换成自己的代码。基本思想为：创建一个与共享库函数相同函数原型的包装函数，使用库打桩技术来欺骗系统调用包装函数，而不是调用目标函数。包含：编译时打桩、链接时打桩以及运行时打桩。这里也不再详细讨论了。