链接程序和库指南

重定位处理

运行时链接程序在装入应用程序所需的全部依赖项之后,将会处理每个目标文件并执行所有必需的重定位。

在目标文件的链接编辑过程中,随可重定位输入目标文件提供的任何重定位信息均会应用于输出文件。但是,在创建动态可执行文件或共享库时,许多重定位无法在链接编辑时完成。这些重定位需要仅在目标文件装入内存时才知道的逻辑地址。在这种情况下,链接编辑器将在输出文件映像中生成新的重定位记录。然后,运行时链接程序必须处理这些新的重定位记录。

有关许多重定位类型的更详细说明,请参见重定位类型(特定于处理器)。重定位存在两个基本类型。

使用 dump(1) 可以显示目标文件的重定位记录。在以下示例中,文件 libbar.so.1 包含两条重定位记录,用于指示必须更新全局偏移表.got 节。


$ dump -rvp libbar.so.1



libbar.so.1:



.rela.got:

Offset      Symndx                Type              Addend



0x10438     0                     R_SPARC_RELATIVE  0

0x1043c     foo                   R_SPARC_GLOB_DAT  0

第一个重定位是一个简单的相对重定位,这可通过其重定位类型以及值为零的符号索引 (Symndx) 字节看出。此重定位需要使用将目标文件装入内存的基本地址来更新关联的 .got 偏移。

第二个重定位需要符号 foo 的地址。要完成此重定位,运行时链接程序必须从动态可执行文件或其依赖项之一查找该符号。

重定位符号查找

运行时链接程序负责搜索目标文件在运行时所需的符号。此符号搜索基于请求目标文件的符号搜索范围,以及进程中每个目标文件所提供的符号可见性。装入目标文件时,可将这些属性作为缺省属性应用。此外,也可将这些属性作为 dlopen(3C) 的特定模式提供。在某些情况下,可在生成目标文件时将这些属性记录在目标文件中。

通常,用户应该熟悉应用于动态可执行文件及其依赖项的缺省搜索模型,以及应用于通过 dlopen(3C) 获取的目标文件的缺省搜索模型。前者将在下一节缺省符号查找中概述,后者(也可使用各种符号查找属性)将在符号查找中介绍。

动态库使用直接绑定时,将提供替代的符号查找模型。此模型指示运行时链接程序直接在链接编辑时提供符号的目标文件中搜索符号。 请参见直接绑定

缺省符号查找

动态可执行文件及随其装入的所有依赖项都被指定了 world 搜索范围和 global 符号可见性。 请参见符号查找。针对动态可执行文件或随其装入的任何依赖项的符号查找会导致搜索每个目标文件。运行时链接程序将从动态可执行文件开始,并按目标文件的装入顺序搜索每个依赖项。

如以上各节中所述,ldd(1) 将按依赖项的装入顺序列出动态可执行文件的依赖项。例如,共享库 libbar.so.1 需要符号 foo 的地址来完成重定位。动态可执行文件 proglibbar.so.1 指定为其依赖项之一。


$ ldd prog

        libfoo.so.1 =>   /home/me/lib/libfoo.so.1

        libbar.so.1 =>   /home/me/lib/libbar.so.1

运行时链接程序首先会在动态可执行文件 prog 中查找 foo,然后在共享库 /home/me/lib/libfoo.so.1 中查找,最后在共享库 /home/me/lib/libbar.so.1 中查找。


注 –

符号查找操作的开销可能很大,尤其是在符号名称大小和依赖项数目增加的情况下。这方面的性能将在性能注意事项中详细介绍。有关替代查找模型,请参见直接绑定


缺省重定位处理模型还允许转换为延迟装入 (lazy loading) 环境。如果在当前装入的目标文件中找不到某符号,则会处理所有暂挂的延迟装入目标文件,以尝试查找该符号。此装入是对尚未完整定义其依赖项的目标文件的补偿。但是,该补偿可能会破坏延迟装入的优点。

插入

缺省情况下,运行时链接程序首先在动态可执行文件中搜索符号,然后在每个依赖项中进行搜索。使用此模型时,第一次出现的所需符号满足搜索要求。因此,如果同一符号存在多个实例,则会在所有其他实例中插入第一个实例。

简单解析中概述了插入如何影响符号解析。缩减符号范围中提供了有关更改符号可见性,从而减少意外插入几率的机制。

如果目标文件被显式标识为插入项,则可以对每个目标文件强制执行插入。使用环境变量 LD_PRELOAD 装入或通过链接编辑器的 -z interpose 选项创建的任何目标文件都会标识为插入项。运行时链接程序搜索符号时,将在应用程序之后、任何其他依赖项之前搜索标识为插入项的任何目标文件。

仅当在进行任何进程重定位之前装入了插入项的情况下,才能保证可以使用插入项提供的所有接口。在重定位处理开始之前,将装入使用环境变量 LD_PRELOAD 提供的插入项,或作为应用程序的非延迟装入依赖项建立的插入项。启动重定位之后,引入进程中的插入项会降级为正常依赖项。如果插入项是延迟装入的,或者是由于使用 dlopen(3C) 而装入的,则插入项可能会降级。可使用 ldd(1) 来检测前一种类别。


% ldd -Lr prog

        libc.so.1 =>     /lib/libc.so.1

        foo.so.2 =>      ./foo.so.2

        libmapmalloc.so.1 =>     /usr/lib/libmapmalloc.so.1

        loading after relocation has started: interposition request \

                (DF_1_INTERPOSE) ignored: /usr/lib/libmapmalloc.so.1

注 –

如果链接编辑器在处理延迟装入的依赖项时遇到显式定义的插入项,则插入项将被记录为非延迟可装入依赖项。


直接绑定

使用直接绑定的目标文件维护符号引用与提供定义的依赖项之间的关系。运行时链接程序使用此信息直接搜索关联目标文件中的符号,而不执行缺省符号搜索模型。只能对使用链接编辑指定的依赖项建立直接绑定信息。因此,建议使用 -z defs 选项。

可使用下列机制之一建立符号引用与符号定义的直接绑定。

直接绑定可以大大降低由于包含许多符号重定位与依赖项的动态进程而导致的符号查找开销。此模型还允许在已直接绑定到的不同目标文件中查找同名的多个符号。


注 –

通过将环境变量 LD_NODIRECT 设置为非空值,可在运行时禁用直接绑定。


缺省符号搜索模型允许将符号的所有引用绑定到某个定义。由于直接绑定忽略缺省搜索模型,因此直接绑定禁用隐式插入符号。但是,在搜索提供符号定义的目标文件之前,会先搜索任何显式标识为插入项的目标文件。显式插入项包括使用环境变量 LD_PRELOAD 装入的目标文件,或使用链接编辑器的 -z interpose 选项创建的目标文件。 请参见插入

某些接口可为缺省技术提供替代实现。这些接口期望其实现成为该技术在进程内的唯一实例。例如 malloc(3C) 系列。malloc() 系列实现有多种,并且每个系列都期望成为进程中使用的唯一实现。应该避免直接绑定到此类系列中的接口,否则同一进程可能会引用该技术的多个实例。例如,进程中的一个依赖项可针对 libc.so.1 直接绑定,而另一个依赖项可针对 libmapmalloc.so.1 直接绑定。对 malloc()free() 的两种不同实现的不一致使用很可能会产生错误。

提供期望成为进程中的单一实例的接口的目标文件应该避免直接绑定到其接口。为防止任何调用方直接绑定到某接口,可以使用下列机制之一标记该接口。

非直接标记禁止任何符号引用直接绑定到实现。用于满足引用要求的符号搜索将使用缺省符号搜索模型。在生成随 Solaris 提供的各种 malloc() 系列实现时,使用了非直接标记。


注 –

NODIRECT mapfile 指令可与命令行选项 -B direct-z direct 组合使用。未显式定义 NODIRECT 的符号位于该命令行指令之后。同样,DIRECT mapfile 指令也可与命令行选项 -B nodirect 组合使用。未显式定义 DIRECT 的符号位于该命令行指令之后。


执行重定位的时间

根据重定位的执行时间,重定位可分为两种类型。产生这种区别是由对已重定位偏移进行的引用的类型所致。

即时引用指的是必须在装入目标文件后立即确定的重定位。这些引用通常是目标文件代码使用的数据项、函数指针,甚至是通过与位置相关的共享库进行的函数调用。这些重定位无法向运行时链接程序提供有关何时引用重定位项的信息。因此,必须在装入目标文件时,并在应用程序获取或重新获取控制权之前执行所有即时重定位。

延迟引用指的是在目标文件执行时可确定的重定位。这些引用通常是通过与位置无关的共享库进行的全局函数调用,或者是通过动态可执行文件进行的外部函数调用。在对提供这些引用的任何动态模块进行编译和链接编辑的过程中,关联的函数调用将成为对过程链接表项的调用。这些项构成 .plt 节。每个过程链接表项都成为包含关联重定位的延迟引用。

在首次调用过程链接表项时,控制权会移交给运行时链接程序。运行时链接程序将查找所需符号,并重写关联目标文件中的项信息。将来调用此过程链接表项时,将直接转至相应函数。使用此机制,可以推迟此类型的重定位,直到调用函数的第一个实例。此过程有时称为延迟绑定。

运行时链接程序的缺省模式是在每次提供过程链接表重定位时执行延迟绑定。通过将环境变量 LD_BIND_NOW 设置为任意非空值,可以覆盖此缺省模式。此环境变量设置将导致运行时链接程序在装入目标文件时,同时执行即时引用和延迟引用重定位。这些重定位在应用程序获取或重新获取控制权之前执行。例如,根据以下环境变量来处理文件 prog 及其依赖项中的所有重定位。在将控制权转交给应用程序之前处理这些重定位。


$ LD_BIND_NOW=1 prog

此外,也可使用 dlopen(3C) 来访问目标文件,并将模式定义为 RTLD_NOW。还可使用链接编辑器的 -z now 选项来生成目标文件,以指示该目标文件需要在装入时进行完整的重定位处理。此重定位要求还将在运行时传播至所标记目标文件的所有依赖项。


注 –

前面的即时引用和延迟引用示例都很典型。但是,过程链接表项的创建最终受用作链接编辑输入的可重定位目标文件提供的重定位信息控制。R_SPARC_WPLT30R_386_PLT32 等重定位记录指示链接编辑器创建过程链接表项。这些重定位由与位置无关的代码公用。

但是,通常会通过与位置相关的代码创建动态可执行文件,该代码可能不会指示需要过程链接表项。由于动态可执行文件具有固定位置,因此链接编辑器可在将引用绑定到外部函数定义时创建过程链接表项。无论原始重定位记录如何,都会创建此过程链接表项。


重定位错误

如果找不到符号,则会发生最常见的重定位错误。此情况将会产生相应的运行时链接程序错误消息并终止应用程序。在以下示例中,找不到在文件 libfoo.so.1 中引用的符号 bar


$ ldd prog

        libfoo.so.1 =>   ./libfoo.so.1

        libc.so.1 =>     /lib/libc.so.1

        libbar.so.1 =>   ./libbar.so.1

        libm.so.2 =>     /lib/libm.so.2

$ prog

ld.so.1: prog: fatal: relocation error: file ./libfoo.so.1: \

symbol bar: referenced symbol not found

$

在对动态可执行文件进行链接编辑的过程中,此类别的任何潜在重定位错误都会标记为致命未定义符号。 有关示例,请参见生成可执行的输出文件。但是,如果运行时找到的依赖项与链接编辑过程中引用的原始依赖项不兼容,则可能会发生运行时重定位错误。在前面的示例中,根据包含 bar 的符号定义的 libbar.so.1 共享库的版本生成了 prog

在链接编辑过程中使用 -z nodefs 选项,将抑制验证目标文件运行时重定位要求。抑制验证还可能会导致运行时重定位错误。

如果由于找不到用作即时引用的符号而发生重定位错误,则会在进程初始化期间立即出现该错误状态。对于延迟绑定的缺省模式,如果找不到用作延迟引用的符号,则会在应用程序获取控制权后出现该错误状态。后一种情况可能需要几分钟、几个月,也可能从不发生,具体情况视整个代码中使用的执行路径而定。

为防止发生此类错误,可使用 ldd(1) 来验证任何动态可执行文件或共享库的重定位要求。

如果在使用 ldd(1) 时指定 -d 选项,将列显每个依赖项并处理所有即时引用重定位。如果无法解析引用,则会生成诊断消息。在前面的示例中,-d 选项将导致以下错误诊断。


$ ldd -d prog

        libfoo.so.1 =>   ./libfoo.so.1

        libc.so.1 =>     /lib/libc.so.1

        libbar.so.1 =>   ./libbar.so.1

        libm.so.2 =>     /lib/libm.so.2

        symbol not found: bar           (./libfoo.so.1)

如果在使用ldd(1) 时指定 -r 选项,将处理所有即时引用延迟引用重定位。只要有一种类型的重定位无法被解析,就会生成诊断消息。