A.2.107 –xarch=isa (Sun Studio 12：C++ 用户指南)

Sun Studio 12：C++ 用户指南

A.2.107 `–xarch=`isa

指定目标指令集体系结构 (instruction set architecture, ISA)。

该选项将编译器生成的代码限制为特定指令集体系结构的指令。该选项不保证使用任何目标特定的指令。不过，使用该选项会影响二进制程序的可移植性。

注 –

分别使用 -m64 或 -m32 选项来指定打算使用的内存模型 LP64（64 位）或 ILP32（32 位）。-xarch 选项不再指示内存模型，除非是为了与早期的发行版兼容，如下所示。

A.2.107.1 用于 SPARC 的 `-xarch` 标志

下表提供了 SPARC 平台上每个 -xarch 关键字的详细信息。

表 A–23 用于 SPARC 平台的 -xarch 标志


标志	含义
`generic`	使用大多数处理器通用的指令集。这是缺省设置。
`generic`64	为了在大多数 64 位平台上获得良好性能而进行编译。（仅限 Solaris）。此选项与 `-m64` `-xarch=generic` 等效，用于与早期发行版兼容。使用 `-m64` 而非 `- xarch=generic64` 来指定 64 位编译。
`native`	为了在此系统上获得良好性能而进行编译。编译器为运行它的当前系统处理器选择适当的设置。
`native`64	编译以在此系统中取得良好的性能（仅限 Solaris）。此选项等效于 `-m64` `-xarch=native`，用于与早期的发行版兼容。
`sparc`	针对 SPARC-V9 ISA （但不带有可视化指令集 (Visual Instruction Set, VIS)，也不带有其他特定于实现的 ISA 扩展）进行编译。该选项在 V9 ISA 上使编译器生成高性能代码。
`sparcvis`	针对具有可视化指令集 ( Visual Instruction Set, VIS) 版本 1.0 和 UltraSPARC 扩展的 SPARC-V9 进行编译。该选项在 UltraSPARC 体系结构上使编译器生成高性能代码。
`sparcvis2`	此选项允许编译器为具有 UltraSPARC III 扩展和可视化指令集 ( Visual Instruction Set, VIS) 2.0 版的 UltraSPARC 体系结构生成目标代码。
`sparcfmaf`	使该编译器可以使用 SPARC-V9 指令集中的指令、UltraSPARC 扩展（包括可视化指令集 (Visual Instruction Set, VIS) 版本 1.0），UltraSPARC-III 扩展（包括可视化指令集 (Visual Instruction Set, VIS) 版本 2.0）以及 SPARC64 VI 扩展来进行浮点乘加。必须将 `-xarch=sparcfmaf` 与 `fma=fused` 结合使用，并具有某个优化级别，以使编译器尝试查找机会来自动使用乘加指令。
`v7`	针对 SPARC-V7 ISA 进行编译。（已废弃）当前的 Solaris 操作系统不再支持 SPARC V7 体系结构，并且使用此选项编译的程序在当前平台上的运行速度较慢。缺省值为 `-xarch=v8plus`。示例：SPARCstation 1, SPARCstation 2.
`v8a`	针对 SPARC-V8 ISA 的 V8a 版本进行编译。按照定义，V8a 是指不包含 `fsmuld` 指令的 V8 ISA。该选项使编译器能够生成可在 V8a ISA 上获得良好性能的代码。示例：基于 microSPARC I 芯片架构的任何系统
`v8`	针对 SPARC-V8 ISA 进行编译。使编译器能够生成用于在 V8 架构上获得良好性能的代码。示例：SPARCstation 10
`v8plus`	针对 SPARC-V9 ISA 的 V8plus 版本进行编译。根据定义，`V8plus` 是指 V9 ISA，但只限于由 V8plus ISA 规范所定义的 32 位子集，而不包括可视化指令集 (Visual Instruction Set, VIS) 和其他特定实现的 ISA 扩展。该选项使编译器能够生成可在 V8plus ISA 上获得良好性能的代码。生成的目标代码采用 SPARC-V8+ ELF32 格式，只能在 Solaris UltraSPARC 环境下执行（不能在 V7 和 V8 处理器上运行）。示例：基于 UltraSPARC 芯片体系结构的任何系统
`v8plusa`	针对 SPARC-V9 ISA 的 V8plusa 版本进行编译。根据定义，`V8plusa` 是指 V8plus 体系结构加可视化指令集 (Visual Instruction Set,VIS) 版本 1.0 和 UltraSPARC 扩展。该选项使编译器能够生成可在 UltraSPARC 体系结构上获得良好性能的代码，但只限于 V8plus 规范定义的 32 位子集。生成的目标代码采用 SPARC-V8+ ELF32 格式，只能在 Solaris UltraSPARC 环境下执行（不能在 V8 处理器上运行）。示例：基于 UltraSPARC 芯片体系结构的任何系统
`v8plusb`	针对具有 UltraSPARC III 扩展的 SPARC-V8plus ISA 的 V8plusb 版本进行编译。此选项允许编译器为具有 UltraSPARC III 扩展和可视化指令集 ( Visual Instruction Set, VIS) 2.0 版的 UltraSPARC 体系结构生成目标代码。生成的目标代码采用 SPARC-V8+ ELF32 格式，只能在 Solaris UltraSPARC-III 环境中执行。使用此选项进行编译将使用最佳指令集，以便在 UltraSPARC III 体系结构上获得良好性能。
`v9`	等效于 `-m64` `-xarch=sparc`。使用 `-xarch=v9` 来获取 64 位内存模型的传统 makefile 和脚本仅需使用 `-m64`。
`v9a`	等效于 `-m64` `-xarch=sparcvis`，用于与早期发行版兼容。
`v9b`	等效于 `-m64` `-xarch=sparcvis2`，用于与早期发行版兼容。

另请注意：

SPARC 指令集体系结构 V8 和 V8a 均是二进制兼容的。
可以一起链接和执行使用 v8plus 和 v8plusa 编译的二进制目标文件 (.o)，但只能在 SPARC V8plusa 兼容平台上运行。
可以一起链接和执行使用 v8plus、v8plusa 和 v8plusb 编译的二进制目标文件 (.o)，但只能在 SPARC V8plusb 兼容平台上运行。
-xarch 值 v9、v9a 和 v9b 只能在 UltraSPARC 64 位 Solaris 操作系统中使用。
可以一起链接和执行使用 generic64、native64、v9 和 v9a 编译的二进制目标文件 (.o)，但只能在 SPARC V9a 兼容平台上运行。
可以一起链接和执行使用generic64、native64、v9、v9a 和 v9b 编译的二进制目标文件 (.o) ，但只能在 SPARC V9b 兼容平台上运行。

对于任何特定选择，生成的可执行文件在早期体系结构中运行时都会慢得多。此外，虽然在多数指令集体系结构中都可以使用四精度（REAL*16 和 long double）浮点指令，但编译器不在它生成的代码中使用这些指令。

用于 x86 的 `-xarch` 标志

下表列出了 x86 平台上的 -xarch 标志。

表 A–24 x86 上的 -xarch 标志


标志	含义
`386`	使指令集限制于 386/486 体系结构。
amd64	等效于 `-m64` `-xarch=sse2`（仅限 Solaris）。使用 `-xarch=amd64` 来获取 64 位内存模型的传统 makefile 和脚本仅需要使用 `-m64`。
amd64a	等效于 `-m64` `-xarch=sse2a`（仅限 Solaris）。
`generic`	使用大多数处理器通用的指令集。这是缺省设置。
`generic`64	为了在大多数 64 位平台上获得良好性能而进行编译。（仅限 Solaris）。该选项等效于 `-m64` `-xarch=generic`，用于与早期的发行版兼容。使用 `-m64` 而不是 `- xarch=generic64` 来指定 64 位编译。
`native`	为了在此系统上获得良好性能而进行编译。编译器为运行它的当前系统处理器选择适当的设置。
`native64`	编译以在此系统中取得良好的性能（仅限 Solaris）。该选项等效于 `-m64` `-xarch=native`，用于与早期的发行版兼容。
`pentium_pro`	使指令集限于 32 位 pentium_pro 体系结构。
`pentium_pro`a	将 AMD 扩展（3DNow!、3DNow! 扩展和 MMX 扩展）添加到 32 位 pentium_pro 体系结构中。
`sse`	将 `SSE` 指令集添加到 `pentium_pro` 体系结构。
`ssea`	将 AMD 扩展（3DNow!、3DNow! 扩展和 MMX 扩展）添加到 32 位 SSE 体系结构中。
`sse2`	将 `SSE2` 指令集添加到 `pentium_pro` 体系结构。
`sse2a`	将 AMD 扩展（3DNow!、3DNow! 扩展和 MMX 扩展）添加到 32 位 SSE2 体系结构中。
`sse3`	将 SSE3 指令集添加到 SSE2 指令集中。

x86 特别说明

以下是针对 x86 Solaris 平台进行编译时应了解的一些重要问题。

传统的 Sun 样式并行程序在 x86 上不可用。请改用 OpenMP。有关将传统并行指令转换为 OpenMP 的信息，请参见《Sun Studio 12: OpenMP API User’s Guide》。

以 -xarch 设置为 sse、sse2、sse2a 或 sse3 编译的程序必须在提供这些扩展和功能上的平台上运行。

从 Solaris 9 4/04 开始的操作系统发行版在 Pentium 4 兼容的平台上支持 SSE/SSE2。早期版本的 Solaris 操作系统不支持 SSE/SSE2。如果运行的 Solaris 操作系统未启用由 -xarch 选择的指令集，则编译器将无法为该指令集生成或链接代码。

如果在单独的步骤中编译和链接，请始终使用编译器以及相同的 -xarch 设置进行链接，以确保链接正确的启动例程。

x86 上的数值结果可能与 SPARC 上的结果不同，这是由 x86 80 位浮点寄存器造成的。要最大限度地减少这些差异，请使用 -fstore 选项，或者使用 -xarch=sse2 进行编译（如果硬件支持 SSE2 的话）。

Solaris 和 Linux 的数值结果也可能不同，因为内在的数学库（如 sin(x)）并不相同。

二进制兼容验证

从 Sun Studio 11 和 Solaris 10 操作系统开始，会对使用这些专用的 -xarch 硬件标志编译和生成的程序二进制文件进行验证，看其是否在适当的平台上运行。

在 Solaris 10 之前的系统中，不执行任何验证，用户负责确保使用这些标志生成的对象部署在合适的硬件上。

如果在没有相应功能或指令集扩展的平台上运行使用这些 -xarch 选项编译的程序，则可能会导致段故障或不正确的结果，并且不显示任何显式警告消息。

这一警告也扩展到使用 .il 内联汇编语言功能或使用 SSE、SSE2、SSE2a 和 SSE3 指令和扩展的 __asm() 汇编程序代码。

SPARC 缺省设置

目前，C++ 编译器针对其生成代码的缺省体系结构是 v8plus(UltraSPARC)。以后的发行版中将不再支持 v7。

新的缺省设置几乎可为当前使用的所有计算机都产生更高的运行时性能。但是，在缺省情况下，设计用于在 UltraSPARC 之前的计算机上进行部署的应用程序将不再在那些计算机上执行。使用 -xarch=v8 编译可以确保这些应用程序在那些计算机上执行。

如果要在 v8 系统上部署，则必须在每个编译器命令行以及任何链接时命令中显式指定选项 -xarch=v8。提供的系统库将在 v8 体系结构上运行。

如果要在 v7 系统上部署，则必须在每个编译器命令行以及任何链接时命令上显式指定选项 -xarch=v7。提供的系统库将使用 v8 指令集。对于此发行版，唯一支持 v7 的操作系统是 Solaris 8 操作系统发行版。遇到 v8 指令时，Solaris 8 操作系统会在软件中解释指令。程序会运行，但性能将下降。

x86 缺省设置

对于 x86，-xarch 缺省值为 generic。请注意，x86 上的 -fast 扩展为 -xarch=native。该选项将编译器生成的代码限制为特定指令集体系结构的指令。该选项不保证使用任何目标特定的指令。不过，使用该选项会影响二进制程序的可移植性。

如果在不同的步骤中编译和链接，请确保在两个步骤中为 -xarch 指定了相同的值。

交互

尽管可以单独使用该选项，但它属于 -xtarget 选项的扩展的一部分，并且可用于覆盖由特定的 -xtarget 选项设置的 –xarch 值。例如，-xtarget=ultra2 可扩展为 -xarch=v8plusa -xchip=ultra2 -xcache=16/32/1:512/64/1。在以下命令中， -xarch=v8plusb 覆盖了由 -xtarget=ultra2 的扩展设置的 -xarch=v8plusa。

example% CC -xtarget=ultra2 -xarch=v8plusb foo.cc

不支持 –compat[=4] 与-xarch=generic64、-xarch=native64、-xarch=v9、-xarch=v9a 或 -xarch=v9b 结合使用。

警告

如果在进行优化时使用该选项，那么在指定体系结构上适当选择就可以提供高性能的可执行文件。但如果选择不当就会导致性能的严重降级，或导致在预定目标平台上无法执行二进制程序。