影响 Oracle VM Server for SPARC 软件的错误

语言：

本节总结了在使用此版本的软件时可能遇到的错误。最新的错误最先列出。如果有解决方法和恢复过程，则会提供。

注 - 本节中描述的某些错误在 Oracle VM Server for SPARC 3.1 发行版后已经修复。保留了这些错误说明是为了方便那些仍然在运行 Oracle VM Server for SPARC 3.1 发行版的人员。

影响 Oracle VM Server for SPARC 3.2 软件的错误

`rcm_daemon` 可能会在 `ldm remove-io` 操作过程中在控制台上发出消息

错误号 20619894：如果未安装 system/management/hwmgmtd 软件包，则动态总线删除操作会导致 rcm_daemon 在控制台上输出以下消息：

rcm_daemon[839]: rcm script ORCL,pcie_rc_rcm.pl: svcs: Pattern 'sp/management'
doesn't match any instances

解决方法：可以放心地忽略此消息。

电源管理策略设置为 `elastic` 时，恢复模式可能会挂起

错误号 20570207：电源管理策略设置为 elastic 时，则当 Logical Domains Manager 在检测到资源故障或缺少资源后恢复域时，primary 域可能会挂起。

恢复：将策略更改为 disabled，然后关闭并重新打开系统电源以重新启动恢复模式。

在进行延迟重新配置过程中，使用 Fujitsu M10 服务器套接字命令时出现意外行为

错误号 20432421：如果使用 grow-socket 或 shrink-socket 命令在延迟配置过程中修改虚拟 CPU 或核心，则可能会遇到意外行为。属于 primary 域的内存被重新分配，从而使得只有指定套接字中的内存绑定到该域。

解决方法：不在延迟重新配置模式下时，仅通过使用 shrink-socket 和 grow-socket 命令来修改虚拟 CPU 或核心。

在进入 `factory-default` 之后，如果系统引导设备不是以前活动配置中的引导设备，则恢复模式将失败

错误号 20425271：在进入 factory-default 后触发恢复过程中，如果系统引导设备不是以前活动配置中的引导设备，则恢复模式将失败。如果活动配置使用的引导设备不是 factory-default 引导设备，则可能发生此故障。

解决方法：在需要将新配置保存到 SP 时，执行以下步骤：

确定到 primary 域的引导设备的完全 PCI 路径。

在步骤 4 中将此路径用于 ldm set-var 命令。
从 primary 域中删除任何当前设置的 boot-device 属性。

仅当 boot-device 属性设置了值时才需要执行此步骤。如果该属性未设置任何值，则试图删除 boot-device 属性将导致 boot-device not found 消息。
```
primary# ldm rm-var boot-device primary
```
将当前配置保存到 SP。
```
primary# ldm add-spconfig config-name
```
显式设置 primary 域的 boot-device 属性。
```
primary# ldm set-var boot-device=value primary
```
如果在按所述将配置保存到 SP 后再设置 boot-device 属性，则会在触发恢复模式时引导指定的引导设备。

恢复：如果恢复模式已如所述失败，请执行以下步骤：

将引导设备显式设置为上次运行配置时所用的引导设备。
```
primary# ldm set-var boot-device=value primary
```
重新引导 primary 域。
```
primary# reboot
```
通过重新引导可让恢复继续。

`ldm list-rsrc-group` 不正确地在错误的资源组下显示了 PCIe 总线信息

错误号 20426593：当资源组名称数字后缀有多个数字时，ldm list-rsrc-group 可能会在不正确的资源组下显示 I/O 资源信息。

在以下示例中，ldm list-rsrc-group 命令在 /SYS/CMIOU1 资源组下不正确地显示了 /SYS/CMIOU10 的 PCIe 总线信息。

primary# ldm list-io
NAME                  TYPE   BUS      DOMAIN    STATUS
----                  ----   ---      ------    ------
..
/SYS/CMIOU10/PCIE2     PCIE   pci_50   primary   OCC
/SYS/CMIOU10/PCIE3     PCIE   pci_51   primary   OCC
/SYS/CMIOU10/PCIE1     PCIE   pci_53   primary   OCC
..
.
primary# ldm list-rsrc-group -l -o io /SYS/CMIOU1
NAME
/SYS/CMIOU1

IO
    DEVICE           PSEUDONYM        BOUND
    pci@305          pci_5            alt-root
    pci@306          pci_6            primary
    pci@308          pci_8            alt-root
    pci@309          pci_9            primary
    pci@332          pci_50           primary
    pci@333          pci_51           primary
    pci@335          pci_53           primary

PCIe 总线 pci_50、pci_51 和 pci_53 不正确地显示在 /SYS/CMIOU1 资源组下，而不是显示在 /SYS/CMIOU10 资源组下。

解决方法：运行 ldm list-io -l 命令从 I/O 名称获取 PCIe 总线的正确资源组名称。例如，I/O 名称为 /SYS/CMIOU10/PCIE2 的 PCIe 总线应属于 /SYS/CMIOU10，而不属于 /SYS/CMIOU1。

当虚拟磁盘后端在服务域中不可用时，恢复模式不恢复来宾域

错误号 20321459：如果虚拟磁盘后端缺失并且无法验证，则 Logical Domains Manager 不恢复分配到该后端的来宾域。即使配置了多路径也会出现这种情况。

解决方法：执行以下步骤：

暂时禁用设备验证。

primary# svccfg -s ldmd setprop ldmd/device_validation integer: 0
primary# svcadm refresh ldmd
primary# svcadm restart ldmd

手动恢复缺少后端的来宾域。

请注意，禁用了设备验证后，即使后端或关联的物理网络设备不存在，Logical Domains Manager 也会向来宾域添加虚拟设备。因此，请确保在恢复了域配置后重新启用设备验证。
```
primary# svccfg -s ldmd setprop ldmd/device_validation integer: -1
primary# svcadm refresh ldmd
primary# svcadm restart ldmd
```

`ldm bind` 命令发出 `Invalid response` 错误

错误号 20307560：如果创建的来宾域使用任意数量的虚拟 CPU 及任意数量的内存，则在运行 ldm bind 命令时，该命令可能会发出 Invalid response 错误。如果在创建该来宾域并运行 ldm bind 命令之前 primary 域拥有所有资源，则可能发生此错误。

解决方法：从 primary 域中移除部分内存，然后运行 ldm bind 命令。

当在延迟重新配置模式下重新启动 Logical Domains Manager 时，物理功能或虚拟功能停滞在 `INV` 状态

错误号 20257979：从物理功能创建虚拟功能的方法之一是将拥有物理功能的根域置于延迟重新配置模式。在延迟重新配置模式下，可以通过使用 ldm create-vf 命令创建一个或多个虚拟功能。

正常情况下，ldm list-io 命令会显示物理功能及其子虚拟功能处于清除状态。但是，如果 ldmd 服务重新启动的时间在根域重新引导的时间之前，或者取消了延迟重新配置，则物理功能及其虚拟功能将标记为 INV 状态。

在延迟重新配置模式下销毁虚拟功能时，会发生同样的问题。在销毁虚拟功能时，重新启动 Logical Domains Manager 后运行 ldm list-io 输出将不显示该根域的任何物理功能。

解决方法：执行以下解决方法之一：

取消延迟重新配置。

接下来运行 ldm list-io 命令时，物理功能及其任何现有的虚拟功能将处于有效状态。
重新引导曾处于延迟重新配置模式的根域。

请注意，在根域处于延迟重新配置模式时执行的任何修改将出现在来宾域上的 OS 中。

功率上限在限制范围内时 CPU 未恢复

错误号 20187197：在启用了功率上限的情况下，有时无法设置最低电源状态。电源状态已降级，但未降至最低状态。出现这种情况时，在设置了保证最高电源状态的较高功率限制之后，可能未恢复最高电源状态。

在设置的新功率限制值接近系统的最小功率限制值时，或者在设置新功率限制值时实际功率（无功率限制）与新限制值间的差异会导致采用最低电源状态，就会发生这种情况。

解决方法：执行以下步骤之一：

禁用功率限制
设置不是很大或者接近于系统最小功率限制值的新功率限制值

I/O 域上的 `ixgbevf` 节点被 `ipadm` 命令报告为已禁用，并且被 `ifconfig` 命令报告为不存在

错误号 20004281：在关闭并重新打开 primary 域电源时，I/O 域上的 ixgbevf 节点可能被 ipadm 命令报告为已禁用，并被 ifconfig 命令报告为不存在。

解决方法：重新启用 IP 接口：

# svcadm restart network/physical:default

无法使用通过使用到 I/O 域的直接 I/O 分配的 HGXE 接口

错误号 19943809：如果分配卡时使用了直接 I/O 功能，则 hxge 驱动程序无法使用 I/O 域中的接口。

以下警告将发到系统日志文件中：

WARNING: hxge0 : <== hxge_setup_mutexes: failed 0x1

解决方法：将以下行添加到 /etc/system 中并重新引导：

set px:px_force_intx_support=1

来宾域 `eeprom` 更新在 `ldm add-spconfig` 操作未完成的情况下会丢失

错误号 19932842：尝试从来宾域设置 OBP 变量时，如果使用 eeprom 或 OBP 命令时以下命令之一未完成，则设置可能会失败：

ldm add-spconfig
ldm remove-spconfig
ldm set-spconfig
ldm bind

如果这些命令完成的时间超过 15 秒，则可能发生此问题。

# /usr/sbin/eeprom boot-file\=-k
promif_ldom_setprop: promif_ldom_setprop: ds response timeout
eeprom: OPROMSETOPT: Invalid argument
boot-file: invalid property

恢复：在 ldm 操作完成后重试 eeprom 或 OBP 命令。

解决方法：在受影响的来宾域上重试 eeprom 或 OBP 命令。也许可通过在 primary 域上使用 ldm set-var 命令来避免该问题。

重新引导有超过 1000 个虚拟网络设备的来宾域导致紧急情况

错误号 19449221：一个域拥有的虚拟网络设备 (vnet) 数量不能超过 999 个。

解决方法：将一个域上的 vnet 数量限制为 999 个。

Oracle VM Server for SPARC 不再跟踪释放的 MAC 地址

错误号 19078763：Oracle VM Server for SPARC 不再跟踪释放的 MAC 地址。现在分配 MAC 地址时将随机选择地址，然后确认该地址未被本地网络上的任何逻辑域占用。

Sun Storage 16 Gb 光纤通道通用 HBA 固件不支持带宽控制

错误号 18083904：Sun Storage 16 Gb 光纤通道通用 HBA 固件 Emulex 卡不支持设置带宽控制。HBA 固件将忽略为 bw-percent 属性指定的任何值。

解决方法：无。

根域中光纤通道虚拟功能的设备路径不正确

错误号 18001028：在根域中，光纤通道虚拟功能的 Oracle Solaris 设备路径不正确。

例如，不正确的路径名为 pci@380/pci@1/pci@0/pci@6/fibre-channel@0,2，应当为 pci@380/pci@1/pci@0/pci@6/SUNW,emlxs@0,2。

ldm list-io -l 输出显示了光纤通道虚拟功能的正确设备路径。

解决方法：无。

FMA 检测到故障内存时可能会出现问题

错误号 17576087：更换故障内存后，可能无法通过关闭并重新打开系统以使用保存的配置来恢复内存。

解决方法：更换故障内存后，关闭并重新打开系统以使用 factory-default 配置。然后，对要使用的配置执行系统关开机循环。

DLMP 在来宾域中对虚拟网络设备或 SR-IOV 虚拟功能不起作用

在来宾域中，无法对 SR-IOV NIC 虚拟功能或虚拟网络设备配置 DLMP 聚合。

无法在使用 EFI GPT 磁盘标签的单分片虚拟磁盘上安装 Oracle Solaris 11.1 OS

错误号 17422973：在单分片磁盘上安装 Oracle Solaris 11.1 OS 可能会失败，而且在至少运行系统固件版本 8.4.0 的 SPARC T4 服务器上，至少运行系统固件版本 9.1.0 的 SPARC T5、SPARC M5 和 SPARC M6 服务器上或者至少运行 XCP 版本 2230 的 Fujitsu M10 服务器上会出现以下错误：

cannot label 'c1d0': try using fdisk(1M) and then provide a specific slice
Unable to build pool from specified devices: invalid vdev configuration

解决方法：重新为磁盘添加 SMI 标签。

在删除虚拟功能或 PCIe 设备后，自动保存配置没有更新

错误号 17051532：从来宾域删除 PCIe 设备或虚拟功能后，自动保存配置没有更新。此问题可能会导致设备或虚拟功能在您执行自动保存恢复后（也就是当 autorecovery_policy=3 时）重新出现在来宾域中。如果您没有执行导致自动保存进行更新的另一 ldm 命令，此问题还会导致 ldm add-spconfig -r 命令失败并出现 Autosave configuration config-name is invalid 消息。

解决方法：执行以下解决方法之一：

在删除 PCIe 设备或虚拟功能后保存新配置。
```
primary# ldm add-config new-config-name
```
在删除 PCIe 设备或虚拟功能后通过删除并重新创建配置来刷新已保存的配置。
```
primary# ldm rm-config config-name
primary# ldm add-config config-name
```
注意，此错误会阻止 ldm add-config -r config-name 命令正常工作。
发出将导致自动保存进行更新的另一 ldm 命令，例如 ldm set-vcpu、ldm bind 或 ldm unbind。

来宾域在 `lgrp_lineage_add(mutex_enter: bad mutex, lp=10351178)` 处出现紧急情况

错误号 17020950：在将活动域从 SPARC T4 平台迁移到绑定了 8.3 版固件的 SPARC T5、SPARC M5 或 SPARC M6 平台后，执行内存动态重新配置可能会导致来宾域出现紧急情况。

解决方法：在执行迁移之前，请使用 8.4 版系统固件更新 SPARC T4 系统。然后，重新绑定域。

来宾域在 `primary` 域重新引导后处于过渡状态

错误号 17020481：来宾域在 primary 域重新引导后处于过渡状态 (t)。当在系统上配置了大量的虚拟功能时会出现此问题。

解决方法：要避免此问题，请多次重试 OBP 磁盘引导命令以避免从网络引导。

在每个域上执行以下步骤：

访问域的控制台。
```
primary# telnet localhost 5000
```
设置 boot-device 属性。
```
ok> setenv boot-device disk disk disk disk disk disk disk disk disk disk net
```
您作为 boot-device 属性的值指定的 disk 条目数取决于在系统上配置的虚拟功能数目。在较小的系统上，您可能能够在该属性值中包括较少的 disk 实例。
使用 printenv 验证是否已正确设置了 boot-device 属性。
```
ok> printenv
```
返回到 primary 域控制台。
为系统上的每个域重复步骤 1-4。
重新引导 primary 域。
```
primary# shutdown -i6 -g0 -y
```

恢复模式应当支持移除非 `primary` 根域中的 PCIe 插槽

错误号 16713362：当前，在执行恢复操作期间，无法从非 primary 根域中移除 PCIe 插槽。PCIe 插槽会保持分配给非 primary 根域。

解决方法：在恢复操作完成后，必须手动从非 primary 根域中移除 PCIe 插槽并将其分配给一个或多个合适的 I/O 域。

有关如何从非 primary 根域移除 PCIe 插槽的信息，请参见Oracle VM Server for SPARC 3.2 管理指南 中的非 primary 根域概述。

对使用了由非 primary 根域拥有的 PCIe 插槽的 I/O 域进行恢复取决于 I/O 域配置：

如果 I/O 域仅使用 PCIe 插槽并且它的 PCIe 插槽都不可用，则 I/O 域不会恢复并且将保持处于未绑定状态且 PCIe 插槽被标记为已清除。
如果 I/O 域使用 SR-IOV 虚拟功能和 PCIe 插槽，则该域将恢复，并且不可用的 PCIe 插槽将被标记为已清除。

在手动从非 primary 根域移除 PCIe 插槽后，使用 ldm add-io 命令将 PCIe 插槽添加到 I/O 域。

`ldm list` 没有显示物理 I/O 设备的 `evacuated` 属性

错误号 16617981： ldm list 输出没有显示物理 I/O 设备的 evacuated 属性。

解决方法：将 –p 选项与各个 ldm list 命令一起使用以显示物理 I/O 设备的 evacuated 属性。

在压力下对来宾域使用 `ldm stop` 命令时会出现 `send_mondo_set: timeout` 紧急情况

错误号 16486383：如果您直接将 PCI 设备或总线分配给来宾域，但该域没有分配 PCI 卡实际所在的 /SYS/DCU 中的核心，则可能会出现此问题。因为虚拟机管理程序代表来宾域重置了 PCI 设备，每次来宾域重新引导期间，DCU 中的核心连接到 PCI 设备的域可能会出现紧急情况。分配给非 DCU 本地来宾域的 PCI 设备数量越多，出现这种紧急情况的几率越高。

解决方法：执行以下解决方法之一：

确保在将 PCI 设备分配给来宾域时该卡位于与核心相同的物理 DCU 中。
手动分配核心，以便可以灵活地放置物理卡。

例如，对于 IOU0 上的 PCI 设备（pci_0 到 pci_15），选择一个介于 0 和 127 之间的核心并将其分配给域。
```
# ldm add-core cid=16 domain-name
```
可以使用以下命令查看系统核心：
```
# ldm ls-devices -a core
```
对于 IOU1 上的 PCI 设备（pci_16 到 pci_31），选择一个介于 128 和 255 之间的核心。对于 IOU2 上的 PCI 设备（pci_32 到 pci_47），选择一个介于 256 和 383 之间的核心。对于 IOU3 上的 PCI 设备（pci_48 到 pci_63），选择一个介于 384 和 511 之间的核心。

PCIe 设备下的子设备恢复成未分配的名称

错误号 16299053：禁用 PCIe 设备后，可能会出现意外行为。虽然已禁用的 PCIe 设备仍然归域所有，但该 PCIe 设备下的子设备将恢复为未分配的名称。

解决方法：如果要在 ILOM 中禁用 PCIe 插槽，请确保未通过直接 I/O (Direct I/O, DIO) 功能将该 PCIe 插槽分配给某个域。即，在 ILOM 中禁用 PCIe 插槽之前，先要确保已将该插槽分配给相应的根域。

如果在 ILOM 中禁用 PCIe 插槽时已使用 DIO 将该 PCIe 插槽分配给某个域，请停止该域并将该设备重新分配给根域，以便保证系统行为正常。

在附加 I/O 设备驱动程序时，`WARNING: ddi_intr_alloc: cannot fit into interrupt pool` 指出中断供应已耗尽

错误号 16284767：在附加 I/O 设备驱动程序时，Oracle Solaris 控制台指出中断供应已耗尽：

WARNING: ddi_intr_alloc: cannot fit into interrupt pool

硬件提供了有限数目的中断，因此，Oracle Solaris 会限制每个设备可以使用多少次中断。默认限制设计为与典型系统配置的需求相匹配，不过，对于某些系统配置，可能需要调整此限制。

特别是以下情况下可能需要调整此限制：当系统划分为多个逻辑域并且当向任意来宾域分配了太多的 I/O 设备时。Oracle VM Server for SPARC 会将总的中断划分为分配给各个来宾域的较小中断集。如果向某个来宾域分配了太多的 I/O 设备，则系统的供应可能太少以致于无法向每个设备分配默认的中断限制。因此，它在完全附加所有驱动程序之前会耗尽其供应。

某些驱动程序提供了一个可选的回调例程，该例程允许 Oracle Solaris 自动调整其中断。默认限制不适用于这些驱动程序。

解决方法：使用 ::irmpools 和 ::irmreqs MDB 宏来确定如何使用中断。::irmpools 宏显示划分为池的总体中断供应。::irmreqs 宏显示哪些设备映射到每个池。对于每个设备，::irmreqs 显示是否由一个可选的回调例程强制执行默认限制、每个驱动程序请求了多少中断，以及为驱动程序分配了多少中断。

这些宏不显示有关无法附加的驱动程序的信息。不过，所显示的信息有助于计算您可以将默认限制调整到的范围。对于使用了多个中断且没有提供回调例程的任何设备，都可以通过调整默认限制来强制其使用较少的中断。将默认限制降低到这样的设备使用的数量以下可以释放一些中断供其他设备使用。

要调整默认限制，请在 /etc/system 文件中将 ddi_msix_alloc_limit 属性设置为从 1 到 8 的某个值。然后，重新引导系统以使更改生效。

为了最大限度地提高性能，请先分配较大的值，然后以较小的增量减小该值，直至系统成功引导且不出现任何警告。可使用 ::irmpools 和 ::irmreqs 宏来度量调整对所附加的所有驱动程序的影响。

例如，假设在引导来宾域中的 Oracle Solaris OS 时发出了以下警告：

WARNING: emlxs3: interrupt pool too full.
WARNING: ddi_intr_alloc: cannot fit into interrupt pool

::irmpools 和 ::irmreqs 宏显示以下信息：

# echo "::irmpools" | mdb -k
ADDR             OWNER   TYPE   SIZE  REQUESTED  RESERVED
00000400016be970 px#0    MSI/X  36    36         36

# echo "00000400016be970::irmreqs" | mdb -k
ADDR             OWNER   TYPE   CALLBACK NINTRS NREQ NAVAIL
00001000143acaa8 emlxs#0 MSI-X  No       32     8    8
00001000170199f8 emlxs#1 MSI-X  No       32     8    8
000010001400ca28 emlxs#2 MSI-X  No       32     8    8
0000100016151328 igb#3   MSI-X  No       10     3    3
0000100019549d30 igb#2   MSI-X  No       10     3    3
0000040000e0f878 igb#1   MSI-X  No       10     3    3
000010001955a5c8 igb#0   MSI-X  No       10     3    3

在此示例中，默认限制是每个设备八个中断，此中断限制不足以支持将最后的 emlxs3 设备附加到系统。假设所有 emlxs 实例的行为方式相同，则 emlxs3 可能请求了 8 个中断。

从总的池大小 36 个中断中减去由所有 igb 设备使用的 12 个中断，还剩下 24 个中断可供 emlxs 设备使用。将 24 个中断除以 4，这表明每个设备 6 个中断将能够使所有 emlxs 设备都可以附加，且具有相同的性能。因此，在 /etc/system 文件中添加以下调整：

set ddi_msix_alloc_limit = 6

当系统成功引导且未出现任何警告时，::irmpools 和 ::irmreqs 宏会显示以下更新的消息：

# echo "::irmpools" | mdb -k
ADDR             OWNER   TYPE   SIZE  REQUESTED  RESERVED
00000400018ca868 px#0    MSI/X  36    36         36
 
# echo "00000400018ca868::irmreqs" | mdb -k
ADDR             OWNER   TYPE   CALLBACK NINTRS NREQ NAVAIL
0000100016143218 emlxs#0 MSI-X  No       32     8    6
0000100014269920 emlxs#1 MSI-X  No       32     8    6
000010001540be30 emlxs#2 MSI-X  No       32     8    6
00001000140cbe10 emlxs#3 MSI-X  No       32     8    6
00001000141210c0 igb#3   MSI-X  No       10     3    3
0000100017549d38 igb#2   MSI-X  No       10     3    3
0000040001ceac40 igb#1   MSI-X  No       10     3    3
000010001acc3480 igb#0   MSI-X  No       10     3    3

SPARC M5-32 和 SPARC M6-32：可通过多个直接 I/O 路径访问的磁盘会出现问题

错误号 16232834：当使用 ldm add-vcpu 命令将 CPU 分配给域时，Oracle Solaris OS 可能会出现紧急情况，并显示以下消息：

panic[cpu16]/thread=c4012102c860: mpo_cpu_add: Cannot read MD

如果存在以下情况，会出现此紧急情况：

为主机分配了额外的 DCU
主机是使用之前保存的 SP 配置启动的，该配置中未包含分配给该主机的所有硬件

ldm add-vcpu 操作的目标域将会出现紧急情况。如果该域有额外的 CPU，则重新引导时将会恢复。

解决方法：生成配置时包含的硬件资源不要比分配给主机的资源少。

要避免该问题，请勿按问题描述中所述方式添加 CPU。或者，执行以下步骤：

在添加 DCU 之后生成新的 SP 配置。

例如，以下命令会创建名为 new-config-more-dcus 的配置：
```
primary# ldm add-config new-config-more-dcus
```
关闭域。
停止主机。
```
-> stop /HOST
```
启动主机。
```
-> start /HOST
```

重新引导 `primary` 域后，SR-IOV 域中的 `ixgbevf` 设备可能会变为禁用状态

错误号 16224353：重新引导 primary 域后，primary 域中的 ixgbevf 实例可能无法运行。

解决方法：无。

重新引导 Oracle Solaris 10 1/13 `primary` 域可能不会自动为虚拟功能接口激活或分配 IP 地址

错误号 16219069：在运行 Oracle Solaris 10 1/13 OS 的 primary 域上，可能不会基于 /etc/hostname.vf-interface 文件自动为虚拟功能接口激活或分配 IP 地址。

在 primary 域中引导或重新引导运行 Oracle Solaris 10 1/13 OS 的 SPARC T3、SPARC T4 或 SPARC T5 系统时，会出现此问题。此问题会影响在板载物理功能和插件物理功能上创建的虚拟功能。引导 Logical Domains 来宾域映像时，不会出现此问题。

仅限 Oracle Solaris 10：在重新引导或关闭期间，`mutex_enter: bad mutex` 在 `primary` 域中出现紧急情况

错误号 16080855：在重新引导或关闭 primary 域时，primary 域可能会出现内核紧急情况，并显示类似于以下的紧急情况消息：

panic[cpu2]/thread=c40043b818a0: mutex_enter: bad mutex, lp=c4005fa01c88
owner=c4005f70aa80 thread=c40043b818a0

000002a1075c3630 ldc:ldc_mem_rdwr_cookie+20 (c4005fa01c80,
c4004e2c2000,2a1075c37c8, 6c80000, 1, 0)
%l0-3: 00000000001356a4 0000000000136800 0000000000000380
00000000000002ff
%l4-7: 00000000001ad3f8 0000000000000004 00000000ffbffb9c
0000c4005fa01c88
000002a1075c3710 vldc:i_vldc_ioctl_write_cookie+a4 (c4004c400030,
380,ffbff898, 100003, 0, 70233400)
%l0-3: 0000000006c80000 0000000000156dc8 0000000000000380
0000000000100003
%l4-7: 00000000702337b0 000002a1075c37c8 0000000000040000
0000000000000000
000002a1075c37f0 vldc:vldc_ioctl+1a4 (3101, c4004c400030,
ffbff898,c4004c400000, c4004c438030, 0)
%l0-3: 0000000000100003 0000000000000000 000000007b340400
0000c4004c438030
%l4-7: 0000c4004c400030 0000000000000000 0000000000000000
0000000000000000
000002a1075c38a0 genunix:fop_ioctl+d0 (c4004d327800, 0, ffbff898,
100003,c4004384f718, 2a1075c3acc)
%l0-3: 0000000000003103 0000000000100003 000000000133ce94
0000c4002352a480
%l4-7: 0000000000000000 0000000000000002 00000000000000c0
0000000000000000
000002a1075c3970 genunix:ioctl+16c (3, 3103, ffbff898, 3, 134d50, 0)
%l0-3: 0000c40040e00a50 000000000000c6d3 0000000000000003
0000030000002000
%l4-7: 0000000000000003 0000000000000004 0000000000000000
0000000000000000

恢复：允许 primary 域重新引导。如果已将 primary 域配置为在崩溃后不重新引导，请手动引导 primary 域。

SPARC M5-32 和 SPARC M6-32：LSI-SAS 控制器不正确地导出为支持 SR-IOV

错误号 16071170：在 SPARC M5-32 或 SPARC M6-32 系统上，内部 SAS 控制器被导出为支持 SR-IOV 的控制器，尽管这些卡不支持 SR-IOV。

当尝试在这些卡上创建物理功能时，Oracle VM Server for SPARC 日志将显示以下消息：

Dec 11 04:27:54 warning: Dropping pf
pci@d00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@d80/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@c00/pci@1/pci@0/pci@c/pci@0/pci@4/LSI,sas@0: no IOV capable driver
Dec 11 04:27:54 warning: Dropping pf
pci@e00/pci@1/pci@0/pci@0/pci@0/pci@4/LSI,sas@0: no IOV capable driver

该系统有四个 LSI SAS 控制器端口，每个位于 SPARC M5-32 和 SPARC M6-32 组合件的一个 IOU 中。每个端口都会报告一次此错误。

解决方法：可以忽略这些消息。这些消息只说明系统上的 LSI-SAS 控制器设备可以支持 SR-IOV，但此硬件不提供 SR-IOV 支持。

SPARC T5-8：对于某些 `ldm` 列表命令，运行时间数据显示了值 0

错误号 16068376：在具有大约 128 个域的 T5-8 上，诸如 ldm list 之类的 ldm 命令会将所有域的运行时间显示为 0 秒。

解决方法：登录到域并使用 uptime 命令来确定域的运行时间。

`ldm` 无法从来宾域清除出现故障的核心

错误号 15962837：当发生芯片级故障时，核心清除无法完成。在发生核心故障后执行的清除能够按预期方式工作，但是当尝试撤消整个 CMP 节点时，针对芯片级故障的核心清除无法完成。

解决方法：无。在对芯片级故障进行诊断时，请制定芯片更换计划。

Oracle Solaris 10：将内存减少至低于 4 GB 时内存 DR 操作会挂起

错误号 15942036：如果执行内存 DR 操作将内存减少至低于四 GB，操作可能会永远挂起。如果对该域发出 ldm cancel-op memdr 命令，会发出错误的消息：

The memory removal operation has completed. You cannot cancel this operation.

尽管出现该消息，内存 DR 操作仍会挂起，您可能无法对该来宾域执行其他 ldmd 操作。

解决方法：不要尝试在任何域中将内存减少至低于四 GB。如果已经处于此状态，请发出 ldm stop -f 命令，或登录到该域然后重新引导。

大量虚拟 CPU 的 CPU DR 操作可能会显示为失败

错误号 15826354：非常大数量 CPU 的 CPU 动态重新配置 (dynamic reconfiguration, DR) 导致 ldmd 守护进程返回一个错误。虽然 ldmd 超时了，但 DR 操作仍在后台继续执行，并终将成功。不过，ldmd 不再与生成的域保持同步，后续的 DR 操作可能不被允许。

例如：

# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      2.7%  0.4%  1h 41m
ldg0             active     -n----  5000    761   16G       75%   51%  6m

# ldm rm-vcpu 760 ldg0
Request to remove cpu(s) sent, but no valid response received
VCPU(s) will remain allocated to the domain, but might
not be available to the guest OS
Resource removal failed
 
# ldm set-vcpu 1 ldg0
Busy executing earlier command; please try again later.
Unable to remove the requested VCPUs from domain ldg0
Resource modification failed
 
# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      0.9%  0.1%  1h 45m
ldg0             active     -n----  5000    761   16G      100%  0.0%  10m

解决方法：等待几分钟后再次运行 ldm set-vcpu 命令：

# ldm set-vcpu 1 ldg0
# ldm ls
NAME             STATE      FLAGS   CONS    VCPU  MEMORY   UTIL  NORM  UPTIME
primary          active     -n-cv-  UART    7     20G      0.9%  0.1%  1h 50m
ldg0             active     -n----  5000    1     16G       52%  0.0%  15m

请注意，760 超出了建议的最大值。

SPARC T4-4：无法绑定来宾域

错误号 15825330： 在某些仅具有单个处理器板的 SPARC T4-4 配置上，Oracle VM Server for SPARC 在启动时似乎处于挂起状态。

解决方法：确保处理器板始终占用处理器 0 和 1 的插槽。在此类配置中重新启动系统可使 Oracle VM Server for SPARC 软件启动。

将 `threading` 属性值从 `max-throughput` 更改为 `max-ipc` 时来宾域出现紧急情况

错误号 15821246：在运行 Oracle Solaris 11.1 OS 的系统上，将已迁移域上的 threading 属性值从 max-ipc 更改为 max-throughput 会导致该来宾域上出现紧急情况。

解决方法：不要更改已迁移来宾域的 threading 状态，直到重新引导该域。

在具有两个活动直接 I/O 域的情况下控制域在重新引导时挂起

错误号 15820741：在具有两个使用直接 I/O 配置的域的 Oracle Solaris 11.1 系统上，重新引导控制域时该域可能会挂起。

恢复：要从重新引导挂起恢复，通过在 SP 上发出以下命令来重置控制域：

-> reset -f /HOST/domain/control

内存 DR 添加部分成功时不显示错误消息

错误号 15812823：在可用内存较少的情况下，由于内存大小的原因并非所有内存块都可以用作内存 DR 操作的一部分。但是，这些内存块都包括在可用内存量中。这种情况可能会导致向域中添加的内存量小于所预期的。如果发生这种情况，不显示任何错误消息。

解决方法：无。

从 XML 文件重新创建具有 PCIe 虚拟功能的域失败

错误号 15783851：尝试从错误地表示虚拟功能约束的 XML 文件重新创建配置时，可能会遇到问题。

使用 ldm list-constraints -x 命令保存具有 PCIe 虚拟功能的域的配置时，会发生此问题。

如果稍后使用 ldm add-domain -i 命令重新创建该域，原始虚拟功能将不复存在并且域绑定尝试将失败，同时显示以下错误消息：

No free matching PCIe device...

即使创建缺少的虚拟功能，另一个域绑定尝试也会失败，同时显示相同的错误消息，因为这些虚拟功能被 ldm add-domain 命令错误地分类为 PCIe 设备。

解决方法：执行以下步骤：

使用 ldm list-io 命令保存有关虚拟功能的信息。
使用 ldm rm-dom 命令销毁受影响的域。
使用 ldm create-vf 命令创建所有必需的虚拟功能。
使用 ldm 命令重新构建域。

使用 ldm add-io 命令添加每个虚拟功能时，会将其正确地分类为虚拟功能设备，从而可以绑定域。

有关重新构建使用虚拟功能的域的信息，请参见ldm init-system 命令可能无法正确恢复已执行了物理 I/O 更改的域配置。

将控制域从使用整体核心更改为使用部分核心时发出不正确的错误消息

错误号 15783608：将控制域从使用物理上受约束的核心更改为使用不受约束的 CPU 资源时，可能会显示以下多余消息：

Whole-core partitioning has been removed from domain primary,because
dynamic reconfiguration has failed and the domain is now configured
with a partial CPU core.

解决方法：可以忽略此消息。

`ldm init-system` 命令可能无法正确恢复已执行了物理 I/O 更改的域配置

错误号 15783031：当使用 ldm init-system 命令恢复已使用了直接 I/O 或 SR-IOV 操作的域时，可能会遇到问题。

如果已对要恢复的配置执行了下列一个或多个操作，则会出现问题：

从总线中移除了仍归 primary 域拥有的一个插槽。
基于 primary 域拥有的物理功能创建了虚拟功能。
向 primary 域或其他来宾域（或两者）分配了虚拟功能。
从 primary 域中删除了一个根联合体并将其分配给了来宾域，并且该根联合体用作进一步 I/O 虚拟化操作的基础。

换句话说，您创建了非 primary 根域并执行了任何上述操作。

要确保系统保持在未发生上述任何操作的状态下，请参见 Using the ldm init-system Command to Restore Domains on Which Physical I/O Changes Have Been Made（使用 ldm init-system 命令恢复已执行了物理 I/O 更改的域）。

您尝试同时修改许多域时 Logical Domains Manager 可能会崩溃并重新启动

错误号 15782994：您尝试可以影响许多域的配置的操作时，Logical Domains Manager 可能会崩溃并重新启动。如果同一虚拟交换机中的许多虚拟网络设备在许多域中存在，则您尝试更改与虚拟网络配置相关的任何设置时，可能会出现此问题。通常，如果大约 90 个或更多的域具有连接到同一虚拟交换机的虚拟网络设备并且 inter-vnet-link 属性处于启用状态（默认行为），则会出现此问题。通过在 ldmd 日志文件中查找以下消息以及在 /var/opt/SUNWldm 目录中查找 core 文件来确认症状：

Frag alloc for 'domain-name'/MD memory of size 0x80000 failed

解决方法：避免创建连接到同一虚拟交换机的许多虚拟网络设备。如果打算这样做，请在虚拟交换机上将 inter-vnet-link 属性设置为 off。请注意，此选项可能会对来宾域之间的网络性能产生负面影响。

控制域需要系统中的最低核心

错误号 15778392：控制域需要系统中的最低核心。因此，如果核心 ID 0 是最低核心，则在您希望对控制域应用整体核心约束时，该核心无法与任何其他域共享。

例如，如果系统中的最低核心为核心 ID 0，控制域应该与以下输出类似：

# ldm ls -o cpu primary
NAME
primary

VCPU
VID    PID    CID    UTIL STRAND
0      0      0      0.4%   100%
1      1      0      0.2%   100%
2      2      0      0.1%   100%
3      3      0      0.2%   100%
4      4      0      0.3%   100%
5      5      0      0.2%   100%
6      6      0      0.1%   100%
7      7      0      0.1%   100%

Oracle Solaris 11：DRM 窃取操作报告 Oracle Solaris DR 失败并重试

错误号 15775668：具有较高优先级策略的域可以从具有较低优先级策略的域窃取虚拟 CPU 资源。在此“窃取”操作执行过程中，在 ldmd 日志中可能会每隔 10 秒显示一次以下警告消息：

warning: Unable to unconfigure CPUs out of guest domain-name

解决方法：可以忽略这些误导消息。

限制可以分配给域的最大虚拟功能数

错误号 15775637：I/O 域限制每个根联合体的可用中断资源数。

在 SPARC T3 和 SPARC T4 系统上，该限制大约为 63 个 MSI/X 向量。每个 igb 虚拟功能使用三个中断。ixgbe 虚拟功能使用两个中断。

如果向域分配大量虚拟功能，该域将耗尽系统资源来支持这些设备。可能会显示类似如下的消息：

WARNING: ixgbevf32: interrupt pool too full.
WARNING: ddi_intr_alloc: cannot fit into interrupt pool

尝试连接到绑定中的来宾域可能导致输入被阻止

错误号 15771384：如果在绑定控制台期间或之前重复尝试连接到控制台，则域的来宾控制台可能会冻结。例如，如果您在正在向计算机迁移某个域时使用自动化脚本来抓取控制台，则可能会发生此情况。

解决方法：要解除冻结控制台，请在承载着该域的控制台集中器的域上（通常为控制域）执行以下命令：

primary# svcadm disable vntsd
primary# svcadm enable vntsd

销毁所有虚拟功能并将插槽返回到根域无法恢复根联合体资源

错误号 15765858：销毁所有虚拟功能并将插槽返回到根域后，根联合体上的资源未恢复。

解决方法：将特定 PCIe 总线的 iov 选项设置为 off。

primary# ldm start-reconf primary
primary# ldm set-io iov=off pci_0

应该对具有 PCIe 到 PCI 桥的 PCIe 卡禁用 `ldm remove-io`

错误号 15761509：只使用支持直接 I/O (Direct I/O, DIO) 功能的 PCIe 卡，在此支持文档中列出了这类卡。

解决方法：使用 ldm add-io 命令重新向 primary 域添加卡。

如果在 `ldm start` 命令后立即发出 `ldm stop` 命令，后者可能会失败

错误号 15759601：如果在 ldm start 命令后立即发出 ldm stop 命令，ldm stop 命令可能会失败，并显示以下错误：

LDom domain-name stop notification failed

解决方法：重新发出 ldm stop 命令。

`init-system` 无法从保存的 XML 文件为来宾域恢复指定的核心约束

错误号 15758883：ldm init-system 命令无法从保存的 XML 文件为来宾域恢复指定的 CPU 核心约束。

解决方法：执行以下步骤：

为主域创建 XML 文件。

# ldm ls-constraints -x primary > primary.xml

为来宾域创建 XML 文件。

# ldm ls-constraints -x domain-name[,domain-name][,...] > guest.xml

对系统执行关开机循环并以工厂默认配置进行引导。
向 primary 域应用 XML 配置。
```
# ldm init-system -r -i primary.xml
```
向来宾域应用 XML 配置。
```
# ldm init-system -f -i guest.xml
```

重新引导分配了大量虚拟功能的 `primary` 域时系统出现紧急情况

错误号 15750727：重新引导分配有大量虚拟功能的 primary 域时，系统可能会出现紧急情况。

解决方法：执行以下解决方法之一：

减少虚拟功能数以减少失败的虚拟功能数。此更改可能会保持芯片处于响应状态。
为 ixgbe 虚拟功能创建多个中断资源管理 (Interrupt Resource Management, IRM) 池，因为默认情况下，只会为系统上的所有 ixgbe 虚拟功能创建一个 IRM 池。

使用部分核心的 `primary` 域无法进行整体核心 DR 转换

错误号 15748348：primary 域与其他域共享最低物理核心（通常为 0）时，尝试为 primary 域设置整体核心约束失败。

解决方法：执行以下步骤：

确定域共享的最低绑定核心。
```
# ldm list -o cpu
```
从除 primary 域之外的所有域解除绑定最低核心的所有 CPU 线程。

因此，最低核心的 CPU 线程不再共享，可以绑定到 primary 域。
通过执行以下操作之一设置整体核心约束：
- 通过使用 ldm set-vcpu -c 命令将 CPU 线程绑定到 primary 域并设置整体核心约束。
- 使用 ldm set-core 命令在一个步骤中绑定 CPU 线程并设置整体核心约束。

引导后，`ldm list-io` 命令显示 UNK 或 INV 状态

错误号 15738561：如果在引导 primary 域后立即运行 ldm list-io 命令，该命令可能会对 PCIe 插槽和 SR-IOV 虚拟功能显示 UNK 或 INV 状态。Oracle Solaris OS 中 Logical Domains 代理回复延迟会导致此问题。

只在少数几个系统上报告了此问题。

解决方法：从 Logical Domains 代理收到信息后，自动更新 PCIe 插槽和虚拟功能的状态。

从来宾域中删除大量 CPU 可能会失败

以下错误描述在从域中删除大量 CPU 时可能发生的故障。

控制域。

错误号 15677358：使用延迟重新配置（而不是动态重新配置）从控制域（也称为 primary 域）中删除超过 100 个 CPU。执行以下步骤：
1. 使用 ldm start-reconf primary 命令将控制域置于延迟重新配置模式下。
2. 删除所需数量的 CPU 资源。
  
  如果删除 CPU 资源时出错，在控制域仍处于延迟重新配置状态时，不要尝试其他删除 CPU 的请求。如果尝试，命令将失败（请参见Oracle VM Server for SPARC 3.2 管理指南 中的在延迟重新配置期间，仅允许执行一个 CPU 配置操作）。相反，通过使用 ldm cancel-reconf 命令撤消延迟重新配置，然后重新启动。
3. 重新引导控制域。

来宾域。

错误号 15726205：尝试从来宾域中删除大量 CPU 时会显示以下错误消息：

Request to remove cpu(s) sent, but no valid response received
VCPU(s) will remain allocated to the domain, but might
not be available to the guest OS
Resource modification failed

解决方法：从域中删除 100 个以上 CPU 之前停止来宾域。

无法使用 Oracle Solaris 热插拔操作来热删除 PCIe 端点设备

错误号 15721872：在使用 ldm rm-io 命令从 primary 域中删除某个 PCIe 端点设备之后，您无法通过 Oracle Solaris 热插拔操作“热删除”该设备。有关替换或删除 PCIe 端点设备的信息，请参见Oracle VM Server for SPARC 3.2 管理指南 中的更改 PCIe 硬件。

如果系统日志服务不联机，Logical Domains 代理服务就无法联机

错误号 15707426：如果系统日志服务 svc:/system/system-log 启动失败且未能联机，则 Logical Domains 代理服务将不会联机。Logical Domains 代理服务没有联机时，virtinfo、ldm add-vsw、ldm add-vdsdev 和 ldm list-io 命令可能无法按预期工作。

解决方法：确保 svc:/ldoms/agents:default 服务已启用且已联机：

# svcs -l svc:/ldoms/agents:default

如果 svc:/ldoms/agents:default 服务处于脱机状态，请验证该服务是否已启用，并且所有相关服务是否处于联机状态。

DRM 和 `ldm list` 输出显示的虚拟 CPU 数与来宾域中的实际虚拟 CPU 数不符

错误号 15702475：如果已装入域的 DRM 策略在 CPU 计数大幅减少后过期，Oracle VM Server for SPARC 日志中可能会出现 No response 消息。ldm list 输出中显示的分配给域的 CPU 资源多于 psrinfo 输出中显示的数量。

解决方法：使用 ldm set-vcpu 命令将域中的 CPU 数重置为 psrinfo 输出中显示的值。

DR 过程中虚拟 CPU 超时失败

错误号 15701258：对包含超过 100 个虚拟 CPU 和一些加密单元的来宾域运行 ldm set-vcpu 1 命令无法删除虚拟 CPU。未能删除虚拟 CPU 是由于 DR 超时错误。加密单元可以成功删除。

解决方法：使用 ldm rm-vcpu 命令从来宾域中删除除一个虚拟 CPU 之外的所有虚拟 CPU。一次删除的虚拟 CPU 数不要超过 100 个。

`pkgadd` 无法在 `/var/svc/manifest/platform/sun4v/ldmd.xml` 上设置 ACL 项

错误号 15668881：使用 pkgadd 命令从某个目录（该目录通过 NFS 从 Sun ZFS 存储设备导出）安装 SUNWldm.v 软件包时，会显示以下错误消息：

cp: failed to set acl entries on /var/svc/manifest/platform/sun4v/ldmd.xml

解决方法：忽略此消息。

SPARC T3-1：可通过多个直接 I/O 路径访问的磁盘会出现问题

错误号 15668368：可以在 SPARC T3-1 系统上安装双端口磁盘，这些磁盘可通过两个不同的直接 I/O 设备访问。在这种情况下，如果将这两个直接 I/O 设备分配给不同的域，可能会导致这些磁盘供这两个域使用并在实际使用当中相互影响。

解决方法：不将能够访问同一组磁盘的直接 I/O 设备指定给不同的 I/O 域。要确定 SPARC T3-1 系统上是否有双端口磁盘，请对 SP 运行以下命令：

-> show /SYS/SASBP

如果输出中包含以下 fru_description 值，则说明相应的系统上有双端口磁盘：

fru_description = BD,SAS2,16DSK,LOUISE

如果发现系统中存在双端口磁盘，请确保始终将下面的两个直接 I/O 设备分配给同一个域：

pci@400/pci@1/pci@0/pci@4  /SYS/MB/SASHBA0
pci@400/pci@2/pci@0/pci@4  /SYS/MB/SASHBA1

运行 Oracle Solaris 10 的来宾域：对多个已激活的 NIU `nxge` 实例执行内存 DR 删除操作可能会无限期挂起而且永远无法完成

错误号 15667770：当在域上激活多个 NIU nxge 实例时，用来从域中删除内存的 ldm rm-mem 和 ldm set-mem 命令可能永远无法完成。要确定在执行内存删除操作期间是否出现此问题，请使用 ldm list -o status 命令监视内存删除操作的进度。如果进度百分比在几分钟内一直保持恒定，则说明您可能遇到了此问题。

解决方法：取消 ldm rm-mem 或 ldm set-mem 命令，并检查是否删除了足够多的内存。如果没有，则随后发出的用来删除较少量内存的内存删除命令可能会成功完成。

如果在 primary 域上出现此问题，请执行以下操作：

在 primary 域上启动延迟重新配置操作。
```
# ldm start-reconf primary
```
为该域指定所需的内存量。
重新引导 primary 域。

如果此问题出现在另一个域上，请先停止这个有问题的域，然后再调整为该域指定的内存量。

对具有主-从关系的域使用 `ldm stop -a` 命令会在从域中设置 `stopping` 标志

错误号 15664666：在创建了重置依赖关系之后，ldm stop -a 命令可能会导致具有重置依赖关系的域重新启动（而不只是停止）。

解决方法：首先向主域发出 ldm stop 命令，然后向从域发出 ldm stop 命令。如果最初停止从域时导致故障，请向从域发出 ldm stop -f 命令。

某个正在使用中的 MAC 地址可以被重新分配

错误号 15655199：有时检测不到正在使用中的 MAC 地址，这些地址被错误地重新分配。

解决方法：手动确保正在使用中的 MAC 地址不被重新分配。

`ldmconfig` 无法在 SP 上创建域配置

错误号 15654965：ldmconfig 脚本无法在服务处理器 (service processor, SP) 上正确创建存储逻辑域配置。

解决方法：在 ldmconfig 脚本完成且域重新引导后，不要对系统执行关开机循环。而应该执行以下手动步骤：

将配置添加到 SP。
```
# ldm add-spconfig new-config-name
```
从 SP 中删除 primary-with-clients 配置。
```
# ldm rm-spconfig primary-with-clients
```
关闭系统电源，然后再打开系统电源。

如果在系统关开机循环之前未执行这些步骤，primary-with-client 配置的存在将导致域变为不活动。在这种情况下，必须手动绑定每个域，然后通过运行 ldm start -a 命令启动它们。引导来宾域后，重复此序列会使来宾域在关开机循环后自动引导。

有时，对虚拟网络设备的 MTU 值执行动态重新配置会失败

错误号 15631119：如果您修改控制域上虚拟网络设备的最大传输单元 (Maximum Transmission Unit, MTU)，则会触发延迟重新配置操作。如果后来取消了延迟重新配置，则该设备的 MTU 值不会恢复到其初始值。

恢复：重新运行 ldm set-vnet 命令以将 MTU 设置为其初始值。重置 MTU 值会将控制域置于延迟重新配置模式，而该模式需要取消。所得到的 MTU 值现在是最初的正确 MTU 值。

# ldm set-vnet mtu=orig-value vnet1 primary
# ldm cancel-op reconf primary

从域中动态删除所有的加密单元导致 SSH 终止

错误号 15600969：如果从正在运行的域中动态删除所有的硬件加密单元，加密框架将无法无缝地切换到软件加密提供程序，而且会中止所有 ssh 连接。

恢复：在从域中删除所有的加密单元之后，重新建立 ssh 连接。

解决方法：在服务器端上的 /etc/ssh/sshd_config 文件中设置 UseOpenSSLEngine=no，然后运行 svcadm restart ssh 命令。

所有 ssh 连接将不再使用硬件加密单元（因此也无法获得相关的性能提升），ssh 连接不会在删除加密单元后断开。

PCI Express Dual 10-Gigabit Ethernet Fiber 卡在 `ldm list-io -l` 输出中显示四个子设备

错误号 15597025：在装有 PCI Express Dual 10-Gigabit Ethernet Fiber 卡 (X1027A-Z) 的系统上运行 ldm ls-io -l 命令时，输出中可能会显示如下内容：

primary# ldm ls-io -l
...
pci@500/pci@0/pci@c PCIE5 OCC primary
network@0
network@0,1
ethernet
ethernet

即使该以太网卡只有两个端口，输出中也会显示四个子设备。出现这种异常的原因在于该卡有四个 PCI 功能。其中的两个功能在内部禁用，在 ldm ls-io -l 输出中显示为 ethernet。

解决方法：可以忽略 ldm ls-io -l 输出中的 ethernet 条目。

当多个域正在引导时，`ldm` 命令很慢，无法响应

错误号 15572184：当多个域正在引导时，ldm 命令可能很慢，无法响应。如果在该阶段发出 ldm 命令，该命令可能看起来处于挂起状态。请注意，在执行预期的任务之后，ldm 命令将返回。在该命令返回之后，系统应当能够正常响应 ldm 命令。

解决方法：避免同时引导许多域。但是，如果您必须同时引导多个域，请避免在系统恢复到正常状态之前进一步发出 ldm 命令。例如，在 Sun SPARC Enterprise T5140 和 T5240 服务器上等待两分钟左右，在 Sun SPARC Enterprise T5440 服务器或 Sun Netra T5440 服务器上等待四分钟左右。

Oracle Solaris 11：配置有自动网络接口的区域可能无法启动

错误号 15560811：在 Oracle Solaris 11 中，配置有自动网络接口 (anet) 的区域在仅具有 Logical Domains 虚拟网络设备的域中可能无法启动。

解决方法 1：向来宾域分配一个或多个物理网络设备。使用 PCIe 总线分配、直接 I/O (Direct I/O, DIO) 或 SR-IOV 功能向该域分配物理 NIC。
解决方法 2：如果区域配置要求是仅在域内具有区域间通信，请创建 etherstub 设备。使用 etherstub 设备作为区域配置中的“较低链路”，以便在该 etherstub 设备上创建该虚拟 NIC。
解决方法 3：使用独占链路分配向区域分配 Logical Domains 虚拟网络设备。根据需要向域分配虚拟网络设备。您还可以选择禁用 Inter-Vnet 链路，以便能够创建大量虚拟网络设备。

Oracle Solaris 10：未在控制域中正确创建虚拟网络设备

错误号 15560201：有时，当您在域中添加虚拟网络或虚拟磁盘设备之后，ifconfig 指示该设备不存在。这种情况可能是由于未创建 /devices 条目而导致的。

尽管在正常操作期间不应发生此问题，但有时，当虚拟网络设备的实例编号与 /etc/path_to_inst 文件中列出的实例编号不匹配时会发生此错误。

例如：

# ifconfig vnet0 plumb
ifconfig: plumb: vnet0: no such interface

虚拟设备的实例编号显示在 ldm list 输出的 DEVICE 列下面：

# ldm list -o network primary
NAME             
primary          

MAC
 00:14:4f:86:6a:64

VSW
 NAME         MAC               NET-DEV DEVICE   DEFAULT-VLAN-ID PVID VID MTU  MODE  
 primary-vsw0 00:14:4f:f9:86:f3 nxge0   switch@0 1               1        1500        

NETWORK
 NAME   SERVICE              DEVICE    MAC               MODE PVID VID MTU  
 vnet1  primary-vsw0@primary network@0 00:14:4f:f8:76:6d      1        1500

可以将该实例编号（对于前面显示的 vnet 和 vsw 均为 0）与 path_to_inst 文件中的实例编号进行比较以确保它们匹配。

# egrep '(vnet|vsw)' /etc/path_to_inst
"/virtual-devices@100/channel-devices@200/virtual-network-switch@0" 0 "vsw"
"/virtual-devices@100/channel-devices@200/network@0" 0 "vnet"

解决方法：如果实例编号不匹配，请删除虚拟网络或虚拟交换机设备，然后通过显式指定所需的实例编号（方法是设置 id 属性）来再次添加这些设备。

还可以手动编辑 /etc/path_to_inst 文件。请参见 path_to_inst(4) 手册页。

注意 - 未经仔细考虑不应对 /etc/path_to_inst 进行更改。

如果配置了 Logical Domains，则新添加的 NIU/XAUI 适配器在主机操作系统中不可见

错误号 15555509：如果在系统上配置了 Logical Domains 的情况下添加了另外一个 XAUI 网卡，则对该计算机执行关开机循环之后，该卡将不可见。

恢复：要使新添加的 XAUI 在控制域中可见，请执行以下步骤：

设置和清除控制域中的伪变量。

以下命令使用一个名为 fix-xaui 的伪变量：
```
# ldm set-var fix-xaui=yes primary
# ldm rm-var fix-xaui primary
```
将修改后的配置保存到 SP，替换当前的配置。

以下命令使用 config1 作为配置名称：
```
# ldm rm-spconfig config1
# ldm add-spconfig config1
```
在对控制域执行重新配置后重新引导。
```
# reboot -- -r
```
此时，可以配置新提供的网络，使其可供 Logical Domains 使用。

从 `e1000g` 引导时，I/O 域或来宾域出现紧急情况

错误号 15543982：可以在诸如 Sun Fire T5240 之类的系统上最多配置两个具有专用 PCI-E 根联合体的域。这些系统具有两个 UltraSPARC T2 Plus CPU 和两个 I/O 根联合体。

pci@500 和 pci@400 是系统中的两个根联合体。primary 域始终至少包含一个根联合体。可以为另外一个域配置未指定或未绑定的根联合体。

pci@400 结构（或叶）包含板载 e1000g 网卡。以下情况可能会导致域出现紧急情况：

如果系统上配置了两个域，一个是包含 pci@500 的 primary 域，另一个是包含 pci@400 的域

注 - 对于某些刀片，primary 域（系统磁盘）在默认情况下位于 pci@400 总线上。
pci@400 结构上的 e1000g 设备用于引导第二个域

如果在非 primary 域中配置了以下网络设备，请避免使用它们：

/pci@400/pci@0/pci@c/network@0,1
/pci@400/pci@0/pci@c/network@0

当满足这些条件时，域将出现紧急情况，而且会出现 PCI-E 致命错误。

请避免进行这样的配置，如果使用了这样的配置，请不要从上面列出的设备进行引导。

当计算机未联网而且 NIS 客户机正在运行时，Logical Domains Manager 不启动

错误号 15518409：如果您的计算机上运行有网络信息服务 (Network Information Service, NIS) 客户机，但未配置网络，则 Logical Domains Manager 将无法在您的系统上启动。

解决方法：在非联网计算机上禁用 NIS 客户机：

# svcadm disable nis/client

有时，从 Logical Domains 系统执行 `uadmin 1 0` 命令时系统不返回到 OK 提示符

错误号 15511551：有时，从 Logical Domains 系统的命令行执行 uadmin 1 0 命令不会使系统在随后重置后保持在 ok 提示符处。只有当 Logical Domains 变量 auto-reboot? 设置为 true 时，才会出现这种不正确的行为。如果 auto-reboot? 设置为 false，则会出现预期的行为。

解决方法：改为使用以下命令：

uadmin 2 0

或者，始终在 auto-reboot? 设置为 false 的情况下运行。

Logical Domains Manager 关闭域至少需要 15 分钟

错误号 15505014：对于具有单个 CPU 和巨大内存的配置，关闭域或清理内存可能至少需要 15 分钟。在关闭过程中，域中的 CPU 用于清理由该域拥有的所有内存。如果配置不平衡（例如，只有一个 CPU 的域，内存多达 512 GB），完成清理所需的时间可能会相当长。清理时间延长后，关闭域所需的时间也会延长。

解决方法：确保大内存配置（大于 100 GB）至少有一个核心。

`scadm` 命令在 SC 或 SP 重置之后可能会挂起

错误号 15469227：对于运行 Oracle Solaris 10 5/08 OS 或更高版本的控制域，scadm 命令在 SC 重置之后可能会挂起。在 SC 重置之后，系统无法正确地重新建立连接。

恢复：重新引导主机，以便与 SC 重新建立连接。

在公用控制台组中同时进行多个域的网络安装会失败

错误号 15453968：在共用同一个控制台组的系统上同时进行的多个来宾域的网络安装失败。

解决方法：仅在拥有其各自控制台组的来宾域上进行网络安装。只有在多个网络安装域之间共享一个公用控制台组的域上才会出现这种失败情况。

在同一个网络上有太多虚拟网络使用 DHCP 的来宾域可能会变得不响应

错误号 15422900：如果在同一个网络上的来宾域中使用动态主机配置协议 (Dynamic Host Configuration Protocol, DHCP) 配置了四个以上的虚拟网络 (vnet)，则来宾域最终可能会在运行网络通信时变得不响应。

解决方法：如果有 8 个接口，请将 ip_ire_min_bucket_cnt 和 ip_ire_max_bucket_cnt 设置为较大的值（如 32）。

恢复：针对有问题的来宾域 (domain-name) 相继发出 ldm stop-domain domain-name 命令和 ldm start-domain domain-name 命令。

运行 Logical Domains Manager 时无法使用 `eeprom` 命令修改 OpenBoot PROM 变量

错误号 15387338：Oracle VM Server for SPARC 3.2 管理指南 中的Logical Domains 变量持久性中对此问题进行了总结，它仅影响控制域。

在 Logical Domains 运行时无法设置安全密钥

错误号 15370442：在 Logical Domains 环境中，不支持从 Oracle Solaris OS 内使用 ickey(1M) 命令设置或删除广域网 (wide-area network, WAN) 引导密钥。所有的 ickey 操作都会失败并出现以下错误：

ickey: setkey: ioctl: I/O error

另外，在逻辑域（而不是控制域）中使用 OpenBoot 固件设置的 WAN 引导密钥在该域重新引导之后不会被记住。在这些域中，从 OpenBoot 固件设置的密钥只能使用一次。

`ldm stop-domain` 命令的行为可能会令人困惑

错误号 15368170：在某些情况下，ldm stop-domain 命令的行为会令人困惑。

# ldm stop-domain -f domain-name

如果域位于内核模块调试器 kmdb(1) 提示符下，则 ldm stop-domain 命令会失败并出现以下错误消息：

LDom <domain-name> stop notification failed