错误号 21548747:如果在 PCIe 总线承载 rKVMS 设备的 SPARC M5 或 SPARC M6 系统中使用任何 SR-IOV 设备,则尝试在执行动态总线添加 DBUS 操作之后启用 SR-IOV 时会触发 FMA 错误紧急情况。
解决方法:只在 primary 域使用承载 rKVMS 设备的 PCIe 总线。仅使用静态 PCIe 总线分配方法在 primary 域中移除和添加此类总线。
错误号 21299683:在添加或销毁虚拟功能后,可能需要等待五分钟才能再次尝试创建或销毁基于光纤通道物理功能的其他虚拟功能。
如果在五分钟内尝试执行这些操作,则操作将失败并显示类似于以下内容的消息:
The attempt to offline the pf /SYS/PCI-EM4/IOVFC.PF0 in domain primary failed. Error message from svc:/ldoms/agents in domain primary: CMD_OFFLINE Failed. ERROR: devices or resources are busy.
有时,物理功能、虚拟功能或这两者的状态在 ldm list-io 输出中会显示为 INV。例如,在以下样例输出中,物理功能 0 及其子虚拟功能具有 INV 状态。
primary# ldm list-io pci_5 NAME TYPE BUS DOMAIN STATUS ---- ---- --- ------ ------ pci_5 BUS pci_5 primary IOV /SYS/RCSA/PCIE5 PCIE pci_5 primary OCC /SYS/RCSA/PCIE6 PCIE pci_5 primary OCC /SYS/RCSA/PCIE5/IOVFC.PF0 PF pci_5 primary INV /SYS/RCSA/PCIE5/IOVFC.PF1 PF pci_5 primary /SYS/RCSA/PCIE5/IOVFC.PF0.VF0 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF1 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF2 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF3 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF4 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF5 VF pci_5 INV /SYS/RCSA/PCIE5/IOVFC.PF0.VF6 VF pci_5 INV
解决方法:要清除物理功能和虚拟功能的 INV 状态,请执行以下步骤:
等待 5 分钟。
重试 IOV 操作,创建或销毁基于光纤通道物理功能的虚拟功能。
使用 ldm create-vf -n max 或 ldm destroy-vf -n max 命令,可以在一个命令中执行有关光纤通道物理功能的所有必要 IOV 配置。
错误号 20731016:使用 ldm remove-io 命令从 I/O 域删除最后一个 SR-IOV 虚拟功能时,该命令可能会报告超时,且无法删除此虚拟功能。
解决方法:如果发生此问题,请执行以下步骤:
确认在系统中安装了 system/management/hwmgmtd 软件包。
# pkg info system/management/hwmgmtd
禁用 svc:/system/sp/management 服务。
# svcadm disable -st svc:/system/sp/management
重试 ldm remove-io 命令。
成功删除 SR-IOV 虚拟功能后,启用 svc:/system/sp/management 服务。
# svcadm enable svc:/system/sp/management
错误号 18168525 和 18156291:您必须将光纤通道 PCIe 卡连接到支持 NPIV 并且与 PCIe 卡兼容的光纤通道交换机。如果您未使用此配置,则使用 format 命令或者创建或销毁虚拟功能可能会导致物理功能被 FMA 标记为发生故障并被禁用。如果发生此故障,则消息类似于以下内容:
SUNW-MSG-ID: PCIEX-8000-0A, TYPE: Fault, VER: 1, SEVERITY: Critical EVENT-TIME: event-time PLATFORM: platform-type SOURCE: eft, REV: 1.16 EVENT-ID: event-ID DESC: A problem was detected for a PCIEX device. AUTO_RESPONSE: One or more device instances may be disabled IMPACT: Loss of services provided by the device instances associated with this fault REC-ACTION: Use 'fmadm faulty' to provide a more detailed view of this event. Please refer to the associated reference document at http://support.oracle.com/msg/PCIEX-8000-0A for the latest service procedures and policies regarding this diagnosis.
解决方法:如果卡已被 FMA 标记为发生故障,请首先检查其连接并确保该卡未直接连接到存储。然后,执行与您的配置匹配的步骤:
卡直接连接到存储-通过将光纤通道 PCIe 卡连接到支持 NPIV 并且与 PCIe 卡兼容的光纤通道交换机来正确配置光纤通道 PCIe 卡。然后,运行 fmadm repair 命令来覆盖 FMA 诊断。
卡未直接连接到存储-更换该卡。
错误号 17623156:创建光纤通道虚拟功能时,您可能会看到以下警告:
WARNING: kmem_cache_destroy: 'px0_emlxs3_3_cache2' (3000383e030) not empty WARNING: vmem_destroy('px0_emlxs3_3_vmem_top'): leaked 262144 identifiers
这些消息不影响系统的正常运行,您可以将其忽略。
解决方法:无。
在 Fujitsu M10 服务器上,可以将 PCIe 端点设备和 SR-IOV 虚拟功能从特定的 PCIe 总线分配到最多 24 个域。对于受支持的 SPARC T 系列和 SPARC M 系列平台,最大数目为 15 个域。