当服务器运行时,如果您执行某些任务,您可能遇到故障或错误,特别是在 SP 故障转移或关开机循环之前,当时,或之后。关开机循环问题可能导致 start /Servers/PDomains/PDomain_n/HOST 或 stop /Servers/PDomains/PDomain_n/HOST 操作无法继续进行。
手动启动 SP 故障转移之前,必须使系统为故障转移做好准备(请参阅SPARC M7 Series Servers Service Manual 中的 Prepare to Remove an SP)。
只有当主机断电时使用 Oracle ILOM CLI 启动 SP 故障转移。此外,如果使用 Oracle ILOM Web 界面启动 SP 故障转移,请注意 Web 界面方法不是始终正常工作。在这种情况下,请使用 Oracle ILOM CLI。
如果主机正在关开机循环,等待直至完成关开机循环,然后启动 SP 故障转移。
如果将 SP 互连上的 IP 地址从默认地址更改为其他地址,则主机与 SP 之间的连接在 SP 故障转移后可能不正确。主机必须使用默认 IP 地址进行 SP 互连。
在安装新的 CMIOU 之前,请停止主机,并且不要执行 SP 故障转移。请参见在 SP 故障转移过程中执行开关机操作可能导致 CMIOU 故障 (22144807)。
如果主机在热启动状态挂起,则挂起可能是由于自动 SP 故障转移。
如果您尝试并行启动多个主机,尤其是在 SP 重置或 SP 故障转移之后,可能会遇到错误或故障。请参见在 gm_start_phase1_boot() 中挂起 (21875977)。
在 SP 故障转移之后,如果故障组件列表不完整,请重置 ip-transport 连接以重放故障列表。请参见在 SP 故障转移后,POD 在故障填充前响应了故障查询 (22048919)。
如果主机不使用默认 IP 地址进行 SP 互连,则在 SP 故障转移后,主机与 SP 之间的连接可能不正确。主机必须使用默认 IP 地址进行 SP 互连。请参见在使用非默认 IP 地址的情况下,ldm ls-config 命令在 SP 故障转移后失效 (22093177)。
如果发生故障转移,则在恢复密钥库之前,备用 SP 上的 TPM 无法解密 TPM 保护的密钥库。有关更多信息,请参见可信平台模块可用性。
您可以忽略或手动清除特定故障、消息和事件列表条目。请参阅:SPARC M7 SP 故障转移无法从已挂载的非黄金 Miniroot 映像中删除 PCIe 设备 (21549933) 和禁止 FRU 在 pciexdev Multi-LDom 系统中的节点 (22286820) 上添加和删除警报。
仅在系统启动过程完成后手动启动主机。
如果在关开机循环过程中主机重新启动,则 DCU 的所有组件都会被排除在外。请参见在 PDECB 关闭时启动主机不应排除整个 DCU (22146616)。
如果无法对某个域执行关开机循环,则可能遇到了此问题。此问题仅影响 SPARC M7-16 服务器。恢复要求重置 SP。请参见远程 POD RPC 服务器中的瞬态拥塞可能导致 stop /HOST 挂起 (21419864)。
如果主机没有继续进行操作,并且 power_state 显示 none 超过 10 分钟,请与 Oracle 服务提供商联系。请参见start /host 无法继续进行,power_state 显示 none (21668567)。