此问题同时影响两个服务器。
在 SP 故障转移过程中,当 SP 成为活动 SP 时,需要重新填充保存在故障数据库中的当前故障集。如果系统的其他区域在此操作完成前请求了故障信息,则可能会出现以下行为:
可能发布重复的故障。为两个故障标识了相同的 ereport 类、故障类和资源。唯一的差别是每个故障的时间戳。
可能会为已发生故障的 FRU 发布 fault.fruid.replay。
部分或全部 Oracle ILOM 诊断的故障在 SP 故障转移后未在主机上显示,但是,如果重置 FMA ip-transport 连接,将显示所有故障。
解决方法:要避免此问题,必须解决所有故障状况并执行所有维修操作,然后再启动 SP 故障转移。
如果发生了计划外故障,并触发了此问题,请在 Oracle Solaris 提示符下使用以下命令:
root@host-name:~# fmadm reset ip-transport
恢复:在 Oracle Solaris 提示符下使用以下命令重置 ip-transport 连接,以重放故障列表。
root@host-name:~# fmadm reset ip-transport