此问题已在系统软件发行版 1.0.4 中得到修复。
极少数情况下,在服务器打开电源或复位期间,系统可能会亮起服务器前面板“CPU 需要维修操作”指示灯,并生成针对处理器和内存子系统的错误。可以放心地忽略此错误的单个事件和孤立事件。可登录到 Oracle ILOM Web 界面或 CLI 来了解更多信息。可使用 CLI 故障管理 Shell 清除错误。
要查明错误,请登录 Oracle ILOM Web 界面。Oracle ILOM "Summary" 屏幕的 "Status" 部分将显示处理器和内存子系统的 "Service Required" 状态。单击 "Open Problems" 链接可获得更多信息,其中问题定义如下:
A Scalable Memory Interconnect (SMI) half-width failover has been detected.
要修复此故障,请参见下面的问题解决过程。
要使用 Oracle ILOM CLI 界面调查并修复错误,请参见下面的问题解决过程。
解决方法
可以使用 CLI 故障管理 shell 修复处理器和 MR 卡错误,如下所述。如果错误持续存在或内存性能下降,请与 Oracle 服务部门联系。
在终端窗口,键入以下命令以启动与服务器服务处理器 (service processor, SP) 的 ssh 会话:
ssh root@sp-ip-address
其中,sp-ip-address 是 SP 的 IP 地址。
当 CLI 提示符显示 (–>) 时,请通过键入以下命令导航到故障管理目录:
cd /SP/faultmgmt
要查看处于故障状态的组件,请键入以下命令:
show
组件将在 "Targets" 下列出,如以下示例所示:
/SP/faultmgmt Targets: shell 0 (/SYS/MB/P0) 1 (/SYS/MB/P0/MR1)
记下处理器和 MR 卡编号:
例如,下面显示故障处理器为 P0,故障 MR 卡为 MR1:
0 (/SYS/MB/P0) 1 (/SYS/MB/P0/MR1)
要启动 faultmgmt shell,请键入以下命令:
start shell
系统响应:
Are you sure you want to start /SP/faultmgmt/shell (y/n)?
要确认,请键入:y
faultmgmt 提示符会显示:
(faultmgmtsp>)
要修复处理器,请键入以下命令:
fmadm repair /SYS/MB/P#
其中,P# 是处理器编号
要修复 MR 卡,请键入以下命令:
fmadm repair /SYS/MB/P#/MR#
其中,P#/MR# 是处理器和 MR 卡编号。
要退出 faultmgmt shell,请键入:
exit
重新引导服务器并监视此问题是否重复出现。