Oracle® Hardware Management Pack for Oracle Solaris 11.2 发行说明

退出打印视图

更新时间: 2015 年 11 月
 
 

需要为 SGX-SAS6-INT-Z HBA 扩展 Oracle Hardware Management Pack 诊断 (20364298)

在 Oracle Solaris 11.2 SRU 10 中,已添加了增强的诊断功能,可以从连接到 Sun Storage 6 Gb SAS PCIe HBA(内部)(SGX-SAS6-INT-Z) 的磁盘收集更多数据。这包括各种磁盘错误和 SMART 事件。另外,这些事件不仅可以标识可疑的物理磁盘,还可以标识 RAID 卷中的可疑逻辑磁盘。当 Hardware Management Agent (svc:/system/sp/management:default) 在运行时,系统将捕获这些增强诊断事件并将它们记录到 /var/log/ssm/event.log 中。

下表列出了所记录的增强诊断事件。

日志中的事件名称
说明
PD_RECOVERED_ERROR
检测到磁盘恢复错误。
PD_BAD_DEVICE_FAULT
执行命令时,设备检测到不可恢复的驱动器故障。
PD_MEDIA_ERROR
设备检测到不可恢复的介质错误。
PD_DEVICE_ERROR
设备检测到不可恢复的硬件故障。设备可能处于脱机或降级状态。
PD_TRANSPORT_ERROR
由于传输不稳定,已取消配置设备的路径。
PD_OVER_TEMPERATURE
磁盘 SMART 进程报告了严重温度警告。
PD_SELF_TEST_FAILURE
一个或多个磁盘 SMART 自检失败。
PD_PREDICTIVE_FAILURE
SMART 运行状况监视固件报告指出即将发生磁盘故障。

控制器会定期轮询每个物理磁盘。如果某个磁盘发生错误,控制器会生成一个事件。Hardware Management Agent 会捕获该事件,并将其输入硬件管理事件日志中。

要查看硬件管理事件日志中的事件信息,请键入以下命令:

# view /var/log/ssm/event.log

对于磁盘事件,您将会看到类似以下内容的信息:

Thu Apr 30 12:32:31 2015:(CLI) Event Name  : PD_MEDIA_ERROR
Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was 
detected by the device that was non-recoverable.
Thu Apr 30 12:32:31 2015:(CLI) ASC  : 0x10
Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Source : LSI
Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 
0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, 
Sense: 3/10/03
Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25
Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12
Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1
Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA   PMG0JPXA
Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G

随后可以使用事件列表中的信息来确定系统中哪个物理磁盘发生了问题。您可以借助诸如 Oracle ILOM Nac 名称(与系统前面板上的标签匹配)和驱动器序列号等信息来确定系统中的磁盘及其驱动器插槽。


注 -  对于 PD_OVER_TEMPERATURE、PD_SELF_TEST_FAILURE 和 PD_PREDICTIVE_FAILURE 事件,请使用 Oracle ILOM 配置主动警报。

对于本文档中所述的其他磁盘诊断事件,当怀疑发生磁盘问题时,管理员可以在硬件管理事件日志中检查这些磁盘事件。当前没有可以主动通报这些事件的警报机制。