从包含 SRU 10 的 Oracle Solaris 11.2 开始,Oracle Hardware Management Pack 现在包含了增强诊断功能,用于从附加到 Sun Storage 6 Gb SAS PCIe HBA(内部)(SGX-SAS6-INT-Z) 的磁盘(不管是独立磁盘还是 RAID 卷中的磁盘)中收集磁盘错误和 SMART 事件。
在 Hardware Management Agent 运行期间,系统将捕获这些增强诊断事件并将其记录到 /var/log/ssm/event.log 中。
下表列出了记录的增强诊断事件。
|
控制器将定期轮询每个物理磁盘。如果某个磁盘发生错误,控制器会生成一个事件。Hardware Management Agent 会捕获该事件,并将其输入硬件管理事件日志中。
要查看硬件管理事件日志中的事件信息,请键入以下命令:
# view /var/log/ssm/event.log
对于增强诊断磁盘事件,您将会看到类似如下所示的信息:
Thu Apr 30 12:32:31 2015:(CLI) Event Name : PD_MEDIA_ERROR Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was detected by the device that was non-recoverable. Thu Apr 30 12:32:31 2015:(CLI) ASC : 0x10 Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3 Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3 Thu Apr 30 12:32:31 2015:(CLI) Source : LSI Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, Sense: 3/10/03 Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25 Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12 Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1 Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA PMG0JPXA Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G
随后可以使用事件列表中的信息来确定系统中哪个物理磁盘发生了问题。您可以借助诸如 Oracle ILOM Nac 名称(与系统前面板上的标签匹配)和驱动器序列号等信息确定系统中的磁盘及其驱动器插槽。
对于本文档中所述的其他磁盘诊断事件,当怀疑发生某种磁盘问题时,管理员可以在硬件管理事件日志中查看这些磁盘事件。当前没有可以主动声明这些事件的警报机制。