跳过导航链接 | |
退出打印视图 | |
Oracle Solaris ZFS 管理指南 Oracle Solaris 10 1/13 Information Library (简体中文) |
1. Oracle Solaris ZFS 文件系统(介绍)
4. 安装和引导 Oracle Solaris ZFS 根文件系统
6. 使用 Oracle Solaris ZFS 快照和克隆
7. 使用 ACL 和属性保护 Oracle Solaris ZFS 文件
请查看以下各节来确定池问题或文件系统不可用是否与硬件问题(例如有故障的系统板、内存、设备、HBA 或错误配置)相关。
例如,在一个繁忙的 ZFS 池上,将要发生故障或已经发生故障的磁盘可能会大大降低总体系统性能。
如果先从诊断和确定硬件问题开始,这些问题比较容易检测,在检查完所有硬件后,您可以按本章剩余部分中所述继续对池和文件系统问题进行诊断。如果硬件、池和文件系统配置都正常,请考虑诊断应用程序问题,这类问题的解决通常比较复杂,本指南中未涵盖这方面的内容。
Solaris Fault Manager 通过以下方式来跟踪软件、硬件和特定的设备问题:在错误日志中标识指明特定症状的错误遥测信息,然后在错误症状导致了实际故障时报告实际的故障诊断信息。
以下命令用于确定任何与软件或硬件相关的故障。
# fmadm faulty
可例行使用以上命令来确定发生故障的服务或设备。
可例行使用以下命令来确定与硬件或设备相关的错误。
# fmdump -eV | more
需要注意此日志文件中描述 vdev.open_failed、checksum 或 io_failure 问题的错误消息,否则它们可能会演变为实际错误(可通过 fmadm 故障命令显示)。
如果以上信息指明某个设备将要发生故障,则正好趁此时确保有可替换的设备。
还可以通过使用 iostat 命令来跟踪额外的设备错误。使用以下语法可标识错误统计信息摘要。
# iostat -en ---- errors --- s/w h/w trn tot device 0 0 0 0 c0t5000C500335F95E3d0 0 0 0 0 c0t5000C500335FC3E7d0 0 0 0 0 c0t5000C500335BA8C3d0 0 12 0 12 c2t0d0 0 0 0 0 c0t5000C500335E106Bd0 0 0 0 0 c0t50015179594B6F11d0 0 0 0 0 c0t5000C500335DC60Fd0 0 0 0 0 c0t5000C500335F907Fd0 0 0 0 0 c0t5000C500335BD117d0
在上面的输出中,报告了内部磁盘 c2t0d0 上的错误。使用以下语法可显示更详细的设备错误。
# iostat -En c0t5000C500335F95E3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672QFSB Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335FC3E7d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672TE67 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335BA8C3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672SDF4 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c2t0d0 Soft Errors: 0 Hard Errors: 12 Transport Errors: 0 Vendor: AMI Product: Virtual CDROM Revision: 1.00 Serial No: Size: 0.00GB <0 bytes> Media Error: 0 Device Not Ready: 12 No Device: 0 Recoverable: 0 Illegal Request: 2 Predictive Failure Analysis: 0
除了持久跟踪池中的错误外,ZFS 还在发生相关事件时显示系统日志消息。以下情况将生成通知事件:
设备状态转换-如果设备变为 FAULTED 状态,则 ZFS 将记录一条消息,指出池的容错能力可能已受到危害。如果稍后将设备联机,将池恢复正常,则将发送类似的消息。
数据损坏-如果检测到任何数据损坏,则 ZFS 将记录一条消息,描述检测到数据损坏的时间和位置。仅在首次检测到数据损坏时才记录此消息。后续访问不生成消息。
池故障和设备故障-如果出现池故障或设备故障,则 Fault Manager 守护进程将通过 syslog 消息以及 fmdump 命令报告这些错误。
如果 ZFS 检测到设备错误并自动从其恢复,则不进行通知。这样的错误不会造成池冗余或数据完整性方面的故障。并且,这样的错误通常是由伴随有自己的一组错误消息的驱动程序问题导致的。