从 Solaris 10 10/08 发行版开始,Solaris OS 包括一种新的设备弃用机制,可借助故障管理框架 (fault management framework, FMA) 在设备发生故障时加以隔离。通过此功能,可以安全地自动禁用故障设备,从而避免数据丢失、数据损坏、紧急情况和系统停机。弃用过程安全地执行,考虑弃用设备后的系统稳定性。
永远不会弃用关键设备。如果需要手动更换弃用的设备,除了执行手动更换步骤以外,还应在更换设备后使用 fmadm repair 命令,以便系统了解设备已被更换。
fmadm 修复过程如下所示:
使用 fmadm faulty -a 命令确定故障设备。
# fmadm faulty STATE RESOURCE / UUID -------- --------------------------------------------------------------------- faulty <fmri> |
使用 fmadm repair 命令清除故障。
# fmadm repair <fmri> |
再次运行 fmadm faulty 命令以确保故障已被清除。
# fmadm faulty -a STATE RESOURCE / UUID |
有关更多信息,请参见 fmadm(1M)。
有关设备弃用的一般消息显示在控制台上,并将被写入 /var/adm/messages 文件中,以使您可以了解弃用的设备。例如:
Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] NOTICE: One or more I/O devices have been retired |
可以使用 prtconf 命令来标识特定的弃用设备。例如:
# prtconf . . . pci, instance #2 scsi, instance #0 disk (driver not attached) tape (driver not attached) sd, instance #3 sd, instance #0 (retired) scsi, instance #1 (retired) disk (retired) tape (retired) pci, instance #3 network, instance #2 (driver not attached) network, instance #3 (driver not attached) os-io (driver not attached) iscsi, instance #0 pseudo, instance #0 . . . |