当某个节点(应用程序在其上处于联机状态)与存储设备之间发生通信中断时,某些应用程序资源组可能无法正常地向可访问该存储设备的节点进行故障转移。结果,应用程序资源组的状态可能是 ERROR_STOP_FAILED。
当卷或其底层设备发生 I/O 错误时,Sun Cluster 基础结构不会启动切换操作。由于未发生切换和故障转移,因此该节点上的设备服务仍保持联机,尽管存储设备已呈现不可访问。
如果发生此问题,请使用标准的 Sun Cluster 操作过程在正确的节点上重新启动应用程序资源组。请参阅《Sun Cluster Data Services Planning and Administration Guide for Solaris OS》中的“Clearing the STOP_FAILED Error Flag on Resources”,以了解如何从 ERROR_STOP_FAILED 状态恢复以及如何重新启动应用程序。
Sun Cluster Geographic Edition 软件可检测出应用程序资源组中的状态变化,并在 geoadm status 命令的输出结果中显示这些状态。有关使用该命令的更多信息,请参见监视 Sun Cluster Geographic Edition 软件的运行时状态。