用于 Solaris OS 的 Sun Cluster 数据服务规划和管理指南

清除资源上的 STOP_FAILED 错误标志

如果将 Failover_mode 资源特性设置为 NONESOFT 并且资源的 STOP 失败,则单个资源将进入 STOP_FAILED 状态,资源组将进入 ERROR_STOP_FAILED 状态。您不能使处于此状态的资源组在任一节点上联机,也不能编辑该资源组(创建或删除资源,或者更改资源组或资源特性)。

如何清除资源上的 STOP_FAILED 错误标志

要完成此过程,必须提供以下信息。

有关附加信息,请参见scswitch(1M) 手册页。


注意 –

请通过任一群集节点执行此过程。


  1. 成为某个群集成员的超级用户。

  2. 标识哪些资源已经进入 STOP_FAILED 状态并位于哪些节点上。


    # scstat -g
    
  3. 在资源处于 STOP_FAILED 状态的节点上手动停止资源及其监视器。

    此步骤可能需要您终止进程,或者运行针对资源类型的命令或其他命令。

  4. 在手动停止了资源的所有节点上将这些资源的状态手动设置为 OFFLINE


    # scswitch -c -h nodelist -j resource -f STOP_FAILED
    
    -c

    清除标志。

    -h nodelist

    指定其中的资源处于 STOP_FAILED 状态的节点的名称(以逗号分隔)列表。该列表可能包含一个节点名称,也可能包含多个节点名称。

    -j resource

    指定要切换为脱机状态的资源的名称。

    -f STOP_FAILED

    指定标志名称。

  5. 查看在步骤 4 中清除了STOP_FAILED 标志的节点上的资源组状态。

    资源组状态此时应为 OFFLINEONLINE


    # scstat -g
    

    命令 scstat -g 表示资源组是否保持 ERROR_STOP_FAILED 状态。如果资源组仍处于 ERROR_STOP_FAILED 状态,则运行以下 scswitch 命令以在适合的节点上将资源组切换为脱机状态。


    # scswitch -F -g resource-group
    

    -F

    在可以控制组的所有节点上将资源组切换为脱机状态。

    -g resource-group

    指定要切换为脱机状态的资源组的名称。

    如果 STOP 方法失败,并且无法停止的资源与资源组中的其他资源具有依赖性,则在将资源组切换为脱机状态时会发生此种情况。否则,在对所有 STOP_FAILED 资源运行步骤 4 中的命令后,资源组将自动恢复为 ONLINEOFFLINE 状态。

    此时您可以将资源组切换为 ONLINE 状态。