Sun Cluster 3.0 12/01 系统管理指南

2.1 群集关闭和引导概述

Sun Cluster 的 scshutdown (1M) 命令以一种有序的方式停止群集服务并完整地关闭整个群集。可以在将群集从一个位置移到另一个位置时或在应用程序错误导致数据损坏时执行此操作。


注意:

请使用 scshutdown,而不要使用 shutdownhalt 命令,以确保正确关闭整个群集。将 Solaris shutdown 命令与 scswitch 命令结合使用可关闭单个节点。 有关详细信息,请参阅"2.1.1 如何关闭群集""2.2 关闭和引导单个群集节点"


scshutdown 命令通过以下方式停止群集中的所有节点:

  1. 使所有正在运行的资源组脱机。

  2. 卸载所有群集文件系统。

  3. 关闭活动的设备服务。

  4. 运行 init 0,并使所有节点处于 OBP ok 提示符状态下。


注意:

根据需要,您可以在非群集模式下引导节点,使之不成为群集成员。 这在安装群集软件或执行某些管理过程时有用。 有关详细信息,请参阅"2.2.4 如何在非群集模式下引导群集节点"


表 2-1 任务列表:关闭和引导群集

任务 

有关说明,请转到... 

停止群集 

- 使用 scshutdown

"2.1.1 如何关闭群集"

通过引导所有节点来启动群集。  

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.1.2 如何引导群集"

关闭并重新引导群集 

- 使用 scshutdown

ok 提示符下,使用 boot 命令分别引导各个节点。

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.1.3 如何重新引导群集"

2.1.1 如何关闭群集


小心:小心:

不要在群集控制台上使用 send brk 来关闭群集节点。群集不支持该功能。 如果您使用 send brk 然后在 ok 提示符下输入 go 来重新引导节点,该节点将处于应急状态。


  1. 如果群集上运行的是 Oracle(R) Parallel Server/Real Application Cluster,请关闭数据库的所有实例。

    有关关闭过程,请参阅 Oracle Parallel Server/Real Application Clusters 产品文档。

  2. 成为群集中任一节点上的超级用户。

  3. 将群集立即关闭到 OBP。

    从群集中的单个节点,键入以下命令。


    # scshutdown -g0 -y
    

  4. 验证是否所有节点都已在 ok 提示符下。

    在所有群集节点都处在 ok 提示符下之前,不要关闭任何节点的电源。

  5. 如有必要,关闭节点电源。

2.1.1.1 示例 - 关闭群集

以下示例显示在停止了正常的群集操作,并关闭了所有节点,使其转到 ok 提示符下之后控制台所输出的内容。 -g 0 选项将关闭宽延期设置为零,而 -y 表示在遇到确认问题时,自动回答 yes。 群集中其他节点的控制台上也显示关闭消息。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 

2.1.1.2 从此处可转到何处

要重新启动已关闭的群集,请参阅"2.1.2 如何引导群集"

2.1.2 如何引导群集

  1. 如果群集的节点均已关闭并且在 ok 提示符下,那么在启动该群集时请引导每个节点。

    如果在两次关闭操作之间进行了配置更改,则首先启动具有最新配置的节点。 除上述情形外,节点的引导顺序无关紧要。


    ok boot
    

    激活群集组件时,已引导节点的控制台上将显示消息。


    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  2. 验证引导节点时未发生错误,而且节点现在处于联机状态。

    scstat(1M) 命令报告节点状态。


    # scstat -n
    


    注意:

    如果群集节点的 /var 文件系统已满,可能无法在该节点上重新启动 Sun Cluster。如果出现此问题,请参阅"2.3.1 如何修复已满的 /var 文件系统"


2.1.2.1 示例 - 引导群集

以下示例显示了将节点 phys-schost-1 引导到群集中时控制台所输出的内容。 群集中其他节点的控制台上会显示类似的消息。


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

2.1.3 如何重新引导群集

运行 scshutdown(1M) 关闭群集,然后用各节点上的 boot 命令引导群集。

  1. (可选)。 对于运行 Oracle Parallel Server/Real Application Clusters 的群集,应关闭数据库的所有实例。

    有关关闭过程,请参阅 Oracle Parallel Server/Real Application Clusters 产品文档。

  2. 成为群集中任一节点上的超级用户。

  3. 将群集关闭到 OBP。

    从群集中的单个节点,键入以下命令。


    # scshutdown -g0 -y 
    

    此命令将关闭各节点并使其转到 ok 提示符下。


    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 引导每个节点。

    节点的引导次序无关紧要,除非您在两次关闭操作之间进行了配置更改。 如果在先后两次引导之间更改了配置,则应当首先引导具有最新配置的节点。


    ok boot
    

    当群集组件被激活时,所引导的节点的控制台上将显示消息。

  5. 验证引导节点时未发生错误,而且节点现在处于联机状态。

    scstat 命令报告节点状态。


    # scstat -n
    


    注意:

    如果群集节点的 /var 文件系统已满, 可能无法在该节点上重新启动 Sun Cluster。如果出现此问题,请参阅"2.3.1 如何修复已满的 /var 文件系统"


2.1.3.1 示例 - 重新引导群集

以下示例显示在停止了正常的群集.操作,并关闭了所有节点,使其转到 ok 提示符下然后再重新引导群集时控制台所输出的内容。 -g 0 选项将宽延期设置为零,而 -y 表示在遇到确认问题时,自动回答 yes。群集中其他节点的控制台上也显示关闭消息。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: