Sun Cluster 3.0 U1 系统管理指南

2.1 群集关闭和引导概述

Sun Cluster scshutdown(1M) 命令以一种有序的方式停止群集服务,并明确关闭整个群集。可以在将群集从一个位置移到另一个位置时或在应用程序错误导致数据损坏时执行此操作。


注意:

请使用 scshutdown,而不要使用 shutdownhalt 命令,以确保正确关闭整个群集。将 Solaris shutdown 命令与 scswitch 命令结合使用可关闭各个节点。有关详细信息,请参阅"2.1.1 如何关闭群集""2.2 关闭和引导单个群集节点"


scshutdown 命令通过以下方式停止群集中的所有节点:

  1. 使所有正在运行的资源组脱机。

  2. 卸载所有群集文件系统。

  3. 关闭活动的设备服务。

  4. 运行 init 0,使所有节点处于 OBP ok 提示符状态下。


注意:

根据需要,您可以在非群集模式下引导节点,使之不成为群集成员。这在安装群集软件或执行某些管理过程时有用。有关详细信息,请参阅"2.2.4 如何在非群集模式下引导群集节点"


表 2-1 任务列表:关闭和引导群集

任务 

有关说明,请转到... 

停止群集 

- 使用 scshutdown

"2.1.1 如何关闭群集"

通过引导所有节点来启动群集。 

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.1.2 如何引导群集"

关闭并重新引导群集 

- 使用 scshutdown

ok 提示符下,使用 boot 命令分别引导各个节点。

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.1.3 如何重新引导群集"

2.1.1 如何关闭群集


小心:小心:

不要在群集控制台上使用 send brk 来关闭群集节点。群集不支持该功能。如果您使用 send brk 并在 ok 提示符下输入 go 进行重新引导,则该节点将处于紧急状态。


  1. 如果您的群集在运行 Oracle Parallel Server (OPS),则关闭所有 OPS 数据库实例。

    有关关闭过程,请参阅 Oracle Parallel Server 产品文档。

  2. 成为群集中任一节点的超级用户。

  3. 将群集立即关闭到 OBP。

    从群集中的单个节点,键入以下命令。


    # scshutdown -g0 -y
    

  4. 检验所有节点是否已在 ok 提示符下。

    不要关闭任何节点的电源,直到所有群集节点都在 ok 提示符下。

  5. 如有必要,关闭节点电源。

2.1.1.1 示例 - 关闭群集

以下示例展示停止正常节点操作并将所有节点都关闭到 ok 提示符下时的控制台输出。 -g 0 选项将关闭宽延期设置为零,而 -y 表示在遇到确认问题时,自动回答 yes。群集中其它节点的控制台上也显示关闭消息。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 

2.1.1.2 从此处可转到何处

要重启已关闭的群集,请参阅"2.1.2 如何引导群集"

2.1.2 如何引导群集

  1. 要启动其节点已关闭且在 ok 提示符下的群集,请引导每个节点。

    如果在两次关闭操作之间进行了配置更改,则首先启动具有最新配置的节点。除上述情形外,节点的引导顺序无关紧要。


    ok boot
    

    激活群集组件时,已引导节点的控制台上将显示消息。


    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  2. 检验引导的节点是否存在错误及是否联机。

    scstat(1M) 命令报告节点的状态。


    # scstat -n
    


    注意:

    如果群集节点的 /var 文件系统已满,可能无法在该节点上重启 Sun Cluster。如果出现这种问题,请参阅"2.3.1 如何修复完整的 /var 文件系统"


2.1.2.1 示例 - 引导群集

以下示例说明将节点 phys-schost-1 引导到群集中时的控制台输出。群集中其它节点的控制台上会显示类似的消息。


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

2.1.3 如何重新引导群集

运行 scshutdown(1M) 命令来关闭群集,然后在每个节点上使用 boot 命令来引导群集。

  1. (可选)对于运行 Oracle Parallel Server (OPS) 的群集,请关闭所有 OPS 数据库实例。

    有关关闭过程,请参阅 Oracle Parallel Server 产品文档。

  2. 成为群集中任一节点的超级用户。

  3. 将群集关闭到 OBP。

    从群集中的单个节点,键入以下命令。


    # scshutdown -g0 -y 
    

    此命令将每个节点均关闭到 ok 提示符下。


    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 引导每个节点。

    节点的引导次序无关紧要,除非您在两次关闭操作之间进行了配置更改。如果在先后两次引导之间更改了配置,则应当首先引导具有最新配置的节点。


    ok boot
    

    当群集组件被激活时,所引导的节点的控制台上将显示消息。

  5. 检验引导的节点是否存在错误及是否联机。

    scstat(1M) 命令报告节点的状态。


    # scstat -n
    


    注意:

    如果群集节点的 /var 文件系统已满,可能无法在该节点上重启 Sun Cluster。如果出现这种问题,请参阅"2.3.1 如何修复完整的 /var 文件系统"


2.1.3.1 示例 - 重新引导群集

以下示例展示停止正常节点操作、将所有节点都关闭到 ok 提示符下 - 再重新引导时的控制台输出。-g 0 选项将宽延期设置为零,而 -y 表示在遇到确认问题时,自动回答 yes。群集中其它节点的控制台上也显示关闭消息。


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
... 
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems 
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: