Sun Cluster 3.0 U1 系统管理指南

2.2 关闭和引导单个群集节点


注意:

结合使用 scswitch 命令和 Solaris shutdown 命令来关闭单个节点。仅在关闭整个群集时使用 scshutdown 命令。


表 2-2 任务图:关闭和引导群集节点

任务 

有关说明,请转到... 

停止群集节点 

- 使用 scswitch(1M) 和 shutdown(1M)

"2.2.1 如何关闭群集节点"

通过引导来启动节点 

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.2.2 如何引导群集节点"

停止和重新启动(重新引导)群集节点 

- 使用 scswitchshutdown

节点必须具有到群集互连的有效连接才能获得群集成员的身份。 

"2.2.3 如何重新引导群集节点"

引导一个节点,使之不成为群集成员 

- 使用 scswitchshutdown,然后使用 -x 选项进行引导

"2.2.4 如何在非群集模式下引导群集节点"

2.2.1 如何关闭群集节点


小心:小心:

不要在群集控制台上使用 send brk 来关闭群集节点。如果您使用 send brk 并在 ok 提示符下输入 go 来重新引导节点,该节点将处于紧急状态。群集不支持该功能。


  1. 如果您在运行 Oracle Parallel Server (OPS),则关闭所有 OPS 数据库实例。

    有关关闭过程,请参阅 Oracle Parallel Server 产品文档。

  2. 成为要关闭的群集节点上的超级用户。

  3. 将所有资源组、资源和设备组从要关闭的节点切换到其它集群成员。

    在要关闭的节点上,键入以下命令。


    # scswitch -S -h nodelist
    

    -S

    从指定的节点抽出所有的设备服务和资源组。

    -h nodelist

    指定从中切换资源组和设备组的节点。

  4. 将群集节点关闭到 OBP。

    在要关闭的节点上,键入以下命令。


    # shutdown -g0 -y -i0
    

  5. 检验群集节点是否已在 ok 提示符下。

  6. 如有必要,请关闭节点电源。

2.2.1.1 示例 - 关闭群集节点

以下示例将显示关闭节点 phys-schost-1 时的控制台输出。 -g0 选项将宽延期设置为零,而-y 表示在遇到确认问题时,自动回答 yes-i0 调用 0 运行级别(零)。群集中其它节点的控制台上也显示此节点的关闭消息。


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated 
ok 

2.2.1.2 从此处可转到何处

要重启已关闭的群集节点,请参阅"2.2.2 如何引导群集节点"

2.2.2 如何引导群集节点


注意:

群集节点的启动可能受定额配置的影响。在两个节点的群集中,您必须有一个已配置的定额设备,这样,群集的定额总数才能为三(每个节点一个,定额设备一个)。在这种情况下,当第一个节点关闭后,第二个节点仍然有定额设备,并以唯一群集成员的身份运行。如果第一个节点要作为群集节点返回到群集中,则第二个节点必须处于打开状态并运行,并且必须有所需要的群集定额计数 (2)。


  1. 要启动已关闭的群集节点,请引导该节点。


    ok boot
    

    激活群集组件时,所有节点的控制台上将显示消息。


    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  2. 检验节点是否已引导且没有错误,并且处于联机状态。

    scstat(1M) 命令报告节点的状态。


    # scstat -n
    


    注意:

    如果群集节点的 /var 文件系统已满,可能无法在该节点上重启 Sun Cluster。如果出现这种问题,请参阅"2.3.1 如何修复完整的 /var 文件系统"


2.2.2.1 示例 - 引导群集节点

以下示例显示将节点 phys-schost-1 引导到群集时的控制台输出。


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems 
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

2.2.3 如何重新引导群集节点

  1. 如果群集节点在运行 Oracle Parallel Server (OPS),则关闭所有 OPS 数据库实例。

    有关关闭过程,请参阅 Oracle Parallel Server 产品文档。

  2. 成为要关闭的群集节点上的超级用户。

  3. 使用 scswitchshutdown 两个命令关闭群集节点。

    在要关闭的节点上,输入以下命令。在 shutdown 命令中使用 -i 6 选项将使节点在关闭到 ok 提示符后重新引导。


    # scswitch -S -h nodelist
    # shutdown -g0 -y -i6
    

    注意:

    群集节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 检验节点是否已正确引导并处于联机状态。


    # scstat -n
    

2.2.3.1 示例 - 重新引导一个群集节点

以下示例显示重新引导节点 phys-schost-1 时的控制台输出。群集中其它节点的控制台上也显示此节点的关闭和启动消息。


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i6
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ...
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster 
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 

2.2.4 如何在非群集模式下引导群集节点

可以引导一个节点,使之不充当群集成员,即以非群集模式引导。这在安装群集软件或执行某些管理过程(如修补一个节点)时有用。

  1. 成员要在非群集模式下启动的节点上的超级用户。

  2. 使用 scswitchshutdown 命令关闭节点。


    # scswitch -S -h nodelist
    # shutdown -g0 -y -i0
    

  3. 检验节点是否在 ok 提示符下。

  4. 使用 boot(1M) 命令加上 -x 选项在非群集模式下引导节点。


    ok boot -x
    

    该节点的控制台上显示的消息称该节点不是群集的一部分。

2.2.4.1 示例 - 在非群集模式下引导群集节点

以下示例展示关闭节点 phys-schost-1、然后在非群集模式下重新启动时的控制台输出。 -g0 选项将宽延期设置为零,而 -y 表示在遇到确认问题时,自动回答 yes-i0 调用 0 运行级别(零)。群集中其它节点的控制台上也显示此节点的关闭消息。


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1#
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of  node = 0 ...
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node 1 is being shut down.
Program terminated
ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login: