JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle Solaris Cluster 系统管理指南     Oracle Solaris Cluster 4.0 (简体中文)
search filter icon
search icon

文档信息

前言

1.  Oracle Solaris Cluster 管理简介

2.  Oracle Solaris Cluster 和 RBAC

3.  关闭和引导群集

关闭和引导群集概述

如何关闭群集

如何引导群集

如何重新引导群集

关闭和引导群集中的单个节点

如何关闭节点

如何引导节点

如何重新引导节点

如何以非群集模式引导节点

修复已满的 /var 文件系统

如何修复已满的 /var 文件系统

4.  数据复制方法

5.  管理全局设备、磁盘路径监视和群集文件系统

6.  管理法定

7.  管理群集互连和公共网络

8.  添加和删除节点

9.  管理群集

10.  对 CPU 使用控制的配置

11.  更新您的软件

12.  备份和恢复群集

A.  示例

索引

关闭和引导群集中的单个节点

您可以关闭全局群集节点或区域群集节点。本节说明了如何关闭全局群集节点和区域群集节点。

要关闭全局群集节点,请将 clnode evacuate 命令与 Oracle Solaris shutdown 命令配合使用。仅当关闭整个全局群集时,才能使用 cluster shutdown 命令。

对于区域群集节点,请在全局群集中使用 clzonecluster halt 命令以关闭单个区域群集节点或整个区域群集。还可以使用 clnode evacuateshutdown 命令来关闭区域群集节点。

有关更多信息,请参见 clnode(1CL)shutdown(1M)clzonecluster(1CL) 手册页。

在本章的操作过程中,phys-schost# 表示全局群集提示符。clzonecluster 交互式 shell 提示符为 clzc:schost>

表 3-2 任务列表:关闭并引导节点

任务
工具
指导
停止节点。
对于全局群集节点,请使用 clnode evacuate shutdown 命令。 对于区域群集节点,请使用 clzonecluster halt 命令。
启动节点。

节点必须具有到群集互连的有效连接才能获得群集成员的身份。

对于全局群集节点,请使用 bootb 命令。对于区域群集节点,请使用 clzonecluster boot 命令。
停止并重新启动(重新引导)群集中的节点。

节点必须具有到群集互连的有效连接才能获得群集成员的身份。

对于全局群集节点,请使用 clnode evacuateshutdown 命令,然后使用 bootb

对于区域群集节点,请使用 clzonecluster reboot 命令。

引导一个节点,使该节点不成为群集成员。
对于全局群集节点,请使用 clnode evacuateshutdown 命令,然后使用 boot -x (在 SPARC 上)或 GRUB 菜单项编辑(在 x86 上)。

如果底层的全局群集是以非群集模式引导的,则区域群集节点也自动以非群集模式引导。

如何关闭节点

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。


注意

注意 - 不要在群集控制台上使用 send brk 来关闭全局群集或区域群集上的节点。群集内部不支持该命令。


  1. 如果您的群集正在运行 Oracle RAC,请关闭您要关闭的群集中的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在要关闭的群集节点上,成为超级用户或承担可提供 solaris.cluster.admin RBAC 授权的角色。

    从全局群集的节点执行此过程中的所有步骤。

  3. 如果您想要停止特定的区域群集成员,请跳过步骤 4-6,然后从全局群集节点执行以下命令:
    phys-schost# clzonecluster halt -n physical-name zoneclustername

    如果您指定了特定的区域群集节点,将仅停止该节点。默认情况下,halt 命令停止所有节点上的区域群集。

  4. 将所有资源组、资源和设备组从要关闭的节点切换到其他全局群集成员。

    在要关闭的全局群集节点上,键入以下命令。clnode evacuate 命令可将指定节点上的所有资源组和设备组切换到下一个首选节点。(还可以在区域群集节点内运行 clnode evacuate。)

    phys-schost# clnode evacuate node
    node

    指定从中切换资源组和设备组的节点。

  5. 关闭该节点。

    指定您想要关闭的全局群集节点。

    phys-schost# shutdown -g0 -y -i0

    检验该全局群集节点是否显示 ok 提示符(在基于 SPARC 的系统上)或在 GRUB 菜单中显示消息 "Press any key to continue"(在基于 x86 的系统上)。

  6. 如有必要,请关闭节点电源。

示例 3-7 SPARC: 关闭全局群集节点

以下示例显示了当节点 phys-schost-1 关闭时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也显示此节点的关闭消息。

phys-schost# clnode evacuate nodename
phys-schost# shutdown -g0 -y
Wed Mar 10 13:47:32 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated
ok 

示例 3-8 x86: 关闭全局群集节点

以下示例显示了当节点 phys-schost-1 关闭时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes。全局群集中其他节点的控制台上也显示此节点的关闭消息。

phys-schost# clnode evacuate phys-schost-1
phys-schost# shutdown -g0 -y
Shutdown started.    Wed Mar 10 13:47:32 PST 2004

Changing to init state 0 - please wait
Broadcast Message from root (console) on phys-schost-1 Wed Mar 10 13:47:32... 
THE SYSTEM phys-schost-1 IS BEING SHUT DOWN NOW ! ! !
Log off now or risk your files being damaged

phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling clnode evacuate
failfasts disabled on node 1
Print services already stopped.
Mar 10 13:47:44 phys-schost-1 syslogd: going down on signal 15
umount: /global/.devices/node@2 busy
umount: /global/.devices/node@1 busy
The system is down.
syncing file systems... done
WARNING: CMM: Node being shut down.
Type any key to continue 

示例 3-9 关闭区域群集节点

以下示例显示了如何使用 clzonecluster halt 关闭一个名为 sparse-sczone 的区域群集中的节点。(还可以在区域群集节点中运行 clnode evacuateshutdown 命令。)

phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running

phys-schost#
phys-schost# clzonecluster halt -n schost-4 sparse-sczone
Waiting for zone halt commands to complete on all the nodes of the zone cluster "sparse-sczone"...
Sep  5 19:24:00 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster 'sparse-sczone' died.
phys-host#
phys-host# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---

Name            Node Name   Zone HostName   Status    Zone Status
----            ---------   -------------   ------    -----------
sparse-sczone   schost-1    sczone-1        Online    Running
                schost-2    sczone-2        Online    Running
                schost-3    sczone-3        Offline   Installed
                schost-4    sczone-4        Online    Running

phys-schost# 

另请参见

要重新启动已关闭的全局群集节点,请参见如何引导节点

如何引导节点

如果要在全局群集或区域群集中关闭或重新引导其他活动节点,对于您要引导的节点,请等到多用户服务器里程碑进入联机状态。

否则,该节点将无法从群集中要关闭或重新引导的其他节点那里接管服务。


注 - 节点的启动可能受法定配置的影响。在双节点群集中,必须配置一个法定设备,使群集中的法定总计数为三。每个节点应有一个法定计数,法定设备有一个法定计数。在这种情况下,当第一个节点关闭后,第二个节点仍然具有法定,并且以唯一的群集成员的身份运行。要使第一个节点作为群集节点返回群集,第二个节点必须启动并且正在运行。必须存在所需的群集法定计数(两个)。


phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。


注 - 节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  1. 要启动已关闭的全局群集节点或区域群集节点,请引导该节点。

    从全局群集的节点执行此过程中的所有步骤。

    • 在基于 SPARC 的系统上,运行以下命令。

      ok boot
    • 在基于 x86 的系统上,运行以下命令。

      显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。

      当群集组件被激活时,所引导的节点的控制台上将显示消息。

    • 如果您具有区域群集,可以指定要引导的节点。

      phys-schost# clzonecluster boot -n node zoneclustername
  2. 确认引导该节点时未发生错误,而且该节点现在处于联机状态。
    • 运行 cluster status 命令可报告全局群集节点的状态。
      phys-schost# cluster status -t node
    • 从全局群集中的节点运行 clzonecluster status 命令可报告所有区域群集节点的状态。
      phys-schost# clzonecluster status

      当托管区域群集节点的节点以群集模式引导时,区域群集节点只能以群集模式引导。


      注 - 如果节点的 /var 文件系统已满,可能无法在该节点上重新启动 Oracle Solaris Cluster。如果出现该问题,请参见如何修复已满的 /var 文件系统


示例 3-10 SPARC: 引导全局群集节点

以下示例显示了将节点 phys-schost-1 引导到全局群集后的控制台输出。

ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

如何重新引导节点

要在全局群集或区域群集中关闭或重新引导其他活动节点,对于您要重新引导的节点,请等到多用户服务器里程碑进入联机状态。

否则,该节点将无法从群集中要关闭或重新引导的其他节点那里接管服务。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。


注意

注意 - 如果用于任一资源的方法超时且无法中止,则仅当资源的 Failover_mode 属性设置为 HARD 时才会重新引导节点。如果 Failover_mode 属性设置为任何其他值,将不会重新引导节点。


  1. 如果全局群集或区域群集节点正在运行 Oracle RAC,请关闭您要关闭的节点上的所有数据库实例。

    有关关闭过程,请参阅 Oracle RAC 产品文档。

  2. 在要关闭的节点上,成为超级用户或承担可提供 solaris.cluster.admin RBAC 授权的角色。

    从全局群集的节点执行此过程中的所有步骤。

  3. 使用 clnode evacuateshutdown 命令关闭全局群集节点。

    使用在全局群集的某个节点上执行的 clzonecluster halt 命令关闭区域群集。(clnode evacuateshutdown 命令也可用于区域群集。)

    对于全局群集,请在节点上键入以下命令将其关闭。clnode evacuate 命令可将指定节点上的所有设备组切换到下一个首选节点。此外,该命令还可将所有资源组从指定节点的全局区域切换到位于其他节点的下一个首选全局区域。


    注 - 要关闭单个节点,请使用 shutdown -g0 -y -i6 命令。要同时关闭多个节点,请使用 shutdown -g0 -y -i0 命令停止这些节点。停止所有节点后,在所有节点上使用 boot 命令以将它们引导回群集中。


    • 在基于 SPARC 的系统上,运行以下命令重新引导单个节点。

      phys-schost# clnode evacuate node
      phys-schost# shutdown -g0 -y -i6
    • 在基于 x86 的系统上,运行以下命令重新引导单个节点。

      phys-schost# clnode evacuate node
      phys-schost# shutdown -g0 -y -i6

      显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。

    • 指定要关闭和重新引导的区域群集节点。

      phys-schost# clzonecluster reboot - node zoneclustername

    注 - 节点必须具有到群集互连的有效连接才能获得群集成员的身份。


  4. 确认引导该节点时未发生错误,而且该节点现在处于联机状态。
    • 确认全局群集节点处于联机状态。
      phys-schost# cluster status -t node
    • 确认区域群集节点处于联机状态。
      phys-schost# clzonecluster status

示例 3-11 SPARC: 重新引导全局群集节点

以下示例显示了当节点 phys-schost-1 重新引导时的控制台输出。有关该节点的消息(例如关闭和启动通知)出现在全局群集中其他节点的控制台上。

phys-schost# clnode evacuate phys-schost-1
phys-schost# shutdown -g0 -y -i6
Shutdown started.    Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 

WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ... 
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node phys-schost-1: attempting to join cluster
...
NOTICE: Node phys-schost-1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 

示例 3-12 重新引导区域群集节点

以下示例显示了如何重新引导区域群集中的节点。

phys-schost# clzonecluster reboot -n schost-4 sparse-sczone
Waiting for zone reboot commands to complete on all the nodes of the zone cluster
   "sparse-sczone"...
Sep  5 19:40:59 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster
   'sparse-sczone' died.
phys-schost# Sep  5 19:41:27 schost-4 cl_runtime: NOTICE: Membership : Node 3 of cluster
   'sparse-sczone' joined.

phys-schost#
phys-schost# clzonecluster status

=== Zone Clusters ===

--- Zone Cluster Status ---
Name            Node Name   Zone HostName   Status   Zone Status
----            ---------   -------------   ------   -----------
sparse-sczone   schost-1    sczone-1        Online   Running
                schost-2    sczone-2        Online   Running
                schost-3    sczone-3        Online   Running
                schost-4    sczone-4        Online   Running

phys-schost#

如何以非群集模式引导节点

可以在非群集模式下引导全局群集节点,此时该节点不会成为群集的成员。当安装群集软件或执行某些管理过程(如更新节点)时,非群集模式很有用。区域群集节点不能处于与底层的全局群集节点的状态不同的引导状态。如果底层的全局群集节点是以非群集模式引导的,则区域群集节点也自动处于非群集模式。

phys-schost# 提示符表示全局群集提示符。此操作过程适用于全局群集。

此过程提供了 Oracle Solaris Cluster 命令的长格式。此外,大多数命令还有短形式。这些命令除了名称长短的不同以外,其功能都是相同的。

  1. 在将要以非群集模式启动的群集上,成为超级用户或承担可提供 solaris.cluster.admin RBAC 授权的角色。

    从全局群集的节点执行此过程中的所有步骤。

  2. 关闭区域群集节点或全局群集节点。

    clnode evacuate 命令可将指定节点上的所有设备组切换到下一个首选节点。此外,该命令还可将所有资源组从指定节点上的全局区域切换到位于其他节点的下一个首选全局区域。

    • 关闭特定的全局群集节点。
      phys-schost# clnode evacuate node
      phys-schost# shutdown -g0 -y
    • 从全局群集节点关闭特定的区域群集节点。
      phys-schost# clzonecluster halt -n node zoneclustername

      还可以在区域群集内使用 clnode evacuateshutdown 命令。

  3. 确认全局群集节点显示 ok 提示符(在基于 Oracle Solaris 的系统上)或在 GRUB 菜单中显示 Press any key to continue 消息(在基于 x86 的系统上)。
  4. 以非群集模式引导全局群集节点。
    • 在基于 SPARC 的系统上,运行以下命令。

      ok boot -xs
    • 在基于 x86 的系统上,运行以下命令。

    1. 在 GRUB 菜单中,使用方向键选择适当的 Oracle Solaris 条目,然后键入 e 编辑其命令。

      GRUB 菜单随即显示。

      有关基于 GRUB 的引导的更多信息,请参见《Booting and Shutting Down Oracle Solaris on x86 Platforms》中的"Booting an x86 Based System Interactively"

    2. 在引导参数屏幕中,使用方向键选择内核条目,然后键入 e 编辑该条目。

      GRUB 引导参数屏幕随即显示。

    3. 在命令中添加 -x 以指定将系统引导至非群集模式。
      [ Minimal BASH-like line editing is supported. For the first word, TAB
      lists possible command completions. Anywhere else TAB lists the possible
      completions of a device/filename. ESC at any time exits. ]
      
      grub edit> kernel$ /platform/i86pc/kernel/$ISADIR/unix -B $ZFS-BOOTFS -x
    4. 按 Enter 键接受所做更改,并返回到引导参数屏幕。

      屏幕将显示编辑后的命令。

    5. 键入 b 将节点引导至非群集模式。

      注 - 对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请重新执行上述步骤,并将 -x 选项添加到内核引导参数命令中。


示例 3-13 SPARC: 在非群集模式下引导全局群集节点

以下示例显示了当节点 phys-schost-1 关闭并以非群集模式重新启动时的控制台输出。-g0 选项表示将宽限期设置为零,-y 选项表示在接收到要求确认的问题时自动回答 yes,而 -i0 选项则表示调用运行级别 0 (零)。全局群集中其他节点的控制台上也显示此节点的关闭消息。

phys-schost# clnode evacuate phys-schost-1
phys-schost# cluster shutdown -g0 -y
Shutdown started.    Wed Mar 10 13:47:32 phys-schost-1 cl_runtime: 

WARNING: CMM monitoring disabled.
phys-schost-1# 
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of node = 0 ...
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node phys-schost-1 is being shut down.
Program terminated

ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login: