Sun Cluster 3.0 12/01 系统管理指南

第 4 章 管理定额

本章讲述了在 Sun Cluster 中管理定额的过程。

以下是本章中包含的过程的列表。

本章中的大多数示例均来自一个由三个节点组成的群集。

有关对定额和定额设备的概念的概述,请参阅《Sun Cluster 3.0 12/01 概念》文档。

4.1 定额管理概述

您可以使用 scconf(1M) 命令来执行所有的定额管理过程。此外,您还可以使用 scsetup(1M) 交互式实用程序或 SunPlex Manager GUI 来完成某些过程。 只要可能,本章中的定额过程都使用 scsetup 命令来说明。 SunPlex Manager 联机帮助介绍了如何使用 GUI 执行定额过程。

如果任何与定额相关的 scconf 命令中断或失败,则群集配置数据库中的定额配置信息可能会变得不一致。 如果发生这种情况,则要么重新运行此中断或失败的命令,要么运行 scconf 命令并同时使用 reset 选项,以重置定额配置。


注意:

scsetup(1M) 实用程序是 scconf(1M) 命令的一个交互式接口。运行 scsetup 时,将生成 scconf 命令。 这些生成的命令可在本过程结尾部分的示例中找到。


可以使用以下两条命令查看定额配置: scstat -q 选项和 scconf -p。本章中大多数情况下都使用 scconf 来进行检验操作。但是,如果您觉得 scstat -q 所输出的信息更有用,也可选用它。

表 4-1 任务列表:定额管理

任务 

有关说明,请转到... 

向群集添加定额设备 

- 使用 scsetup

"4.1.2 如何添加定额设备"

从群集中删除定额设备 

- 使用 scsetup (以生成 scconf)

"4.1.3 如何删除定额设备"

从群集中删除最后一个定额设备 

- 使用 scsetup(以生成 scconf)

"4.1.4 如何从群集中删除最后一个定额设备"

替换群集中的定额设备 

- 使用添加和删除过程 

"4.1.5 如何替换定额设备"

使定额设备处于维护状态 

(在维护状态下,定额设备不参与为建立定额而进行的投票。) 

- 使用 scsetup(以生成 scconf)

"4.1.6 如何使定额设备处于维护状态"

将定额配置重置为缺省状态 

- 使用 scsetup(以生成 scconf)

"4.1.7 如何使定额设备脱离维护状态"

列出定额设备和选票计数 

- 使用 scconf

"4.1.8 如何列出定额配置"

4.1.1 动态重新配置定额设备

完成对群集中的定额设备进行的动态重新配置 (DR) 操作后,有一些问题必须予以考虑。

要删除定额设备,必须按所示顺序完成下列步骤。

表 4-2 任务表:动态重新配置定额设备

任务 

有关说明,请转到... 

1. 启用一个新的定额设备,以替换正要删除的设备。 

"4.1.2 如何添加定额设备"

2. 禁用要删除的定额设备。 

"4.1.3 如何删除定额设备"

3. 对正要删除的设备执行 DR 删除操作。  

Sun Enterprise 10000 Dynamic Reconfiguration User Guide》和《Sun Enterprise 10000 Dynamic Reconfiguration Reference Manual》(出自《 Solaris 8 on Sun Hardware》集)

4.1.2 如何添加定额设备

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

要完成此过程,请用设备 ID (DID) 来标识磁盘驱动器。设备 ID 供所有节点共享。 可以使用 scdidadm -L 命令来查看 DID 名称列表。 有关其他信息,请参阅 scdidadm(1M) 手册页。

有关此过程所使用的命令的信息,请参阅 scsetup(1M)scconf(1M) 手册页。

  1. 成为群集中任一个节点的超级用户。

  2. 进入 scsetup 实用程序。


    # scsetup
    

    显示"Main Menu"。

  3. 要使用定额设备,请键入 1(定额)。

    这时将显示"Quorum Menu"。

  4. 要添加定额设备,请键入 1(添加定额磁盘)。

    按照说明键入要用作定额设备的设备的名称。

  5. 检验是否已添加定额设备。


    # scstat -q
    

  6. 对每组共享同一个存储器群的节点重复从步骤 3步骤 5 的操作。

4.1.2.1 示例 - 添加定额设备

以下示例显示了 scsetup 添加定额设备时所生成的 scconf 命令以及检验步骤。


Become superuser on any cluster node.
[Execute the scsetup utility:]
# scsetup
Select Quorum>Add a quorum disk.
Answer the questions when prompted.
[Verify that the scconf command completed successfully:]
 
scconf -a -q globaldev=d20
 
    Command completed successfully.
Quit the scsetup Quorum Menu and Main Menu.
[Verify the quorum device is removed:]
# scstat -q
 
-- Quorum Summary --
 
  Quorum votes possible: 4
  Quorum votes needed:   3
  Quorum votes present:  4
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1       1        1       Online
  Node votes:       phys-schost-2       1        1       Online
 
-- Quorum Votes by Device --
 
                 Device Name         Present Possible Status
                 -----------         ------- -------- ------
  Device votes:  /dev/did/rdsk/d3s2  1        1       Online
  Device votes:  /dev/did/rdsk/d4s2  1        1       Online

4.1.3 如何删除定额设备

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

删除定额磁盘后,该定额磁盘将不再参与为建立定额而进行的投票。 请注意,所有由两个节点组成的群集均要求至少配置一个定额设备。 如果要删除的是群集中的最后一个定额设备,则 scconf(1M) 将无法从配置中删除该设备。


注意:

如果所要删除的设备是群集中的最后一个定额设备,请参阅"4.1.4 如何从群集中删除最后一个定额设备"过程。


  1. 成为群集中任一节点上的超级用户。

  2. 确定要删除的定额设备。


    # scconf -pv | grep Quorum
    

  3. 执行 scsetup(1M) 实用程序。


    # scsetup
    

    显示"Main Menu"。

  4. 要使用定额设备,请键入 1(定额)。

  5. 要删除定额设备,请键入 2(删除定额磁盘)。

    回答删除过程中显示的问题。

  6. 退出 scsetup

  7. 检验是否已删除该定额设备。


    # scstat -q
    

4.1.3.1 示例 - 删除定额设备

此示例说明了如何从配置有两个或更多定额设备的群集中删除定额设备。


Become superuser on any node and place the node to be removed in maintenance state.
[Determine the quorum device to be removed:]
# scconf -pv | grep Quorum
[Execute the scsetup utility:]
# scsetup
Select Quorum>Remove a quorum disk.
Answer the questions when prompted.
[Verify that the scconf command completed successfully:]
 
scconf -r -q globaldev=d4
 
    Command completed successfully.
Quit the scsetup Quorum Menu and Main Menu.
[Verify the quorum device is removed:]
# scstat -q
 
-- Quorum Summary --
 
  Quorum votes possible:      3
  Quorum votes needed:        2
  Quorum votes present:       3
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1       1        1       Online
  Node votes:       phys-schost-2       1        1       Online
 
-- Quorum Votes by Device --
 
                 Device Name         Present Possible Status
                 -----------         ------- -------- ------
  Device votes:  /dev/did/rdsk/d3s2  1        1       Online

4.1.4 如何从群集中删除最后一个定额设备

如果所要删除的设备不是群集中的最后一个定额设备,请使用前一个过程:"4.1.3 如何删除定额设备"


注意:

所有由两个节点组成的群集均要求至少配置一个定额设备。 如果所要删除的设备是群集中的最后一个定额设备,而且该群集由两个节点组成,则必须先将该群集置于安装模式,然后 scconf(1M) 才允许从配置中删除此设备。 只有在从群集中删除节点时,才应该这样做。


  1. 成为群集中任一节点的超级用户,并使要删除的节点处于维护状态。

    请参阅"6.1.7 如何使节点进入维护状态"

  2. 将群集置于安装模式。


    # scconf -c -q installmode
    

  3. 使用 scconf 命令删除定额设备。


    # scconf -r -q globaldev=device
    

  4. 检验是否已删除定额设备。


    # scstat -q
    

4.1.4.1 示例 - 删除最后一个定额设备

此示例说明了如何删除群集配置中所剩的最后一个定额设备。


[Become superuser on any node.]
[Place the cluster in install mode:]
# scconf -c -q installmode
[Remove the quorum device:]
# scconf -r -q globaldev=d3
[Verify the quorum device has been removed:]
# scstat -q
 
-- Quorum Summary --
 
  Quorum votes possible:      2
  Quorum votes needed:        2
  Quorum votes present:       2
 
-- Quorum Votes by Node --
 
                    Node Name           Present Possible Status
                    ---------           ------- -------- ------
  Node votes:       phys-schost-1       1        1       Online
  Node votes:       phys-schost-2       1        1       Online
 
-- Quorum Votes by Device --
 
                    Device Name         Present Possible Status
                    -----------         ------- -------- ------

4.1.5 如何替换定额设备

  1. 在存储器群(其中包含将要被替换的那个磁盘)中配置一个新的定额设备。

    要替换旧的设备,首先要将该新定额设备添加到配置。 有关向群集中添加新的定额设备的信息,请参阅"4.1.2 如何添加定额设备"

  2. 删除用作定额设备的故障磁盘。

    有关从配置中删除旧的定额设备的信息,请参阅"4.1.3 如何删除定额设备"

  3. 替换故障磁盘。

    请参阅《Sun Cluster 3.0 12/01 Hardware Guide》中适用于您的磁盘群的硬件过程。

4.1.6 如何使定额设备处于维护状态

可以使用 scconf (1M) 命令来使定额设备进入维护状态。scsetup 实用程序当前无此功能。 您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

如果在较长的一段时间内不使用定额设备,请使之处于维护状态。 这样,磁盘设备的定额选票计数将设置为零,而且该设备在其维护期间不会算入定额计数。 在维护状态期间,定额设备的配置信息将被保留下来。


注意:

所有由两个节点组成的群集均要求至少配置一个定额设备。 如果这是由两个节点组成的群集中的最后一个定额设备,scconf 将无法使该设备处于维护状态。


要使群集节点处于维护状态,请参阅"6.1.7 如何使节点进入维护状态"

  1. 成为群集中任一个节点的超级用户。

  2. 使定额设备处于维护状态。


    # scconf -c -q globaldev=device,maintstate
    

    -c

    指定 scconf 命令的更改形式。

    -q

    管理定额选项。

    globaldev=device

    指定要更改的磁盘设备的 DID 名称,例如 d4

    maintstate

    使共享的定额设备处于维护状态。

  3. 检验该定额设备当前是否处于维护状态。

    已置于维护状态的设备所显示的定额设备选票数应为零。


    # scconf -p | grep -i quorum
    

4.1.6.1 示例 - 使定额设备处于维护状态

以下示例显示了如何使定额设备处于维护状态以及如何检验操作结果。


# scconf -c -q globaldev=d20,maintstate
# scconf -p | grep -i quorum
  Node quorum vote count:                          1
  Node quorum vote count:                          1
Quorum devices:                                    d20
Quorum device name:                                d20
  Quorum device votes:                             0
  Quorum device enabled:                           no
  Quorum device name:                              /dev/did/rdsk/d20s2
  Quorum device hosts (enabled):                   phys-schost-2 phys-schost-3
  Quorum device hosts (disabled):

4.1.6.2 从此处可转到何处

要重新启用定额设备,请参阅"4.1.7 如何使定额设备脱离维护状态"

要使节点处于维护状态,请参阅"6.1.7 如何使节点进入维护状态"

4.1.7 如何使定额设备脱离维护状态

如果某个定额设备已处于维护状态,而现在要使其返回联机状态,请使用以下过程将其定额选票计数重置为缺省值。对于群集节点,其缺省的定额计数为 1。 对于定额设备,其缺省的定额计数为 N-1,其中 N 是拥有非零选票计数的节点数,而且这些节点具有到定额设备的端口。

如果某个定额设备已处于维护状态并且现在您要使它脱离维护状态,就应该运行此过程。


小心:小心:

如果您既不指定 globaldev 选项,也不指定 node 选项,则会为整个群集重置定额计数。


要使群集节点及其相关的定额设备脱离维护状态,请参阅"6.1.8 如何使节点脱离维护状态"

  1. 成为群集中任一个节点的超级用户。

  2. 重置定额计数。


    # scconf -c -q globaldev=device,reset
    

    -c

    指定 scconf 命令的更改形式。

    -q

    管理定额选项。

    globaldev=device

    指定要重置的定额设备的 DID 名称,例如 d4

    reset

    更改标志,用于重置定额。

  3. 如果由于某个节点已处于维护状态而需要重置其定额计数,请重新引导该节点。

  4. 检验定额选票计数。


    # scconf -p | grep -i quorum
    

4.1.7.1 示例 - 重置定额选票计数(定额设备)

以下示例将一个定额设备的定额计数重置为缺省值并检验操作结果。


# scconf -c -q globaldev=d20,reset
# scconf -p | grep -i quorum
  Node quorum vote count:                          1
  Node quorum vote count:                          1
Quorum devices:                                    d20
Quorum device name:                                d20
  Quorum device votes:                             1
  Quorum device enabled:                           yes
  Quorum device name:                              /dev/did/rdsk/d20s2
  Quorum device hosts (enabled):                   phys-schost-2 phys-schost-3
  Quorum device hosts (disabled):

4.1.8 如何列出定额配置

您还可以使用 SunPlex Manager GUI 来完成此过程。 有关详细信息,请参阅 SunPlex Manager 的联机帮助。

您不必成为超级用户就可列出定额配置。

    使用 scconf(1M) 列出定额配置。


    # scconf -p | grep -i quorum
    

4.1.8.1 示例 - 列出定额配置


# scconf -p | grep "Quorum | vote"
 Node quorum vote count:                           1
 Node quorum vote count:                           1
Quorum devices:                                    d20
Quorum device name:                                d20
  Quorum device votes:                             1
  Quorum device enabled:                           yes
  Quorum device name:                              /dev/did/rdsk/d20s2
  Quorum device hosts (enabled):                   phys-schost-2 phys-schost-3
  Quorum device hosts (disabled):