本章介绍了使用 Sun StorEdge Availability Suite 3.2.1 软件管理数据复制的过程。本章包含以下几节:
开始创建保护组之前,可考虑采用以下策略:
在创建保护组之前停止应用程序
此策略最为直接。但是,由于保护组必须等到创建过程结束后方可联机,因此您必须先使应用程序资源组处于不受管理状态然后才可将其添加到保护组。
在应用程序保持联机时创建保护组
尽管此策略使您能够在不中断应用程序的情况下创建保护组,但它需要发出更多的命令。
在使用下面几节介绍的步骤创建保护组之前,请确保满足以下前提条件。
在两个群集上均已使用 Sun Cluster 软件配置了应用程序。
已为进行数据复制配置了相应的设备组。
要在应用程序资源组脱机时创建保护组,请执行以下步骤。
从一个群集上的节点创建保护组。
有关更多信息,请参见如何创建和配置 Sun StorEdge Availability Suite 3.2.1 保护组。
将数据复制设备组添加到该保护组。
有关更多信息,请参见如何将数据复制设备组添加至 Sun StorEdge Availability Suite 3.2.1 保护组。
使应用程序资源组处于不受管理状态。
将应用程序资源组添加到一个群集上的保护组。
有关更多信息,请参见如何将应用程序资源组添加至 Sun StorEdge Availability Suite 3.2.1 保护组。
在另一个群集上检索该保护组的配置。
有关更多信息,请参见如何将 Sun StorEdge Availability Suite 3.2.1 保护组配置复制到伙伴群集。
从任何一个群集,全局激活该保护组。
在不使应用程序脱机的情况下,要将现有的应用程序资源组添加到新的保护组,请在应用程序资源组处于联机状态的群集上执行以下步骤。
从一个群集上的节点创建保护组。
有关更多信息,请参见如何创建和配置 Sun StorEdge Availability Suite 3.2.1 保护组。
将数据复制设备组添加到该保护组。
有关更多信息,请参见如何将数据复制设备组添加至 Sun StorEdge Availability Suite 3.2.1 保护组。
从本地激活该保护组。
将应用程序资源组添加到该保护组。
有关更多信息,请参见如何将应用程序资源组添加至 Sun StorEdge Availability Suite 3.2.1 保护组。
在另一个群集上执行以下步骤。
检索保护组的配置。
有关更多信息,请参见如何将 Sun StorEdge Availability Suite 3.2.1 保护组配置复制到伙伴群集。
从本地激活该保护组。
此示例将在应用程序不脱机的情况下创建一个保护组。
在此示例中,apprg1 资源组在 cluster-paris 群集上处于联机状态。
在群集 cluster-paris 上创建保护组。
在该群集中某个已运行应用程序资源组的节点上,检查和修复资源组和与资源组具有关联的设备组之间可能存在的 Nodelist 不一致性。
创建具有匹配 Nodelist 的保护组。
phys-paris-1# scrgadm -pvv -g apprg1 | grep Nodelist (apprg1) Res Group Nodelist: phys-paris-1 phys-paris-2 phys-paris-1# scconf -pvv | grep "avsdg.*group node list" (avsdg) Device group node list: phys-paris-2, phys-paris-1 |
此处,设备组节点列表的顺序不同于资源组节点列表的顺序。可按如下所示更改设备组节点列表的顺序:
phys-paris-1# scconf -c -D name=avsdg,nodelist=phys-paris-1:phys-paris-2 |
您还可以对资源组的节点列表进行更改以满足要求。
创建的保护组具有与资源组和设备组的 Nodelist 相同的 Nodelist:
phys-paris-1# geopg create -d avs -p Nodelist=phys-paris-1,phys-paris-2 \ -o Primary -s paris-newyork-ps avspg phys-paris-1# Protection group "avspg" has been successfully created |
将 Sun StorEdge Availability Suite 3.2.1 设备组 avsdg 添加到该保护组。
phys-paris-1# geopg add-device-group -p Local_logical_host=lh-paris-1 \ -p Remote_logical_host=lh-newyork-1 -p Enable_volume_set=True avsdg avspg |
检验是否已创建了数据复制资源组和轻量资源组以及它们是否已联机。此外,还需检验是否已通过将 Enable-volume-set 属性设置为 True 而启用了 Sun StorEdge Availability Suite 3.2.1 卷集。
phys-paris-1# dsstat name t s pct role ckps dkps tps svt /avsdg/rdsk/d100 P L 100.00 net - 0 0 0 /avsdg/rdsk/d101 bmp 0 0 0 0 phys-paris-1# scstat -g -- Resource Groups and Resources -- Group Name Resources ---------- --------- Resources: geo-clusterstate - Resources: geo-infrastructure geo-clustername geo-hbmonitor geo-failovercontrol Resources: avsdg-stor-rg lh-paris-1 avsdg-stor Resources: avspg-rep-rg avsdg-rep-rs Resources: apprg1 avs-lh avs-stor avs-server-res avs-listener-res -- Resource Groups -- Group Name Node Name State ---------- --------- ----- Group: geo-clusterstate phys-paris-1 Online Group: geo-clusterstate phys-paris-2 Online Group: geo-infrastructure phys-paris-1 Online Group: geo-infrastructure phys-paris-2 Offline Group: avsdg-stor-rg phys-paris-1 Online Group: avsdg-stor-rg phys-paris-2 Offline Group: avspg-rep-rg phys-paris-1 Online Group: avspg-rep-rg phys-paris-2 Offline Group: apprg1 phys-paris-1 Online Group: apprg1 phys-paris-2 Offline -- Resources-- Resource Name Node Name State Status Message ------------- --------- ------ --------------- Resource: geo-clustername phys-paris-1 Online Online - \ LogicalHostname online Resource: geo-clustername phys-paris-2 Offline Offline - \ LogicalHostname offline Resource: geo-hbmonitor phys-paris-1 Online Online - \ Daemon OK Resource: geo-hbmonitor phys-paris-2 Offline Offline Resource: geo-failovercontrol phys-paris-1 Online Online Resource: geo-failovercontrol phys-paris-2 Offline Offline Resource: lh-paris-1 phys-paris-1 Online Online - \ LogicalHostname online Resource: lh-paris-1 phys-paris-2 Offline Offline Resource: avsdg-stor phys-paris-1 Online Online Resource: avsdg-stor phys-paris-2 Offline Offline Resource: avsdg-rep-rs phys-paris-1 Online Degraded - \ Logging Resource: avsdg-rep-rs phys-paris-2 Offline Offline Resource: avs-lh phys-paris-1 Online Online - \ LogicalHostname online Resource: avs-lh phys-paris-2 Offline Offline Resource: avs-server-res phys-paris-1 Online Online Resource: avs-server-res phys-paris-2 Offline Offline Resource: avs-listener-res phys-paris-1 Online Online Resource: avs-listener-res phys-paris-2 Offline Offline |
从本地激活该保护组。
phys-paris-1# geopg start -e local avspg Processing operation.... this may take a while.... Protection group "avspg" successfully started. |
将已联机的应用程序资源组添加至该保护组。
phys-paris-1# geopg add-resource-group apprg1 avspg Following resource groups were successfully inserted: "apprg1" |
验证是否已成功添加该应用程序资源组。
phys-paris-1# geoadm status Cluster: cluster-paris Partnership "paris-newyork-ps" : OK Partner clusters : newyork Synchronization : OK ICRM Connection : OK Heartbeat "hb_cluster-paris~cluster-newyork" monitoring \ "paris-newyork-ps" OK Plug-in "ping-plugin" : Inactive Plug-in "tcp_udp_plugin" : OK Protection group "avspg" : Unknown Partnership : paris-newyork-ps Synchronization : Error Cluster cluster-paris : Degraded Role : Primary Activation State : Activated Configuration : OK Data replication : Degraded Resource groups : OK Cluster cluster-newyork : Unknown Role : Unknown Activation State : Unknown Configuration : Unknown Data Replication : Unknown Resource Groups : Unknown |
在伙伴群集中的一个节点上,检索该保护组。
phys-newyork-1# geopg get -s paris-newyork-ps avspg Protection group "avspg" has been successfully created. |
检验是否已创建数据复制资源组和轻量资源组以及它们是否已联机。
phys-newyork-1# dsstat name t s pct role ckps dkps tps svt /avsdg/rdsk/d100 S L 100.00 net - 0 0 0 /avsdg/rdsk/d101 bmp 0 0 0 0 phys-newyork-1# scstat -g -- Resource Groups and Resources -- Group Name Resources ---------- --------- Resources: geo-clusterstate - Resources: geo-infrastructure geo-clustername geo-hbmonitor \ geo-failovercontrol Resources: avsdg-stor-rg lh-newyork-1 avsdg-stor Resources: avspg-rep-rg avsdg-rep-rs Resources: apprg1 avs-lh avs-stor avs-server-res avs-listener-res -- Resource Groups -- Group Name Node Name State ---------- --------- ----- Group: geo-clusterstate phys-newyork-1 Online Group: geo-clusterstate phys-newyork-2 Online Group: geo-infrastructure phys-newyork-1 Online Group: geo-infrastructure phys-newyork-2 Offline Group: avsdg-stor-rg phys-newyork-1 Online Group: avsdg-stor-rg phys-newyork-2 Offline Group: avspg-rep-rg phys-newyork-1 Online Group: avspg-rep-rg phys-newyork-2 Offline Group: apprg1 phys-newyork-1 Unmanaged Group: apprg1 phys-newyork-2 Unmanaged -- Resources -- Resource Name Node Name State Status Message ------------- --------- ------ --------------- Resource: geo-clustername phys-newyork-1 Online Online - \ LogicalHostname online Resource: geo-clustername phys-newyork-2 Offline Offline - \ LogicalHostname offline Resource: geo-hbmonitor phys-newyork-1 Online Online - Daemon OK Resource: geo-hbmonitor phys-newyork-2 Offline Offline Resource: geo-failovercontrol phys-newyork-1 Online Online Resource: geo-failovercontrol phys-newyork-2 Offline Offline Resource: lh-newyork-1 phys-newyork-1 Online Online - \ LogicalHostname online Resource: lh-newyork-1 phys-newyork-2 Offline Offline Resource: avsdg-stor phys-newyork-1 Offline Offline Resource: avsdg-stor phys-newyork-2 Offline Offline Resource: avsdg-rep-rs phys-newyork-1 Online Degraded - Logging Resource: avsdg-rep-rs phys-newyork-2 Offline Offline Resource: avs-lh phys-newyork-1 Offline Offline Resource: avs-lh phys-newyork-2 Offline Offline Resource: avs-server-res phys-newyork-1 Offline Offline Resource: avs-server-res phys-newyork-2 Offline Offline Resource: avs-listener-res phys-newyork-1 Offline Offline Resource: avs-listener-res phys-newyork-2 Offline Offline |
在伙伴群集上本地激活该保护组。
phys-newyork-1# geopg start -e local avspg Processing operation.... this may take a while.... Protection group "avspg" successfully started. |
检验是否已成功创建并激活该保护组。
在 cluster-paris 上运行 geoadm status 命令会产生如下输出:
phys-paris-1# geoadm status Cluster: cluster-paris Partnership "paris-newyork-ps": OK Partner clusters : cluster-newyork Synchronization : OK ICRM Connection : OK Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK Heartbeat plug-in "ping_plugin" : Inactive Heartbeat plug-in "tcp_udp_plugin": OK Protection group "tcpg" : OK Partnership : "paris-newyork-ps" Synchronization : OK Cluster cluster-paris : OK Role : Primary PG activation state : Activated Configuration : OK Data replication : OK Resource groups : OK Cluster cluster-newyork : OK Role : Secondary PG activation state : Activated Configuration : OK Data replication : OK Resource groups : OK |
本节介绍了以下任务的过程:
您可以创建不配置为使用数据复制的保护组。要创建不使用数据复制子系统的保护组,请在使用 geopg 命令时省略 -d datareplicationtype选项。geoadm status 命令显示数据复制的状态为 NONE。
确保满足以下条件:
本地群集是伙伴关系的成员。
您要创建的保护组尚不存在。
保护组的名称在全局的 Sun Cluster Geographic Edition 名称空间中是唯一的。不能在同一系统的两个伙伴关系中使用相同的保护组名称。
您还可以将现有的保护组配置从远程群集复制到本地群集。有关更多信息,请参见将 Sun StorEdge Availability Suite 3.2.1 保护组配置复制到伙伴群集。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
使用 geopg create 命令创建一个新的保护组。
此命令将在本地群集的所有节点上创建一个保护组。
# geopg create -s partnershipname -d avs \ -o localrole [-p property [-p...]] \ protectiongroupname |
指定伙伴关系的名称。
指定通过 Sun StorEdge Availability Suite 3.2.1 软件来复制保护组数据。
指定此保护组在本地群集上的角色为主或辅助。
指定保护组的属性。
可指定以下属性:
Description – 描述保护组。
Timeout – 以秒为单位指定保护组的超时时限。
Enable_volume_set – 如果设置为 true,则创建保护组时将会自动启用卷集。
有关自动启用卷集的更多信息,请参见启用 Sun StorEdge Availability Suite 3.2.1 卷集。
Nodelist – 列出可以在保护组中作为设备组主角色的计算机的主机名。
有关可设置的属性的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 A “标准 Sun Cluster Geographic Edition 属性”。
指定保护组的名称。
有关 Sun Cluster Geographic Edition 软件所支持的名称和值的信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 B “Sun Cluster Geographic Edition 实体合法的名称和值”。
有关 geopg 命令的更多信息,请参阅 geopg(1M) 手册页。
创建保护组之前,数据复制层将验证配置是否正确。
如果验证成功,则本地 Configuration 状态将被设置为 OK 并且 Synchronization 状态将被设置为 Error。
如果验证不成功,则不会创建保护组。
此示例将在被设置为主群集的 cluster-paris 群集上创建一个 Sun StorEdge Availability Suite 3.2.1 保护组。
phys-paris-1# geopg create -s paris-newyork-ps -d avs -o primary \ -p Nodelist=phys-paris-1,phys-paris-2 avspg |
确保本地存在要修改的保护组。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
修改保护组的配置
如果伙伴群集包含具有相同名称的保护组,则 geopg set-prop 命令还会将新的配置信息传递给伙伴群集。
# geopg set-prop -p property[-p...] protectiongroupname |
指定保护组的属性。
有关可设置的属性的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 A “标准 Sun Cluster Geographic Edition 属性”。
指定保护组的名称。
geopg set-prop 命令会用新的配置信息来重新验证保护组。如果在本地群集上验证不成功,则不会修改保护组的配置。否则,本地群集上的 Configuration 状态将被设置为 OK。
如果本地群集上的 Configuration 状态为 OK,但伙伴群集上的验证不成功,则伙伴群集上的 Configuration 状态将被设置为 Error。
有关 Sun Cluster Geographic Edition 软件所支持的名称和值的信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 B “Sun Cluster Geographic Edition 实体合法的名称和值”。
有关 geopg 命令的更多信息,请参阅 geopg(1M) 手册页。
此示例将修改示例 2–2 中所创建的保护组的 timeout 属性。
# geopg set-prop -p Timeout=300 avspg |
如果保护组的 Configuration 状态在 geoadm status 的输出中显示为 Error,则您可以使用 geopg validate 命令对该配置进行验证。此命令可检查保护组及其实体的当前状态。
如果保护组及其实体是有效的,则保护组的配置状态将被设置为正常。如果 geopg validate 命令在配置文件中发现了错误,它将显示一条有关该错误的消息,并且配置将保持错误状态。在这种情况下,您可以修正配置中的错误,然后再次运行 geopg validate 命令。
此命令仅对本地群集上保护组的配置进行验证。要验证伙伴群集上的保护组配置,请再次在伙伴群集上运行该命令。
在验证保护组的配置之前,请确保本地存在要进行验证的保护组,而且伙伴双方群集所有节点上的通用代理容器均处于联机状态。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
验证保护组的配置。
此命令仅对本地群集上保护组的配置进行验证。
# geopg validate protectiongroupname |
指定标识单个保护组的唯一名称
本示例对保护组进行验证。
# geopg validate avspg |
在保护组验证期间,Sun StorEdge Availability Suite 3.2.1 数据复制层对应用程序资源组和数据复制实体进行如下验证:
验证保护组中应用程序资源组的 Auto_start_on_new_cluster 属性是否已设置为 False。
将 Auto_start_on_new_cluster 属性设置为 False 可防止 Sun Cluster 资源组管理器自动启动保护组中的资源组。因此,在 Sun Cluster Geographic Edition 软件重新启动之后与远程群集进行通信以确保远程群集正在运行并且远程群集是该资源组的辅助群集。Sun Cluster Geographic Edition 软件不会自动在主群集上启动资源组。
激活保护组后,应用程序资源组应仅在主群集上处于联机状态。
检验与 HAStoragePlus 资源所定义的设备组相关联的应用程序资源组的 Nodelist 属性,确定该属性是否与保护组的 Nodelist 属性包含相同的条目,且条目顺序相同。
检验保护组中设备组的 Nodelist 属性是否与保护组的 Nodelist 属性包含相同的条目,且条目顺序相同。
验证是否已为该保护组中的每个设备组创建了轻量资源组。每个轻量资源组均包含两种资源:逻辑主机名资源和 HAStoragePlus 资源。有关轻量资源组及其资源的更多信息,请参见Sun StorEdge Availability Suite 3.2.1 轻量资源组。
检验在保护组的每个设备组的复制资源组中是否已创建 GeoCtlAVS 类型的复制资源。有关复制资源组格式的信息,请参见Sun StorEdge Availability Suite 3.2.1 复制资源组。
检验轻量资源组和复制资源组的 Nodelist 属性是否与保护组的 Nodelist 属性包含相同的条目,且条目顺序也相同。
如果已成功验证的设备组的 Enable_volume_set 属性被设置为 True,则将启用 /var/cluster/geo/avs/avsdg-volset.ini 文件中定义的卷集。设备组的其他卷集则被禁用。如果希望启用其他卷集,则可以将这些卷集添加到 /var/cluster/geo/avs/avsdg-volset.ini 文件,或将 Enable_volume_set 属性设置为 False。
验证完成时,Sun Cluster Geographic Edition 软件将创建轻量资源组、复制资源组以及此复制资源组的资源(如果不存在的话),并使它们进入联机状态。如果具有相同名称的资源组或资源已经存在,则 Sun Cluster Geographic Edition 操作可能会修改它们的属性。Sun Cluster Geographic Edition 软件无法创建具有相同名称的新资源组或资源(如果已经有一个存在)。
成功地完成验证后,Configuration 状态将被设置为 OK。如果验证不成功,则 Configuration 状态将被设置为 Error。
要将某个保护组从所有群集上删除,请在该保护组所在的每个群集上运行 geopg delete 命令。
在删除保护组之前,请确保满足以下条件。
该保护组在本地存在。
该保护组在本地群集上处于脱机状态。
要在删除保护组的同时保持应用程序资源组的联机状态,您必须从该保护组删除这些应用程序资源组。
登录至希望从中删除该保护组的群集(如 cluster-paris)内的一个节点上。
cluster-paris 是主群集。有关群集配置范例,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 群集配置示例”。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
删除该保护组。
此命令可从本地群集删除保护组的配置。该命令还可以删除保护组中每个设备组的轻量资源组和复制资源组。
# geopg delete protectiongroupname |
指定保护组的名称。
如果删除不成功,则 Configuration 状态将被设置为 Error。请修正导致错误的原因,然后重新运行 geopg delete 命令。
本示例从两个伙伴群集上删除保护组。
# rlogin cluster-paris -l root cluster-paris# geopg delete avspg # rlogin cluster-newyork -l root cluster-newyork# geopg delete avspg |
以下示例在使两个应用程序资源组(apprg1 和 apprg2)保持联机状态的同时删除了由它们共同组成的保护组 avspg。
从保护组中删除应用程序资源组,然后再删除该保护组。
# geopg remove-resource-group apprg1,apprg2 avspg # geopg stop -e global avspg # geopg delete avspg |
要使应用程序具有高可用性,必须将该应用程序作为一种资源在应用程序资源组中进行管理。
您在主群集上为应用程序资源组配置的所有实体(比如应用程序数据资源、配置文件和资源组)都必须复制到辅助群集。资源组的名称在这两个群集上必须相同。而且,应用程序资源使用的数据也必须被复制到辅助群集上。
本节介绍了以下任务的信息:
您可以将现有的资源组添加到保护组的应用程序资源组列表中。将应用程序资源组添加到保护组之前,请确保满足以下条件:
已定义该保护组。
要添加的资源组在两个群集上均已存在,并且处于适当的状态。
资源组的 Auto_start_on_new_cluster 属性已设置为 False。您可以使用 scrgadm 命令查看该属性。
# scrgadm -pvv -g apprg1 | grep Auto_start_on_new_cluster |
将 Auto_start_on_new_cluster 属性设置为 False,如下所示:
# scrgadm -c -g apprg1 -y Auto_start_on_new_cluster=False |
将 Auto_start_on_new_cluster 属性设置为 False 可以防止 Sun Cluster 资源组管理器自动启动保护组中的资源组。因此,在 Sun Cluster Geographic Edition 软件重新启动之后与远程群集进行通信以确保远程群集正在运行并且远程群集是该资源组的辅助群集。Sun Cluster Geographic Edition 软件不会自动在主群集上启动资源组。
激活保护组后,应用程序资源组应仅在主群集上处于联机状态。
与资源所定义的设备组相关联的故障转移应用程序资源组的 Nodelist 属性必须与保护组的 Nodelist 属性包含相同的条目,且条目顺序相同。
该应用程序资源组与此保护组外部的资源组和资源绝不能具有依赖性。要添加几个具有依赖关系的应用程序资源组,您必须在单个操作中将所有具有依赖关系的应用程序资源组添加到该保护组。如果单独添加这些应用程序资源组,则操作会失败。
保护组的状态可以是已激活或已取消激活,资源组的状态可以是联机或未受管理。
保护组的配置更改后,如果资源组的状态是未受管理,并且保护组的状态为已激活,则保护组的本地状态将变为错误。
如果要添加的资源组处于 Online 状态并且已取消激活保护组,则请求将被拒绝。在添加联机资源组之前,必须先激活保护组。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
将应用程序资源组添加到该保护组。
# geopg add-resource-group resourcegrouplist protectiongroup |
指定应用程序资源组的名称。
您可以在逗号分隔的列表中指定多个资源组。
指定保护组的名称。
此命令将应用程序资源组添加到本地群集上的保护组。如果伙伴群集上包含有相同名称的保护组,则该命令会将新的配置信息传播给伙伴群集。
有关 Sun Cluster Geographic Edition 软件所支持的名称和值的信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 B “Sun Cluster Geographic Edition 实体合法的名称和值”。
如果在本地群集上添加操作不成功,则不会修改保护组的配置。否则,本地群集上的 Configuration 状态将被设置为 OK。
如果本地群集上的配置状态为正常,但伙伴群集上的添加操作不成功,则伙伴群集上的配置状态将被设置为错误。
将应用程序资源组添加到保护组后,该应用程序资源组将被作为保护组的一个实体进行管理。此后,该应用程序资源组将会受到保护组操作(如启动、停止、切换和接管)的影响。
如果该应用程序资源组是故障转移类型的资源组,它与同一保护组中的某个设备组具有关联,则 Sun Cluster Geographic Edition 软件会更改它的 RG_affinities 属性,使之包括一个与内部资源组(称为轻量资源组)的牢固正关联。此关联包括故障转移委托。
该应用程序资源组绝不能与其他资源组之间存在带有故障转移委托的牢固正关联。否则,在轻量资源组上添加带有故障转移委托的牢固正关联将会失败。
Sun Cluster Geographic Edition 软件还会在应用程序资源组中的 HAStoragePlus 资源和轻量资源组中的 HAStoragePlus 资源之间为此设备组建立牢固的依赖性。保护组进入联机状态或将联机的应用程序资源组添加到联机的保护组时,会发生此重定向。
请勿修改应用程序资源组和轻量资源组之间的依赖性和资源组关联。
以下示例向 avspg 中添加了 apprg1 和 apprg2 两个应用程序资源组。
# geopg add-resource-group apprg1,apprg2 \ avspg |
您可以在不改变应用程序资源组的状态或内容的情况下从保护组删除应用程序资源组。
确保满足以下条件:
在本地群集上已定义该保护组。
要删除的资源组属于保护组的应用程序资源组。例如,您不能删除属于数据复制管理实体的资源组。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
从保护组中删除应用程序资源组:
此命令从本地群集上的保护组中删除应用程序资源组。如果伙伴群集中包含具有相同名称的保护组,则还会从伙伴群集的保护组中删除该应用程序资源组。
# geopg remove-resource-group resourcegrouplist \ protectiongroup |
指定应用程序资源组的名称。
您可以在逗号分隔的列表中指定多个资源组。
指定保护组的名称。
如果即将删除的资源组与保护组中的其他资源组存在依赖性,则必须同时删除与即将删除的资源组存在依赖性的其他所有资源组。
如果本地群集上的删除操作失败,则系统不会修改保护组的配置。否则,本地群集上的 Configuration 状态将被设置为 OK。
如果本地群集上的配置状态为正常,但伙伴群集上的删除操作不成功,则伙伴群集上的配置状态将被设置为错误。
Sun Cluster Geographic Edition 软件将删除应用程序资源组和轻量资源组之间的关联和资源依赖性。
以下示例从 avspg 中删除了 apprg1 和 apprg2 两个应用程序资源组。
# geopg remove-resource-group apprg1,apprg2 \ avspg |
本节介绍如何在 Sun StorEdge Availability Suite 3.2.1 保护组中管理数据复制设备组,包括以下任务:
有关配置 Sun StorEdge Availability Suite 3.2.1 保护组的详细信息,请参见如何创建和配置 Sun StorEdge Availability Suite 3.2.1 保护组。
保护组是应用程序资源组的容器,它包含了保护服务免于灾难的数据。Sun Cluster Geographic Edition 软件通过将数据从主群集复制到辅助群集对其进行保护。通过将 Sun Cluster 设备组添加到保护组,Sun Cluster Geographic Edition 软件可以监视属于 Sun StorEdge Availability Suite 3.2.1 卷集的设备组中所有卷的复制状态。Sun Cluster Geographic Edition 软件还在执行保护组操作(如启动、停止、切换和接管)期间控制卷集的角色和状态。
将设备组添加到保护组之前,请确保满足以下条件:
在本地群集上已定义该保护组。
该保护组在本地群集和伙伴群集上均已脱机(如果可以访问该伙伴群集)。
该设备组在本地群集和伙伴群集上均存在。
设备组的 Nodelist 属性与保护组的 Nodelist 属性包含相同的条目,且条目顺序相同。
Local_logical_host 属性指定本地群集可接受的有效主机名,这是为此设备组保留的。
Remote_logical_host 属性指定远程群集可接受的有效主机名,已为此设备组保留。
如果 Enable_volume_set 属性被设置为 true,则在伙伴双方群集的所有节点上都必须存在 /var/cluster/geo/avs/avsdg-volset.ini 文件并且必须包含有效的条目。有关配置此文件的信息,请参见启用 Sun StorEdge Availability Suite 3.2.1 卷集。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
将数据复制设备组添加到该保护组。
此命令将设备组添加到本地群集上的保护组,并且将新的配置传播给伙伴群集(如果伙伴群集包含具有相同名称的保护组)。
# geopg add-device-group -p property [-p...] \ AVSdevicegroupname protectiongroupname |
指定数据复制设备组的属性。
您可以指定以下 Sun StorEdge Availability Suite 3.2.1 属性:
Local_logical_host – 指定用于复制设备组的本地逻辑主机名。
Remote_logical_host – 指定用于复制设备组的远程逻辑主机名。
Enable_volume_set – 指定是否应自动启用文件中的卷集。可设置为 True 或 False。
有关可设置的属性的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 A “标准 Sun Cluster Geographic Edition 属性”。
指定新数据复制设备组的名称。
指定将包含新的数据复制设备组的保护组的名称。
有关 Sun Cluster Geographic Edition 软件所支持的名称和值的信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 B “Sun Cluster Geographic Edition 实体合法的名称和值”。
有关 geopg 命令的更多信息,请参阅 geopg(1M) 手册页。
此示例将在 avspg 保护组中创建一个 Sun StorEdge Availability Suite 3.2.1 数据复制设备组。
# geopg add-device-group -p Local_logical_host=lh-paris-1 \ -p Remote_logical_host=lh-newyork-1 avsdg avspg |
由 Sun StorEdge Availability Suite 3.2.1 控制的设备组被添加至保护组后,数据复制层会检验该设备组是否存在,还会检验其 Nodelist 属性值是否与保护组的 Nodelist 属性包含相同的条目且条目的顺序是否相同。
运行 geopg add-device-group 命令时,系统将创建该设备组的轻量资源组并使其进入联机状态。该轻量资源组包含以下资源:
用于进行数据复制的逻辑主机名资源,在 Local_logical_host 属性中指定
HAStoragePlus 资源,用于控制具有轻量资源组的设备组的配置
有关轻量资源组及其资源的更多信息,请参见Sun StorEdge Availability Suite 3.2.1 轻量资源组。
运行 geopg add-device-group 命令时,系统将在保护组的每个设备组的复制资源组中创建 GeoCtlAVS 类型的复制资源,并使其进入联机状态。有关复制资源组格式的信息,请参见Sun StorEdge Availability Suite 3.2.1 复制资源组。
轻量资源组和复制资源组的 Nodelist 属性与保护组的 Nodelist 属性包含相同的条目,且条目的顺序相同。
如果在本地群集上已经配置了具有相同名称的资源或资源组,则 Sun Cluster Geographic Edition 将对配置进行验证,并在配置不正确的情况下将 Configuration 设置为 Error。
如果此设备组的 Enable_volume_set 属性已设置为 True,则系统将启用 /var/cluster/geo/avs/AVS-devicegroup-volset.ini 文件中定义的卷集。否则,Sun Cluster Geographic Edition 软件将控制和监视使用 Sun StorEdge Availability Suite 3.2.1 命令手动启用的所有卷集。
如果 geopg add-device-group 命令执行不成功,则不会修改该保护组的配置。
如果 geopg add-device-group 命令执行成功,并且本地群集上的 Configuration 状态已设置为 OK,则新的配置将传播到伙伴群集中。此传播将导致在伙伴群集上对整个保护组配置进行重新验证。在重新验证期间,系统将在伙伴群集上创建相同的实体,包括轻量资源组和复制资源组。此外,如果伙伴群集上存在 /var/cluster/geo/avs/AVS-devicegroup-volset.ini 文件,并且该文件包含了正确定义的卷集,则伙伴群集上也将启用卷集。如果验证不成功,则伙伴群集上的 Configuration 状态将被设置为 Error。
请不要更改、删除这些资源或资源组,也不要使其处于脱机状态。由于轻量资源组、复制资源组以及资源都是 Sun Cluster Geographic Edition 软件管理的内部实体,因此仅可使用 Sun Cluster Geographic Edition 命令来管理它们。直接使用 Sun Cluster 命令更改这些实体的配置或状态可能会导致不可修复的故障。
如果成功验证了伙伴群集中的设备组,并且该设备组的 Enable_volume_set 属性已设置为 true,则伙伴群集上将启用 /var/cluster/geo/avs/AVS-devicegroup-volset.ini 文件中所定义的卷集。而设备组的其他卷集将被禁用。
将设备组添加到保护组后,您可以使用 Sun StorEdge Availability Suite 3.2.1 命令直接启用或禁用设备组的卷集。只有在第一次成功验证包含设备组的保护组时才使用 /var/cluster/geo/avs/AVS-devicegroup-volset.ini 文件。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
修改该设备组。
此命令可修改本地群集上的保护组中设备组的属性。如果伙伴群集包含有相同名称的保护组,则该命令会将新的配置传播给伙伴群集。
# geopg modify-device-group -p property [-p...] \ AVSdevicegroupname protectiongroupname |
指定数据复制设备组的属性。
有关可设置的属性的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的附录 A “标准 Sun Cluster Geographic Edition 属性”。
指定新数据复制设备组的名称。
指定将包含新的数据复制设备组的保护组的名称。
如果曾将某个数据复制设备组添加到保护组中,则您可能需要从保护组中将其删除。一般而言,将某应用程序配置为写入一组磁盘之后,您就不会更改这些磁盘。
在删除数据复制设备组之前,请确保满足以下条件:
在本地群集上已定义该保护组。
该保护组在本地群集和伙伴群集上均已脱机(如果可以访问该伙伴群集)。
该设备组是由该保护组进行管理的。
有关删除保护组的信息,请参阅如何删除 Sun StorEdge Availability Suite 3.2.1 保护组。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
删除该设备组。
此命令从本地群集上的保护组中删除设备组。如果伙伴群集包含有相同名称的保护组,则该命令会将新的配置传播给伙伴群集。
此命令从保护组删除设备组。此命令还将禁用与该设备组相关联的所有卷集,并删除此设备组的轻量资源组和复制资源组。
# geopg remove-device-group AVSdevicegroupname protectiongroupname |
指定数据复制设备组的名称
指定保护组的名称
此示例将从 Sun StorEdge Availability Suite 3.2.1 保护组中删除一个数据复制设备组。
# geopg remove avsdg avspg |
在两个群集上配置数据复制、资源组和资源的操作前后,您均可以将保护组的配置复制到伙伴群集。
将 Sun StorEdge Availability Suite 3.2.1 保护组的配置复制到伙伴群集前,请确保满足以下条件:
该保护组是在远程群集上定义的,而不是在本地群集上。
远程群集上保护组中的设备组存在于本地群集上。
远程群集上保护组中的应用程序资源组存在于本地群集上。
资源组的 Auto_start_on_new_cluster 属性已设置为 False。您可以使用 scrgadm 命令查看该属性。
# scrgadm -pvv -g apprg1 | grep Auto_start_on_new_cluster |
将 Auto_start_on_new_cluster 属性设置为 False,如下所示:
# scrgadm -c -g apprg1 -y Auto_start_on_new_cluster=False |
将 Auto_start_on_new_cluster 属性设置为 False 可以防止 Sun Cluster 资源组管理器自动启动保护组中的资源组。因此,在 Sun Cluster Geographic Edition 软件重新启动之后与远程群集进行通信以确保远程群集正在运行并且远程群集是该资源组的辅助群集。Sun Cluster Geographic Edition 软件不会自动在主群集上启动资源组。
激活保护组后,应用程序资源组应仅在主群集上处于联机状态。
登录至 phys-newyork-1。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
使用 geopg get 命令将保护组配置复制到伙伴群集。
此命令从远程群集检索保护组的配置信息,然后在本地群集上创建保护组。
# geopg get -s partnershipname \ AVSprotectiongroup |
指定从中收集保护组配置信息的伙伴关系的名称
指定保护组的名称
geopg get 命令可复制与 Sun Cluster Geographic Edition 相关的实体。有关如何复制 Sun Cluster 实体的信息,请参见《Sun Cluster Data Services Planning and Administration Guide for Solaris OS》中的“Replicating and Upgrading Configuration Data for Resource Groups, Resource Types, and Resources”。
以下示例将 avspg 的配置复制到了 cluster-newyork 中。
从远程群集(在此示例中是 cluster-paris)检索保护组的配置,然后由本地群集 cluster-newyork 上的数据复制子系统进行验证。
如果验证成功,则 Configuration 状态将被设置为 OK,并且将在本地群集上创建保护组。此保护组包含一个设备组和一个应用程序资源组,它们与远程群集上的设备组和应用程序资源组的配置几乎完全相同。
如果验证失败,则 Configuration 状态将被设置为 Error。修正引起错误的原因并重新验证保护组,或者删除本地群集上的无效保护组。
# rlogin phys-newyork-1 -l root phys-newyork-1# geopg get -s paris-newyork-ps avspg |
激活保护组时,它承担着配置期间指定给它的角色。
有关配置保护组的更多信息,请参见如何创建和配置 Sun StorEdge Availability Suite 3.2.1 保护组。
可以通过以下几种方式激活保护组:
全局,即在配置了保护组的两个群集上激活该保护组
仅在主群集上
仅在辅助群集上
激活保护组时,您所用的数据复制产品决定了哪个群集上可以启动数据复制。例如,Sun StorEdge Availability Suite 3.2.1 软件仅允许从主群集启动数据复制。因此,如果从辅助群集激活保护组,数据复制便不会启动。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
激活该保护组。
此命令在本地群集上激活保护组。
如果您在主群集上激活保护组,则其应用程序资源组也会进入联机状态。
# geopg start -e scope [-n] AVSprotectiongroup |
指定命令的范围。
如果该范围为 Local,则该命令仅在本地群集上生效。如果该范围为 Global,则该命令在部署保护组的两个群集上均会生效。
属性值(例如 Global 和 Local)不区分大小写。
防止在启动保护组时启动数据复制。
如果省略此选项,则在保护组启动时将启动数据复制子系统,并且该命令会在保护组中的每个设备组上执行以下操作:
验证为复制资源配置的角色是否与本地群集上保护组的角色相同。
验证与设备组相关联的卷集的角色是否与本地群集上保护组的角色相同。
如果本地群集上的保护组的角色为 secondary,请卸载所有与设备组相关联的卷集中所定义的本地卷。
如果在本地群集上保护组的角色为 primary,请启用 Sun StorEdge Availability Suite 3.2.1 远程镜像软件的自动同步特性。此外,请重新同步与设备组相关联的卷集。
指定保护组的名称。
geopg start 命令使用 scswitch -Z -g resourcegroups 命令使资源组和资源联机。有关使用此命令的更多信息,请参见 scswitch(1M) 手册页。
如果保护组在本地群集上的角色为主,则 geopg start 命令将执行以下操作:
此命令会运行 RoleChange_ActionCmd 中定义的脚本。
此命令使保护组中的应用程序资源组在本地群集上进入联机状态。
如果应用程序资源组是故障转移类型的资源组,且它与同一保护组中的某个设备组具有关联,则此命令会在应用程序资源组和轻量资源组之间添加牢固的正关联和故障转移委托。
该应用程序资源组绝不能具有带有故障转移委托的牢固正关联。否则,在轻量资源组上添加带有故障转移委托的牢固正关联将会失败。
该命令在应用程序资源组中的 HAStoragePlus 资源和轻量资源组中的 HAStoragePlus 资源之间为此设备组建立牢固的依赖性。
如果该命令失败,则 Configuration 状态可能会被设置为 Error,这取决于故障的原因。保护组会保持已取消激活的状态,但此时数据复制可能已启动,并且某些资源组可能已进入联机状态。请运行 geoadm status 命令获取系统的状态。
如果 Configuration 状态被设置为 Error,请使用如何验证 Sun StorEdge Availability Suite 3.2.1 保护组介绍的过程重新验证保护组。
以下示例以全局方式激活了一个保护组。
# geopg start -e global avspg |
以下示例仅在本地群集上激活了一个保护组。根据群集角色,此本地群集可能是主群集或辅助群集。
# geopg start -e local avspg |
可以通过以下几种方式取消激活保护组:
全局,即在配置保护组的主群集和辅助群集上均取消激活保护组
仅在主群集上
仅在辅助群集上
在主群集或辅助群集上取消激活保护组的结果取决于正在使用的数据复制类型。如果使用的是 Sun StorEdge Availability Suite 3.2.1 软件,则仅能从主群集停止数据复制。因此,在辅助群集上取消激活保护组时,此取消激活命令并不会停止数据复制。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
取消激活该保护组。
此命令将在本地群集的所有节点上取消激活保护组。
取消激活保护组时,它的应用程序资源组也会进入未受管理状态。
# geopg stop -e scope [-D] protectiongroupname |
指定命令的范围。
如果该范围为 Local,则该命令仅在本地群集上生效。如果该范围为 Global,则该命令在部署保护组的两个群集上均会生效。
属性值(例如 Global 和 Local)不区分大小写。
指定仅停止数据复制并且保持保护组的联机状态。
如果省略此选项,则数据复制子系统和保护组均会停止。如果本地群集上保护组的角色为 primary,则省略 -d 选项还会导致以下操作:
在保护组中的应用程序资源组和内部资源组之间删除资源组关联和资源依赖性
使应用程序资源组脱机,并将它们置于未受管理状态
指定保护组的名称。
如果在本地群集上保护组的角色为 primary,则 geopg stop 命令将禁用每个设备组的自动同步,并使卷集进入记录模式。
如果 geopg stop 命令失败,请运行 geoadm status 命令查看每个组件的状态。例如,根据失败的原因,配置状态可能会被设置为错误。即使某些资源组可能处于未受管理状态,保护组仍可能保持已激活状态。还可以在进行数据复制时取消激活保护组。
如果 Configuration 状态被设置为 Error,请使用如何验证 Sun StorEdge Availability Suite 3.2.1 保护组介绍的过程重新验证保护组。
以下示例取消激活了处在所有群集上的一个保护组。
# geopg stop -e global avspg |
以下示例取消激活了处在本地群集上的一个保护组。
# geopg stop -e local avspg |
以下示例在本地群集上仅停止了数据复制。
# geopg stop -e local -D avspg |
如果管理员决定以后再取消激活保护组及其底层的数据复制子系统,则届时可以重新运行不带 -d 选项的命令。
# geopg stop -e local avspg |
以下示例在使 apprg1 和 apprg2 两个应用程序资源组保持联机状态的同时取消激活了它们的保护组 avspg。
从保护组中删除应用程序资源组。
# geopg remove-resource-group apprg1,apprg2 avspg |
取消激活该保护组。
# geopg stop -e global avspg |
对于具有从伙伴群集检索到的配置信息的本地保护组,您可以重新同步它的配置信息。保护组的 Synchronization 状态在 geoadm status 命令的输出中显示为 Error 时,需要对该保护组进行重新同步。
例如,在引导群集后,您可能需要重新同步保护组。有关更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“引导群集”。
重新同步保护组仅更新与 Sun Cluster Geographic Edition 相关的实体。有关如何更新 Sun Cluster 实体的信息,请参见《Sun Cluster Data Services Planning and Administration Guide for Solaris OS》中的“Replicating and Upgrading Configuration Data for Resource Groups, Resource Types, and Resources”。
必须在运行 geopg update 命令的群集上取消激活该保护组。
登录到一个群集节点。
要完成此过程,必须为您指定 Geo Management RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
重新同步该保护组。
# geopg update protectiongroupname |
指定保护组的名称
以下示例对一个保护组进行了重新同步。
# geopg update avspg |
您可以获取复制状态的概览以及来自复制资源组状态的 Sun StorEdge Availability Suite 3.2.1 软件更为详细的运行时状态。以下几节介绍了每种状态的检查过程。
每个 Sun StorEdge Availability Suite 数据复制资源的状态指出了特定设备组上的复制状态。保护组中所有资源的状态汇总到复制状态中。
要查看整体的复制状态,请按以下过程所述查看保护组的状态。
访问一个已定义保护组的群集节点。
要完成此过程,必须为您指定 Basic Solaris User RBAC 权限配置文件。有关 RBAC 的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“Sun Cluster Geographic Edition 软件和 RBAC”。
检查复制的运行时状态。
# geoadm status |
有关复制信息,请参阅输出内容中的 Protection Group 部分。此命令显示的信息包含以下内容:
是否为参与伙伴关系启用本地群集
伙伴关系中是否涉及到本地群集
心跳配置的状态
已定义的保护组的状态
当前事务的状态
检查每个 Sun StorEdge Availability Suite 3.2.1 保护组的数据复制的运行时状态。
# scstat -g |
请参阅针对您要检查的数据复制设备组所显示的 Status 和 Status Message 字段。有关这些字段的更多信息,请参见表 2–1。
每个保护组都会有一个复制资源组与之对应。复制资源组的名称具有以下格式:
avsprotectiongroupname-rep-rg |
如果将 Sun StorEdge Availability Suite 3.2.1 设备组添加到保护组,则 Sun Cluster Geographic Edition 软件将为每个设备组创建一个资源。此资源监视其设备组的复制状态。每个资源的名称具有以下格式:
avsdevicegroupname-rep-rs |
您可以监视复制资源组的状态以提供复制的整体状态。使用 scstat -g 命令获取复制资源组的 State 和 Status Message 的值。当资源联机时,State 的值为 Online。
下表介绍了当 Sun StorEdge Availability Suite 3.2.1 复制资源组的 State 为 Online 时,scstat 命令所返回的 Status 值和 State Message 值。
表 2–1 联机的 Sun StorEdge Availability Suite 3.2.1 复制资源组的状态和状态消息
状态 |
状态消息 |
---|---|
有故障的 |
Replication service disabled |
有故障的 |
Incorrect role |
有故障的 |
Volume failed |
有故障的 |
Bitmap failed |
有故障的 |
Queue failed |
有故障的 |
Need sync |
有故障的 |
Need reverse sync |
有故障的 |
Reverse synching |
已降级 |
Synching |
已降级 |
Queuing |
已降级 |
Logging |
联机 |
Replicating |
有关这些值的更多详细信息,请参阅《Sun StorEdge Availability Suite 3.2.1 Remote Mirror Software Administration and Operations Guide》。
有关 scstat 命令的更多信息,请参见 scstat(1M) 手册页。