跳过导航链接 | |
退出打印视图 | |
![]() |
Oracle Solaris Cluster 软件安装指南 Oracle Solaris Cluster 3.3 3/13 (简体中文) |
1. 规划 Oracle Solaris Cluster 配置
如何在所有节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在所有节点上配置 Oracle Solaris Cluster 软件 (XML)
如何安装 Oracle Solaris 和 Oracle Solaris Cluster 软件 (JumpStart)
如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (XML)
如何配置网络时间协议 (Network Time Protocol, NTP)
本节介绍了建立新的全局群集或向现有群集中添加节点的相关信息和过程。全局群集节点可以是物理计算机、(仅 SPARC)Oracle VM Server for SPARC I/O 域或(仅 SPARC)Oracle VM Server for SPARC 来宾域。一个群集可以包含上述任意节点类型的组合。开始执行这些任务之前,请确保您已按照安装软件所述安装了 Oracle Solaris OS、Oracle Solaris Cluster 框架及其他产品的软件包。
下面的任务列表分别列出了建立新的全局群集时以及向现有全局群集中添加节点时要执行的任务。按照以下顺序完成操作。
表 3-1 任务列表:建立新的全局群集
|
表 3-2 任务列表:向现有全局群集中添加节点
|
请从全局群集的一个节点中执行此过程,以便在群集的所有节点上配置 Oracle Solaris Cluster 软件。
注 - 此过程使用的是 scinstall 命令的交互形式。要使用 scinstall 命令的非交互形式(例如在开发安装脚本时),请参见 scinstall(1M) 手册页。
确保在运行 scinstall 命令之前,在节点上安装了 Oracle Solaris Cluster 软件包(无论是通过手动形式还是使用 installer 程序的无提示模式)。有关从安装脚本运行 installer 程序的信息,请参见《Sun Java Enterprise System 5 Update 1 Installation Guide for UNIX》中的第 5 章 "Installing in Silent Mode"。
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件和创建域。
确保在每个节点上安装了 Oracle Solaris Cluster 软件包和修补程序。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确定您将使用 scinstall 实用程序的哪种模式:"Typical"(典型)还是 "Custom"(定制)。
对于 Oracle Solaris Cluster 软件的 "Typical"(典型)安装,scinstall 将自动指定以下配置默认值。
|
填写以下群集配置工作单之一,具体表单取决于您是在 "Typical"(典型)模式还是在 "Custom"(定制)模式下运行 scinstall 实用程序。
"Typical"(典型)模式工作单-如果将使用 "Typical"(典型)模式并接受所有默认值,请填写以下工作单。
|
"Custom"(定制)模式工作单-如果将使用 "Custom"(定制)模式并定制配置数据,请填写以下工作单。
注 - 如果要安装单节点群集,那么即使该群集不使用专用网络,scinstall 实用程序也会自动指定默认的专用网络地址和网络掩码。
|
按照以下准则在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
请按照交换机文档中的过程来确定 NDP 是否处于启用状态,如果是,则禁用 NDP。
在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包,则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。
建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。
phys-schost# /usr/cluster/bin/scinstall
*** Main Menu *** Please select from one of the following (*) options: * 1) Create a new cluster or add a cluster node * 2) Configure a cluster to be JumpStarted from this install server 3) Manage a dual-partition upgrade 4) Upgrade this cluster node * 5) Print release information for this cluster node * ?) Help with menu options * q) Quit Option: 1
将显示 "New Cluster and Cluster Node"(新建群集和群集节点)菜单。
将显示 "Typical or Custom Mode"(典型模式或定制模式)菜单。
将显示 "Create a New Cluster"(创建新群集)屏幕。阅读相关要求,然后按 Ctrl-D 组合键继续。
scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Oracle Solaris Cluster 时的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
当所有受监视的共享磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则此功能会自动重新引导节点。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
要禁用 LOFS,请将以下条目添加到群集每个节点上的 /etc/system 文件中。
exclude:lofs
系统下次重新引导后对 /etc/system 文件的更改才生效。
注 - 如果在具有高可用性的本地文件系统上使用 HA for NFS 并运行 automountd,则不能启用 LOFS。LOFS 会导致 HA for NFS 出现切换问题。如果选择在具有高可用性的本地文件系统上添加 HA for NFS,您必须执行下面的其中一项配置更改。
但是,如果在群集中配置非全局区域,则必须在所有群集节点上都启用 LOFS。如果具有高可用性的本地文件系统上的 HA for NFS 必须与 LOFS 共存,则可以使用其他解决方案来代替禁用 LOFS。
禁用 LOFS。
禁用 automountd 守护进程。
从自动安装程序映射中排除属于由 HA for NFS 导出的具有高可用性的本地文件系统的所有文件。利用此选项可以让 LOFS 和 automountd 守护进程同时处于启用状态。
有关回送文件系统的更多信息,请参见《System Administration Guide: Devices and File Systems》中的"The Loopback File System"。
示例 3-1 在所有节点上配置 Oracle Solaris Cluster 软件
以下示例显示了当 scinstall 在双节点群集 schost 上完成配置任务时记录的 scinstall 进度消息。该群集是在 "Typical"(典型)模式下使用 scinstall 实用程序从 phys-schost-1 安装的。另一个群集节点为 phys-schost-2。适配器名称为 bge2 和 bge3。法定设备的自动选择已启用。
Installation and Configuration Log file - /var/cluster/logs/install/scinstall.log.24747 Configuring global device using lofi on phys-schost-1: done Starting discovery of the cluster transport configuration. The Oracle Solaris Cluster software is already installed on "phys-schost-1". The Oracle Solaris Cluster software is already installed on "phys-schost-2". Starting discovery of the cluster transport configuration. The following connections were discovered: phys-schost-1:bge2 switch1 phys-schost-2:bge2 phys-schost-1:bge3 switch2 phys-schost-2:bge3 Completed discovery of the cluster transport configuration. Started cluster check on "phys-schost-1". Started cluster check on "phys-schost-2". cluster check completed with no errors or warnings for "phys-schost-1". cluster check completed with no errors or warnings for "phys-schost-2". Removing the downloaded files … done Configuring "phys-schost-2" … done Rebooting "phys-schost-2" … done Configuring "phys-schost-1" … done Rebooting "phys-schost-1" … Log file - /var/cluster/logs/install/scinstall.log.24747 Rebooting …
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试返回此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后重新运行此过程。
接下来的步骤
如果安装了单节点群集,则已建立完群集。请转至创建群集文件系统以安装卷管理软件并配置群集。
如果已安装多节点群集并选择自动法定配置,则安装后设置已完成。请转至如何检验法定配置和安装模式。
如果已安装多节点群集并拒绝自动法定配置,请执行安装后设置。请转至如何配置法定设备。
如果要在群集中配置任何法定设备,请转至如何配置法定设备。
否则,请转至如何检验法定配置和安装模式。
要使用 XML 群集配置文件来配置新全局群集,请执行以下过程。新群集可以是某个运行 Oracle Solaris Cluster 3.3 3/13 软件的现有群集的副本。
此过程将对群集中的以下组成部分进行配置:
群集名称
群集节点成员身份
群集互连
全局设备
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件和创建域。
确保已在要配置的每个节点上安装了 Oracle Solaris Cluster 3.3 3/13 软件和修补程序。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
phys-schost# /usr/sbin/clinfo -n
clinfo: node is not configured as part of acluster: Operation not applicable
此消息表明潜在节点上尚未配置 Oracle Solaris Cluster 软件。
返回某个节点 ID 表明该节点上已配置了 Oracle Solaris Cluster 软件。
如果群集中运行着旧版本的 Oracle Solaris Cluster 软件,而您希望安装 Oracle Solaris Cluster 3.3 3/13 软件,请改为执行《Oracle Solaris Cluster Upgrade Guide》中所述的升级过程。
如果所有潜在群集节点上均未配置 Oracle Solaris Cluster 软件,请继续执行步骤 2。
请按照交换机文档中的过程来确定 NDP 是否处于启用状态,如果是,则禁用 NDP。
在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包,则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。
建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。
phys-schost# cluster export -o clconfigfile
指定输出目标。
群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。
有关更多信息,请参见 cluster(1CL) 手册页。
您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。
请基于 clconfiguration(5CL) 手册页中显示的元素分层结构来编辑该文件。您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。
为了能建立群集,群集配置 XML 文件中的以下组成部分必须具有有效值:
群集名称
群集节点
群集传输
默认情况下,使用在 lofi 设备上配置的全局设备名称空间创建群集。如果您需要使用用于创建全局设备的专用文件系统,对于将要使用分区而非 lofi 设备的每个节点,请将以下属性添加到 <propertyList> 元素。
… <nodeList> <node name="node" id="N"> <propertyList> … <property name="globaldevfs" value="/filesystem-name"> … </propertyList> </node> …
如果您正在修改从现有群集中导出的配置信息,则必须更改某些值(如节点名称)以反映新群集的情况,这些值会用于多个群集对象的定义中。
有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。
phys-schost# /usr/share/src/xmllint --valid --noout clconfigfile
有关更多信息,请参见 xmllint(1) 手册页。
phys-schost# cluster create -i clconfigfile
指定要用作输入源的群集配置 XML 文件的名称。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
有关修补程序位置和安装说明,请参见《Oracle Solaris Cluster 3.3 3/13 发行说明》中的"修补程序和所需的固件级别"。
要禁用 LOFS,请将以下条目添加到群集每个节点上的 /etc/system 文件中。
exclude:lofs
系统下次重新引导后对 /etc/system 文件的更改才生效。
注 - 如果在具有高可用性的本地文件系统上使用 HA for NFS 并运行 automountd,则不能启用 LOFS。LOFS 会导致 HA for NFS 出现切换问题。如果选择在具有高可用性的本地文件系统上添加 HA for NFS,您必须执行下面的其中一项配置更改。
但是,如果在群集中配置非全局区域,则必须在所有群集节点上都启用 LOFS。如果具有高可用性的本地文件系统上的 HA for NFS 必须与 LOFS 共存,则可以使用其他解决方案来代替禁用 LOFS。
禁用 LOFS。
禁用 automountd 守护进程。
从自动安装程序映射中排除属于由 HA for NFS 导出的具有高可用性的本地文件系统的所有文件。利用此选项可以让 LOFS 和 automountd 守护进程同时处于启用状态。
有关回送文件系统的更多信息,请参见《System Administration Guide: Devices and File Systems》中的"The Loopback File System"。
如果创建了双节点群集,则必须配置一个法定设备。如果您选择不使用群集配置 XML 文件来创建所需的法定设备,请转至如何配置法定设备。
按照如何安装和配置 法定服务器软件中的说明进行操作。
请参见《Oracle Solaris Cluster 3.3 3/13 With Network-Attached Storage Device Manual 》。
phys-schost# xmllint --valid --noout clconfigfile
phys-schost# clquorum add -i clconfigfile devicename
指定要配置为法定设备的设备的名称。
phys-schost# clquorum reset
phys-schost# claccess deny-all
注 - 在初始配置时,默认对搜索到的所有设备启用磁盘路径监视。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
示例 3-2 使用 XML 文件在所有节点上配置 Oracle Solaris Cluster 软件
以下示例将一个现有双节点群集的群集配置和法定配置复制到了一个新的双节点群集中。该新群集随 Oracle Solaris 10 OS 一起安装,但未配置非全局区域。群集配置将从现有群集节点 phys-oldhost-1 导出到群集配置 XML 文件 clusterconf.xml 中。新群集的节点名称为 phys-newhost-1 和 phys-newhost-2。在新群集中被配置为法定设备的设备是 d3。
此示例中的提示符名称 phys-newhost-N 表示应在这两个群集节点上执行相应的命令。
phys-newhost-N# /usr/sbin/clinfo -n clinfo: node is not configured as part of acluster: Operation not applicable phys-oldhost-1# cluster export -o clusterconf.xml Copy clusterconf.xml to phys-newhost-1 and modify the file with valid values phys-newhost-1# xmllint --valid --noout clusterconf.xml No errors are reported phys-newhost-1# cluster create -i clusterconf.xml phys-newhost-N# svcs multi-user-server STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default phys-newhost-1# clnode status Output shows that both nodes are online phys-newhost-1# clquorum add -i clusterconf.xml d3 phys-newhost-1# clquorum reset
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试返回此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后重新运行此过程。
接下来的步骤
请转至如何检验法定配置和安装模式。
另请参见
完全建立了群集之后,您可以从现有群集中复制其他群集组成部分的配置。如果尚未这样做,请修改要复制的 XML 元素的值,以反映要将该组件添加到其中的群集配置。例如,如果要复制资源组,请确保 <resourcegroupNodeList> 条目包含的是对新群集而言有效的节点名称,而不是所复制的群集中的节点名称,除非这些节点名称与新群集中的节点名称相同。
要复制群集组件,请对要复制的群集组件运行面向对象命令的 export 子命令。有关面向对象命令的语法和选项的更多信息,请参见要复制的群集对象所对应的手册页。下表列出了在建立群集之后可以通过群集配置 XML 文件创建的群集组件以及复制组件时所用命令的手册页。
|
此过程介绍了如何设置和使用 scinstall(1M) 定制 JumpStart 安装方法。此方法将在所有全局群集节点上安装 Oracle Solaris OS 和 Oracle Solaris Cluster 软件,并建立群集。您还可以使用此过程向现有群集添加新节点。
开始之前
执行以下任务:
确保安装 Oracle Solaris 软件之前已安装了硬件并已验证连接。有关如何设置硬件的详细信息,请参见 Oracle Solaris Cluster 硬件文档以及您的服务器和存储设备的相关文档。
确定每个群集节点的以太网地址。
如果使用命名服务,确保已将以下信息添加到客户机在访问群集服务时所使用的命名服务中。有关规划准则,请参见公共网络 IP 地址。有关使用 Oracle Solaris 命名服务的信息,请参见 Oracle Solaris 系统管理员文档。
所有公共主机名和逻辑地址的地址到名称映射
JumpStart 安装服务器的 IP 地址和主机名
确保群集配置规划完整。有关要求和准则,请参见如何准备群集软件安装。
在将要从中创建 flash 归档文件的服务器上,确保安装了支持 Oracle Solaris Cluster 软件所必需的所有 Oracle Solaris OS 软件、修补程序和固件。
如果服务器上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件和创建域。
确保在您将从中创建 flash 归档文件的服务器上安装了 Oracle Solaris Cluster 软件包和修补程序。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确定您将使用 scinstall 实用程序的哪种模式:"Typical"(典型)还是 "Custom"(定制)。对于 Oracle Solaris Cluster 软件的 "Typical"(典型)安装,scinstall 将自动指定以下配置默认值。
|
填写以下群集配置工作单之一,具体表单取决于您是在 "Typical"(典型)模式还是在 "Custom"(定制)模式下运行 scinstall 实用程序。有关规划准则,请参见规划 Oracle Solaris Cluster 环境。
"Typical"(典型)模式工作单-如果将使用 "Typical"(典型)模式并接受所有默认值,请填写以下工作单。
|
"Custom"(定制)模式工作单-如果将使用 "Custom"(定制)模式并定制配置数据,请填写以下工作单。
注 - 如果要安装单节点群集,那么即使该群集不使用专用网络,scinstall 实用程序还是会自动使用默认的专用网络地址和网络掩码。
|
按照以下准则在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
确保 JumpStart 安装服务器符合下列要求。
安装服务器在群集节点所在的同一子网中,或者在群集节点所使用的子网的 Oracle Solaris 根服务器上。
安装服务器本身不是群集节点。
安装服务器安装了 Oracle Solaris Cluster 软件支持的某个 Oracle Solaris OS 发行版。
对于 Oracle Solaris Cluster 软件的 JumpStart 安装,存在一个定制 JumpStart 目录。此 jumpstart-dir 目录必须满足以下要求:
含有 check 实用程序的副本。
是导出供 JumpStart 安装服务器读取的 NFS。
每个新的群集节点都配置为一个定制的 JumpStart 安装客户机,该客户机使用您为 Oracle Solaris Cluster 安装设置的定制 JumpStart 目录。
按照与您的软件平台和 OS 版本相应的说明来设置 JumpStart 安装服务器。请参见《Oracle Solaris 10 1/13 安装指南:JumpStart 安装》中的"为联网系统创建配置文件服务器"。
另请参见 setup_install_server(1M) 和 add_install_client(1M) 手册页。
如果服务器上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
请按照如何安装 Oracle Solaris 软件中的过程操作。
请按照如何安装 Oracle Solaris Cluster 框架和数据服务软件包中的过程操作。
有关修补程序位置和安装说明,请参见《Oracle Solaris Cluster 3.3 3/13 发行说明》中的"修补程序和所需的固件级别"。
machine# cacaoadm enable
执行此步骤,无论是否正在使用命名服务。有关必须添加其 IP 地址的 Oracle Solaris Cluster 组件的列表,请参见公共网络 IP 地址。
以下命令将从 Web 控制台中删除配置信息。其中的部分配置信息是特定于已安装系统的。在创建 flash 归档文件之前,必须将这些信息删除。否则,传输到群集节点的配置信息可能会阻止 Web 控制台启动或阻止其与群集节点的正确交互。
# /usr/share/webconsole/private/bin/wcremove -i console
在群集节点上安装未配置 Web 控制台后,首次启动 Web 控制台时,Web 控制台会自动运行其初始配置并使用群集节点中的信息。
有关 wcremove 命令的更多信息,请参见《Oracle Solaris 管理:基本管理》中的"Oracle Java Web Console 用户身份"。
执行《Oracle Solaris 10 1/13 安装指南:Flash 归档文件(创建和安装)》中的第 3 章 "创建 Flash 归档文件(任务)"中的过程。
machine# flarcreate -n name archive
为 flash 归档文件指定的名称。
为 flash 归档文件指定的文件名,带完整路径。按照约定,文件名以 .flar 结尾。
有关自动文件共享的更多信息,请参见《系统管理指南:网络服务》中的第 4 章 "管理网络文件系统(概述)"。
在介质路径中,用 sparc 或 x86 替换 arch,用 10 替换 ver,以代表 Oracle Solaris 10。
installserver# cd /cdrom/cdrom0/Solaris_arch/Product/sun_cluster/ \ Solaris_ver/Tools/ installserver# ./scinstall
将显示 scinstall 的主菜单。
此选项用于配置定制 JumpStart 结束脚本。JumpStart 使用这些结束脚本安装 Oracle Solaris Cluster 软件。
*** Main Menu *** Please select from one of the following (*) options: * 1) Create a new cluster or add a cluster node * 2) Configure a cluster to be JumpStarted from this install server 3) Manage a dual-partition upgrade 4) Upgrade this cluster node * 5) Print release information for this cluster node * ?) Help with menu options * q) Quit Option: 2
scinstall 命令用于存储您的配置信息以及复制 /jumpstart-dir /autoscinstall.d/3.2/ 目录中的 autoscinstall.class 默认 class 文件。此文件类似于以下示例。
install_type initial_install system_type standalone partitioning explicit filesys rootdisk.s0 free / filesys rootdisk.s1 750 swap filesys rootdisk.s3 512 /globaldevices filesys rootdisk.s7 20 cluster SUNWCuser add package SUNWman add
根据需要修改条目,以便与您在 flash 归档文件计算机上安装 Oracle Solaris OS 或运行 scinstall 实用程序时做出的配置选择相匹配。
|
有关与 archive_location 关键字一起使用时 retrieval_type 和 location 有效值的信息,请参见《Oracle Solaris 10 1/13 安装指南:JumpStart 安装》中的"archive_location 关键字"。
cluster SUNWCuser add package SUNWman add
autoscinstall.class 文件将安装“最终用户 Solaris 软件组”(SUNWCuser)。
下表列出了支持某些 Oracle Solaris Cluster 功能所必需的 Oracle Solaris 软件包。这些软件包不在“最终用户 Solaris 软件组”中。有关更多信息,请参见Oracle Solaris 软件组注意事项。
|
可通过以下方法之一来更改默认 class 文件:
直接编辑 autoscinstall.class 文件。这些更改将应用于使用此定制 JumpStart 目录的所有群集中的所有节点。
将 rules 文件更新为指向其他配置文件,然后运行 check 实用程序以验证 rules 文件。
只要 Oracle Solaris OS 安装配置文件满足最低的 Oracle Solaris Cluster 文件系统分配要求,则对于对安装配置文件的其他更改,Oracle Solaris Cluster 软件不施加任何限制。有关用以支持 Oracle Solaris Cluster 软件的分区准则和要求,请参见系统磁盘分区。
有关 JumpStart 配置文件的更多信息,请参见《Oracle Solaris 10 1/13 安装指南:JumpStart 安装》中的第 3 章 "准备 JumpStart 安装(任务)"。
您自己的结束脚本将在 scinstall 命令所安装的标准结束脚本之后运行。有关创建 JumpStart 结束脚本的信息,请参见《Oracle Solaris 10 1/13 安装指南:JumpStart 安装》中的第 3 章 "准备 JumpStart 安装(任务)"。
请参见步骤 15。
为群集中的每个节点创建一个 node 目录。或者,使用此命名约定创建指向共享 finish 脚本的符号链接。
请按照交换机文档中的过程来确定 NDP 是否处于启用状态,如果是,则禁用 NDP。
在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包,则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。
建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。
以超级用户身份使用以下命令启动 cconsole 实用程序:
adminconsole# /opt/SUNWcluster/bin/cconsole clustername &
cconsole 实用程序还将打开一个主窗口,您可以从该主窗口将您输入的内容同时发送到每个控制台窗口。
phys-schost# shutdown -g0 -y -i0
ok boot net - install
注 - 命令中破折号 (-) 的两端需加空格。
Press any key to reboot. keystroke
初始化序列完成后,将出现 BIOS 设置实用程序屏幕。
此时将显示引导设备列表。
IBA 引导选项右侧的最小数对应于较低的 Ethernet 端口号。IBA 引导选项右侧的较高数对应于较高的 Ethernet 端口号。
引导序列重新开始。执行进一步处理后,显示 GRUB 菜单。
注 - 如果 Oracle Solaris JumpStart 条目是列出的唯一条目,可以选择等待选择屏幕超时。如果您在 30 秒内未响应,系统将自动继续引导序列。
执行进一步处理后,显示安装类型菜单。
注 - 如果在 30 秒超时期结束之前,您未键入 "Custom JumpStart"(定制 JumpStart)的编号,系统将自动开始 Oracle Solaris 交互式安装。
JumpStart 将在每个节点上安装 Oracle Solaris OS 和 Oracle Solaris Cluster 软件。当安装成功完成后,每个节点将被完全安装为一个新的群集节点。安装 Oracle Solaris Cluster 时的输出信息记录在/var/cluster/logs/install/scinstall.log. N 文件中。
注 - 如果此时未中断 BIOS,它将自动返回安装类型菜单。如果在 30 秒内未键入选择,系统将自动开始交互式安装。
执行进一步处理后,显示 BIOS 设置实用程序。
此时将显示引导设备列表。
引导序列重新开始。无需与 GRUB 菜单进一步交互便可结束引导进入群集模式。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
要禁用 LOFS,请将以下条目添加到群集每个节点上的 /etc/system 文件中。
exclude:lofs
系统下次重新引导后对 /etc/system 文件的更改才生效。
注 - 如果在具有高可用性的本地文件系统上使用 HA for NFS 并运行 automountd,则不能启用 LOFS。LOFS 会导致 HA for NFS 出现切换问题。如果选择在具有高可用性的本地文件系统上添加 HA for NFS,您必须执行下面的其中一项配置更改。
但是,如果在群集中配置非全局区域,则必须在所有群集节点上都启用 LOFS。如果具有高可用性的本地文件系统上的 HA for NFS 必须与 LOFS 共存,则可以使用其他解决方案来代替禁用 LOFS。
禁用 LOFS。
禁用 automountd 守护进程。
从自动安装程序映射中排除属于由 HA for NFS 导出的具有高可用性的本地文件系统的所有文件。利用此选项可以让 LOFS 和 automountd 守护进程同时处于启用状态。
有关回送文件系统的更多信息,请参见《System Administration Guide: Devices and File Systems》中的"The Loopback File System"。
|
此条目在下次重新引导系统后生效。
如果无法访问登录提示,该值的设置使您能够重新引导节点。
grub edit> kernel /platform/i86pc/multiboot kmdb
下面是一些需要重新引导的任务:
向现有群集中添加新节点
安装要求重新引导节点或群集的修补程序
对配置进行需要重新引导以便激活的更改
phys-schost-1# cluster shutdown -y -g0 clustername
注 - 只有等到群集关闭之后,才能重新引导群集中第一个安装的节点。禁用群集安装模式前,只有建立群集的第一个安装节点才有法定选票。在所建立的、仍处于安装模式的群集中,如果在重新引导第一个安装的节点前未关闭群集,则其余群集节点将无法获得法定投票。然后整个群集将关闭。
这些群集节点会一直处在安装模式下,直到您首次运行 clsetup 命令为止。您将在执行如何配置法定设备过程期间运行此命令。
ok boot
显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。
有关基于 GRUB 的引导的更多信息,请参见《Oracle Solaris 管理:基本管理》中的"使用 GRUB 引导基于 x86 的系统(任务列表)"。
scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Oracle Solaris Cluster 时的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。
phys-schost# smcwebserver start
有关更多信息,请参见 smcwebserver(1M) 手册页。
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
注 - 在初始配置时,默认对搜索到的所有设备启用磁盘路径监视。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
接下来的步骤
如果向一个双节点群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
否则,转至下一个相应过程:
如果已安装多节点群集并选择自动法定配置,则安装后设置已完成。请转至如何检验法定配置和安装模式。
如果已安装多节点群集并拒绝自动法定配置,请执行安装后设置。请转至如何配置法定设备。
如果向使用法定设备的现有群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
如果向未使用法定设备的现有群集中添加了新节点,请验证该群集的状态。请转至如何检验法定配置和安装模式。
如果安装了单节点群集,则已建立完群集。请转至创建群集文件系统以安装卷管理软件并配置群集。
故障排除
已禁用 scinstall 选项-如果 scinstall 命令的 JumpStart 选项前面没有星号,则该选项处于禁用状态。这种情况表明 JumpStart 设置未完成或设置出错。要纠正这种情况,请首先退出 scinstall 实用程序。重新执行步骤 1 至步骤 16 以更正 JumpStart 设置,然后重新启动 scinstall 实用程序。
要在添加新的群集节点之前做好群集准备工作,请在现有的全局群集节点上执行以下过程。
开始之前
执行以下任务:
确保已安装所有必需的硬件。
确保新节点上已安装主机适配器。请参见《Oracle Solaris Cluster 3.3 3/13 Hardware Administration Manual 》。
检验是否存在任何现有的群集互连可以支持新节点。请参见《Oracle Solaris Cluster 3.3 3/13 Hardware Administration Manual 》。
确保已安装任何附加存储器。请参见相应的 Oracle Solaris Cluster 存储手册。
phys-schost# clinterconnect show
添加节点之前,必须具有已配置的至少两条电缆或两个适配器。
phys-schost# clsetup
按照说明指定要添加到群集中的节点的名称、传输适配器的名称以及是否使用传输交换机。
phys-schost# clinterconnect show
命令输出结果应该显示至少两个群集互连的配置信息。
phys-schost# cluster show-netprops
输出类似于以下内容:
=== Private Network === private_netaddr: 172.16.0.0 private_netmask: 255.255.240.0 max_nodes: 64 max_privatenets: 10 max_zoneclusters: 12
请转至如何在添加节点或专用网络时更改专用网络配置。必须先关闭群集才能更改专用 IP 地址范围。这期间还要将每个资源组切换到脱机状态,禁用群集中的所有资源,然后重新引导到非群集模式下,在此之后才可以重新配置 IP 地址范围。
接下来的步骤
在新群集节点上配置 Oracle Solaris Cluster 软件。转至如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)或如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (XML)。
执行此任务可更改全局群集的专用 IP 地址范围,以适应下列一个或多个群集组件数量的增加:
节点或非全局区域数
专用网络数
区域群集数
此过程也可以用来缩小专用 IP 地址范围。
注 - 该过程需要关闭整个群集。如果只需要更改网络掩码(例如,为了添加区域群集支持),请勿执行此过程。而应改而从在群集模式下运行的全局群集节点中运行以下命令,以指定预期的区域群集数量:
phys-schost# cluster set-netprops num_zoneclusters=N
该命令无需关闭群集。
开始之前
确保对所有群集节点启用了 超级用户的远程 shell (rsh(1M)) 或安全 shell (ssh(1)) 访问权限 。
# clsetup
屏幕上将显示 clsetup 主菜单。
如果节点包含非全局区域,则这些区域中的所有资源组也被切换到脱机状态。
将显示 "Resource Group"(资源组)菜单。
# cluster status -t resource,resourcegroup
限定为仅输出指定的群集对象
指定资源
指定资源组
# cluster shutdown -g0 -y
指定等待时间(以秒为单位)
禁止发出用于询问您是否确认要关闭的提示
ok boot -x
有关基于 GRUB 的引导的更多信息,请参见《Oracle Solaris 管理:基本管理》中的"使用 GRUB 引导基于 x86 的系统(任务列表)"。
屏幕将显示编辑后的命令。
注 - 对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请执行上述步骤以再次将 -x 选项添加到内核引导参数命令中。
在非群集模式下运行时,clsetup 实用程序会为非群集模式操作显示主菜单。
clsetup 实用程序显示当前的专用网络配置,然后询问您是否要更改此配置。
clsetup 实用程序将显示默认的专用网络 IP 地址 172.16.0.0,并询问您是否接受此默认值。
clsetup 实用程序将询问您是否接受默认网络掩码。请跳至下一步输入您的响应。
clsetup 实用程序将提示您输入新的专用网络 IP 地址。
clsetup 实用程序会显示默认网络掩码,然后询问您是否接受该默认网络掩码。
默认网络掩码为 255.255.240.0。此默认 IP 地址范围支持在群集中包含最多 64 个节点、12 个区域群集和 10 个专用网络。
然后跳至下一步。
当您拒绝默认网络掩码时,clsetup 实用程序将提示您输入要在群集中配置的节点、专用网络和区域群集的数量。
clsetup 实用程序将根据这些数字计算出两个网络掩码供选择:
第一个网络掩码是支持指定节点、专用网络和区域群集数目的最小网络掩码。
第二个网络掩码可支持两倍于指定值的节点、专用网络和区域群集数目,从而适应未来可能出现的增长情况。
# shutdown -g0 -y
ok boot
显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。
有关基于 GRUB 的引导的更多信息,请参见《Oracle Solaris 管理:基本管理》中的"使用 GRUB 引导基于 x86 的系统(任务列表)"。
# clsetup
屏幕上将显示 clsetup 主菜单。
将显示 "Resource Group"(资源组)菜单。
如果节点包含非全局区域,还应使这些区域内的所有资源组联机。
键入 q 退出每个子菜单,或者按 Ctrl-C。
接下来的步骤
要向现有的群集中添加节点,请转至以下过程之一:
要在群集节点上创建非全局区域,请转至在全局群集节点上配置非全局区域。
执行此过程,向现有全局群集中添加新节点。要使用 JumpStart 添加新节点,请改为遵循如何安装 Oracle Solaris 和 Oracle Solaris Cluster 软件 (JumpStart)中的过程。
注 - 此过程使用的是 scinstall 命令的交互形式。要使用 scinstall 命令的非交互形式(例如在开发安装脚本时),请参见 scinstall(1M) 手册页。
确保在运行 scinstall 命令之前,在节点上安装了 Oracle Solaris Cluster 软件包(无论是通过手动形式还是使用 installer 程序的无提示模式)。有关从安装脚本运行 installer 程序的信息,请参见《Sun Java Enterprise System 5 Update 1 Installation Guide for UNIX》中的第 5 章 "Installing in Silent Mode"。
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件和创建域。
确保在节点上安装了 Oracle Solaris Cluster 软件包和修补程序。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确保群集已为添加新节点做好了准备。请参见如何在添加全局群集节点之前做好群集准备工作。
确定您将使用 scinstall 实用程序的哪种模式:"Typical"(典型)还是 "Custom"(定制)。对于 Oracle Solaris Cluster 软件的 "Typical"(典型)安装,scinstall 将自动指定以下配置默认值。
|
完成以下配置规划工作单之一。有关规划准则,请参见规划 Oracle Solaris OS和规划 Oracle Solaris Cluster 环境。
"Typical"(典型)模式工作单-如果将使用 "Typical"(典型)模式并接受所有默认值,请填写以下工作单。
|
"Custom"(定制)模式工作单-如果将使用 "Custom"(定制)模式并定制配置数据,请填写以下工作单。
|
按照以下准则在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
phys-schost-new# /usr/cluster/bin/scinstall
将显示 scinstall 的主菜单。
*** Main Menu *** Please select from one of the following (*) options: * 1) Create a new cluster or add a cluster node 2) Configure a cluster to be JumpStarted from this install server 3) Manage a dual-partition upgrade 4) Upgrade this cluster node * 5) Print release information for this cluster node * ?) Help with menu options * q) Quit Option: 1
将显示 "New Cluster and Cluster Node"(新建群集和群集节点)菜单。
scinstall 实用程序可配置节点并将该节点引导到群集中。
phys-schost# eject cdrom
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# claccess deny-all
或者,您也可以使用 clsetup 实用程序。有关过程,请参见《Oracle Solaris Cluster 系统管理指南》中的"如何向现有群集添加节点"。
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
phys-schost# showrev -p
注 - 在初始配置时,默认对搜索到的所有设备启用磁盘路径监视。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
要禁用 LOFS,请将以下条目添加到群集每个节点上的 /etc/system 文件中。
exclude:lofs
系统下次重新引导后对 /etc/system 文件的更改才生效。
注 - 如果在具有高可用性的本地文件系统上使用 HA for NFS 并运行 automountd,则不能启用 LOFS。LOFS 会导致 HA for NFS 出现切换问题。如果选择在具有高可用性的本地文件系统上添加 HA for NFS,您必须执行下面的其中一项配置更改。
但是,如果在群集中配置非全局区域,则必须在所有群集节点上都启用 LOFS。如果具有高可用性的本地文件系统上的 HA for NFS 必须与 LOFS 共存,则可以使用其他解决方案来代替禁用 LOFS。
禁用 LOFS。
禁用 automountd 守护进程。
从自动安装程序映射中排除属于由 HA for NFS 导出的具有高可用性的本地文件系统的所有文件。利用此选项可以让 LOFS 和 automountd 守护进程同时处于启用状态。
有关回送文件系统的更多信息,请参见《System Administration Guide: Devices and File Systems》中的"The Loopback File System"。
示例 3-3 在新增的节点上配置 Oracle Solaris Cluster 软件
以下示例显示了如何将节点 phys-schost-3 添加到群集 schost 中。发起节点为 phys-schost-1。
*** Adding a Node to an Existing Cluster *** Fri Feb 4 10:17:53 PST 2005 scinstall -ik -C schost -N phys-schost-1 -A trtype=dlpi,name=bge2 -A trtype=dlpi,name=bge3 -m endpoint=:bge2,endpoint=switch1 -m endpoint=:bge3,endpoint=switch2 Checking device to use for global devices file system ... done Adding node "phys-schost-3" to the cluster configuration ... done Adding adapter "bge2" to the cluster configuration ... done Adding adapter "bge3" to the cluster configuration ... done Adding cable to the cluster configuration ... done Adding cable to the cluster configuration ... done Copying the config from "phys-schost-1" ... done Copying the postconfig file from "phys-schost-1" if it exists ... done Copying the Common Agent Container keys from "phys-schost-1" ... done Setting the node ID for "phys-schost-3" ... done (id=1) Setting the major number for the "did" driver ... Obtaining the major number for the "did" driver from "phys-schost-1" ... done "did" driver major number set to 300 Checking for global devices global file system ... done Updating vfstab ... done Verifying that NTP is configured ... done Initializing NTP configuration ... done Updating nsswitch.conf ... done Adding clusternode entries to /etc/inet/hosts ... done Configuring IP Multipathing groups in "/etc/hostname.<adapter>" files Updating "/etc/hostname.hme0". Verifying that power management is NOT configured ... done Ensure that the EEPROM parameter "local-mac-address?" is set to "true" ... done The "local-mac-address?" parameter setting has been changed to "true". Ensure network routing is disabled ... done Updating file ("ntp.conf.cluster") on node phys-schost-1 ... done Updating file ("hosts") on node phys-schost-1 ... done Rebooting ...
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试返回此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后重新运行此过程。
接下来的步骤
如果向使用法定设备的现有群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
否则,请转至如何检验法定配置和安装模式。
请执行以下过程,以便使用 XML 群集配置文件来配置新的全局群集节点。新节点可以是运行 Oracle Solaris Cluster 3.3 3/13 软件的某个现有群集节点的副本。
此过程将对新节点上的下列群集组成部分进行配置:
群集节点成员身份
群集互连
全局设备
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件要求的更多信息,请参见如何安装 Oracle Solaris 软件。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件和创建域。
确保已在节点上安装了 Oracle Solaris Cluster 软件包和所有必需的修补程序。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确保群集已为添加新节点做好了准备。请参见如何在添加全局群集节点之前做好群集准备工作。
phys-schost-new# /usr/sbin/clinfo -n
ok boot -x
有关基于 GRUB 的引导的更多信息,请参见《Oracle Solaris 管理:基本管理》中的"使用 GRUB 引导基于 x86 的系统(任务列表)"。
屏幕将显示编辑后的命令。
注 - 对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请执行上述步骤以再次将 -x 选项添加到内核引导参数命令中。
phys-schost-new# /usr/cluster/bin/clnode remove
phys-schost# clnode export -o clconfigfile
指定输出目标。
群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。
有关更多信息,请参见 clnode(1CL) 手册页。
请基于 clconfiguration(5CL) 手册页中显示的元素分层结构来编辑该文件。可将该文件存储到任意目录下。
有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。
phys-schost-new# xmllint --valid --noout clconfigfile
phys-schost-new# clnode add -n sponsornode -i clconfigfile
指定一个现有群集成员的名称,该成员将作为新节点的发起节点。
指定要用作输入源的群集配置 XML 文件的名称。
注 - 在初始配置时,默认对搜索到的所有设备启用磁盘路径监视。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试返回此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后重新运行此过程。
接下来的步骤
如果已经向某个使用法定设备的群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
否则,请转至如何检验法定配置和安装模式。
如果向全局群集中添加了节点,那么,无论您使用的是共享磁盘、NAS 设备、法定服务器还是它们的组合,您都必须更新法定设备的配置信息。为此,您应删除所有的法定设备并更新全局设备名称空间。您可以重新配置仍要使用的任何法定设备(可选操作)。此更新将向每个法定设备注册新节点,从而使法定设备能够根据群集中节点的新数量重新计算其选票计数。
任何新配置的 SCSI 法定设备都会被设置为 SCSI-3 预留空间。
开始之前
确保在添加的节点上已经完成了 Oracle Solaris Cluster 软件的安装。
phys-schost# cluster status -t node
命令输出中将列出每个法定设备和每个节点。以下输出示例中显示出了当前的 SCSI 法定设备 d3。
phys-schost# clquorum list d3 …
对已配置的每个法定设备执行此步骤。
phys-schost# clquorum remove devicename
指定法定设备的名称。
如果法定设备删除成功,将不会列出任何法定设备。
phys-schost# clquorum status
phys-schost# cldevice populate
注 - 必须执行此步骤以防止可能发生的节点紊乱。
即使仅从一个节点中发出 cldevice populate 命令,该命令也会以远程方式在所有节点上执行。要确定 cldevice populate 命令是否已完成处理过程,请在群集的每个节点上运行以下命令。
phys-schost# ps -ef | grep scgdevs
可以对原来配置为法定设备的同一台设备进行配置,也可以选择新的共享设备进行配置。
否则,请跳至步骤 c。
phys-schost# cldevice list -v
输出类似于以下内容:
DID Device Full Device Path ---------- ---------------- d1 phys-schost-1:/dev/rdsk/c0t0d0 d2 phys-schost-1:/dev/rdsk/c0t6d0 d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 …
phys-schost# clquorum add -t type devicename
指定法定设备的类型。如果未指定此选项,将使用默认类型 shared_disk。
phys-schost# clquorum list
输出结果中应列出每个法定设备和每个节点。
示例 3-4 向双节点群集中添加节点后更新 SCSI 法定设备
下面的示例依次执行了以下操作:确定原始 SCSI 法定设备 d2;删除该法定设备;列出可用的共享设备;更新全局设备名称空间;将 d3 配置为新的 SCSI 法定设备;检验新设备。
phys-schost# clquorum list d2 phys-schost-1 phys-schost-2 phys-schost# clquorum remove d2 phys-schost# clquorum status … --- Quorum Votes by Device --- Device Name Present Possible Status ----------- ------- -------- ------ phys-schost# cldevice list -v DID Device Full Device Path ---------- ---------------- … d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 … phys-schost# cldevice populate phys-schost# ps -ef - grep scgdevs phys-schost# clquorum add d3 phys-schost# clquorum list d3 phys-schost-1 phys-schost-2
接下来的步骤
请转至如何检验法定配置和安装模式。
注 - 在以下几种情况下不需要配置法定设备:
在配置 Oracle Solaris Cluster 软件的过程中选择了自动法定配置。
安装了单节点全局群集。
向现有全局群集中添加了节点并且已指定足够的法定投票。
应继续执行如何检验法定配置和安装模式中的过程。
仅在完全形成新群集后执行一次该过程。使用此过程以指定法定选票并使群集脱离安装模式。
开始之前
执行以下准备工作以将法定服务器或 NAS 设备配置为法定设备。
在法定服务器主机上安装 法定服务器软件,然后启动法定服务器。有关安装和启动法定服务器的信息,请参见如何安装和配置 法定服务器软件。
确保与群集节点直接相连的网络交换机满足以下条件之一:
交换机支持快速生成树协议 (Rapid Spanning Tree Protocol, RSTP)。
交换机上已启用快速端口 (fast port) 模式。
必须具有上述某一项特性以确保群集节点与法定服务器之间的即时通信。如果通信因交换机而出现明显延迟,则群集会认为是缺少法定设备导致了通信不畅。
获取以下信息:
要指定给所配置的法定设备的名称
法定服务器主机的 IP 地址
法定服务器的端口号
NAS 设备-要将网络连接存储 (Network-Attached Storage, NAS) 设备配置为法定设备,请安装 NAS 设备硬件和软件。有关 NAS 硬件和软件的要求和安装过程,请参见《Oracle Solaris Cluster 3.3 3/13 With Network-Attached Storage Device Manual 》以及您的设备文档。
准备使用法定服务器。
公共网络使用长度可变的子网掩码,也称为无类域间路由 (Classless Inter Domain Routing, CIDR)。
如果您使用了法定服务器,但是公共网络使用了有类子网(如 RFC 791 中所定义),则无需执行本步骤。
以下是一个包含公共网络 IP 地址和网络掩码的条目示例:
10.11.30.0 255.255.255.0
nodename netmask + broadcast +
phys-schost# cluster status -t node
运行此命令无需超级用户身份。
phys-schost-1# cldevice list -v
输出类似于以下内容:
DID Device Full Device Path ---------- ---------------- d1 phys-schost-1:/dev/rdsk/c0t0d0 d2 phys-schost-1:/dev/rdsk/c0t6d0 d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 …
使用步骤 a 中的 scdidadm 输出信息来识别配置为法定设备的每个共享磁盘的设备 ID 名称。例如,步骤 a 中的输出信息显示全局设备 d3 是由 phys-schost-1 和 phys-schost-2 共享的。
phys-schost# cldevice show device === DID Device Instances === DID Device Name: /dev/did/rdsk/dN … default_fencing: nofencing …
phys-schost# cluster show -t global === Cluster === Cluster name: cluster … global_fencing: nofencing …
注 - 如果单个磁盘的 default_fencing 属性设置为 global,则仅在群集范围的 global_fencing 属性设置为 nofencing 或 nofencing-noscrub 时对该单个磁盘禁用隔离功能。如果将 global_fencing 属性更改为可启用隔离功能的值,则其 default_fencing 属性设置为 global 的所有磁盘的隔离功能会变为启用状态。
phys-schost# cldevice set \ -p default_fencing=nofencing-noscrub device
phys-schost# cldevice show device
phys-schost# clsetup
将显示 "Initial Cluster Setup"(初始群集设置)屏幕。
|
对于法定服务器,还需指定以下信息:
法定服务器主机的 IP 地址
法定服务器用来与群集节点进行通信的端口号
clsetup 实用程序在为群集设置了法定配置和投票计数后,将显示消息 "Cluster initialization is complete"。该实用程序将于此时返回到主菜单。
接下来的步骤
检验是否已禁用法定配置及安装模式。请转至如何检验法定配置和安装模式。
故障排除
中断的 clsetup 处理-如果法定设备设置过程被中断或无法成功完成,请重新运行 clsetup。
对法定选票计数的更改-如果以后增加或减少了连接到法定设备的节点数,法定选票计数不会自动重新计算。通过删除各个法定设备,然后将其添加回配置中(一次对一个法定设备进行操作),可以重新建立正确的法定选票。对于双节点群集,请临时添加一个新的法定设备,然后删除原法定设备并将其添加回配置。然后,删除临时法定设备。请参见《Oracle Solaris Cluster 系统管理指南》中的第 6 章 "管理法定"中的“如何修改法定设备节点列表”过程。
无法访问的法定设备-如果在群集节点上看到无法访问法定设备的消息,或者如果群集节点出现故障并显示消息 CMM: Unable to acquire the quorum device,则法定设备或其路径可能存在问题。检查法定设备及其路径是否正常。
如果该问题仍然存在,请使用其他法定设备。或者,如果仍要使用该法定设备,请将法定超时增大为较高的值,如下所述:
注 - 对于 Oracle Real Application Clusters (Oracle RAC),请勿更改默认的 25 秒法定超时时间。在某些记忆分裂方案中,较长的超时周期可能会导致 Oracle RAC VIP 故障转移因 VIP 资源超时而失败。如果所用法定设备不适合使用默认的 25 秒超时,请使用其他法定设备。
1. 成为超级用户。
2. 在每个群集节点上,以超级用户身份编辑 /etc/system 文件,将超时时间设置为较高的值。
以下示例将超时时间设置为 700 秒。
phys-schost# vi /etc/system … set cl_haci:qd_acquisition_timer=700
3. 从一个节点,关闭群集。
phys-schost-1# cluster shutdown -g0 -y
4. 将各节点引导回群集模式。
重新引导后会初始化对 /etc/system 文件的更改。
执行该过程以检验法定配置是否已成功完成,如果已配置法定设备,检验群集安装模式是否已被禁用。
您不必成为超级用户就可以运行这些命令。
phys-schost% clquorum list
输出结果中将列出每个法定设备和每个节点。
phys-schost% cluster show -t global | grep installmode installmode: disabled
群集安装和创建已完成。
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果要更改任何专用主机名,请转至如何更改专用主机名。
如果在安装 Oracle Solaris Cluster 软件之前,您未安装自己的 /etc/inet/ntp.conf 文件,请安装或创建 NTP 配置文件。请转至如何配置网络时间协议 (Network Time Protocol, NTP)。
如果想要在专用互联上配置 IPsec,请转至如何在群集专用互连上配置 IP 安全体系结构 (IPsec)。
要配置 Solaris Volume Manager 软件,请转至 第 4 章。
要创建群集文件系统,请转至如何创建群集文件系统。
要在节点上创建非全局区域,请转至如何在全局群集节点上配置非全局区域。
请安装第三方应用程序、注册资源类型、设置资源组并配置数据服务。请参见应用程序软件随附的文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
另请参见
创建群集配置的备份。
对群集配置的归档备份有助于您更方便地恢复群集配置。有关更多信息,请参见《Oracle Solaris Cluster 系统管理指南》中的"如何备份群集配置"。
如果不希望使用默认的专用主机名 clusternodenodeid-priv(该主机名是在安装 Oracle Solaris Cluster 软件的过程中指定的),请执行此任务。
注 - 在配置并启动应用程序和数据服务后,请不要执行此过程。否则,在重命名旧的专用主机名后,应用程序或数据服务可能仍使用旧的专用主机名,从而造成主机名冲突。如果有一些应用程序或数据服务正在运行,则停止它们,然后再执行该过程。
请在一个活动的群集节点上执行此过程。
phys-schost# clsetup
屏幕上将显示 clsetup 主菜单。
将显示 "Private Hostnames"(专用主机名)菜单。
对于每个要更改的专用主机名,请重复该过程。
phys-schost# clnode show -t node | grep privatehostname privatehostname: clusternode1-priv privatehostname: clusternode2-priv privatehostname: clusternode3-priv
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果在安装 Oracle Solaris Cluster 软件之前,您未安装自己的 /etc/inet/ntp.conf 文件,请安装或创建 NTP 配置文件。请转至如何配置网络时间协议 (Network Time Protocol, NTP)。
如果想要在专用互联上配置 IPsec,请转至如何在群集专用互连上配置 IP 安全体系结构 (IPsec)。
要配置 Solaris Volume Manager 软件,请转至 第 4 章。
要创建群集文件系统,请转至如何创建群集文件系统。
要在节点上创建非全局区域,请转至如何在全局群集节点上配置非全局区域。
请安装第三方应用程序、注册资源类型、设置资源组并配置数据服务。请参见应用程序软件随附的文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
可以通过设置负载限制来启用资源组负载在各节点或区域间的自动分配。将负载因子分配给资源组,负载因子与已定义的节点负载限制相对应。
默认行为是在所有可用节点之间均匀分配资源组负载。每个资源组都在其节点列表中的某个节点上启动。资源组管理器 (Resource Group Manager, RGM) 会选择一个最符合所配置的负载分配策略的节点。在资源组由 RGM 分配给节点后,每个节点上资源组的负载因子将会汇总来提供总负载。然后总负载会与该节点的负载限制相比较。
您可以在全局群集或区域群集中配置负载限制。
您设置的用以控制每个节点上负载分配的因子包括负载限制、资源组优先级和抢占模式。在全局群集中,您可设置 Concentrate_load 属性以选择首选负载分配策略:在不超过负载限制的情况下将资源组负载集中分配给尽可能少的节点,或者在所有可用节点之间尽可能均匀地分配负载。默认行为是分散资源组负载。每个资源组仍限定为仅在其节点列表中的节点上运行,不管负载因子和负载限制设置为何。
注 - 可以使用命令行、Oracle Solaris Cluster 管理器界面或 clsetup 实用程序配置资源组的负载分配。以下过程说明如何使用 clsetup 实用程序配置资源组的负载分配。有关使用命令行执行这些过程的说明,请参见《Oracle Solaris Cluster 系统管理指南》中的"配置负载限制"。
本节包含以下过程:
每个群集节点或区域都可以有自己的一组负载限制。将负载因子分配给资源组,负载因子与已定义的节点负载限制相对应。您可以设置软负载限制(可超出此限制)或硬负载限制(不得超过此限制)。
phys-schost# clsetup
此时将显示 clsetup 菜单。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
此时将显示 "Manage Load Limits"(管理负载限制)菜单。
您可以创建负载限制、修改负载限制或删除负载限制。
如果要对另一节点设置负载限制,请选择与该节点对应的选项编号,然后按回车键。选择了要配置负载限制的所有节点后,键入 q 并按回车键。
例如,键入 mem_load 作为负载限制的名称。
如果键入了 yes,请键入软限制值并按 Enter 键。
如果键入了 yes,请键入硬限制值并按 Enter 键。
此时将显示 Command completed successfully(已成功完成命令)消息以及针对您所选节点的软负载限制和硬负载限制。按回车键继续。
通过键入 q 并按回车键,返回上一菜单。
可以将某个资源组配置为具有较高优先级,以减小其从特定节点被替换的可能性。如果超出负载限制,可能会强制低优先级资源组脱机。
phys-schost# clsetup
此时将显示 clsetup 菜单。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
此时将显示 "Set the Priority of a Resource Group"(设置资源组的优先级)菜单。
此时将显示现有优先级值。默认优先级值为 500。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
负载因子是您基于负载限制分配给负载的值。负载因子分配给某个资源组,这些负载因子对应于节点的已定义负载限制。
phys-schost# clsetup
此时将显示 clsetup 菜单。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
此时将显示 "Set the load factors of a Resource Group"(设置资源组的负载因子)菜单。
例如,键入 mem_load@50,可对所选的资源组设置负载因子 mem_load。完成后按 Ctrl-D。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
preemption_mode 属性确定某个资源组是否因节点过载而被优先级较高的资源组从节点中抢占。该属性指示将一个资源组从一个节点移到另一节点的成本。
phys-schost# clsetup
此时将显示 clsetup 菜单。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
此时将显示 "Set the Preemption Mode of a Resource Group"(设置资源组的抢占模式)菜单。
如果为资源组设置了抢占模式,显示将如下所示:
The preemption mode property of "rg11" is currently set to the following: preemption mode: Has_Cost
三个选项分别为 Has_cost、No_cost 或 Never。
此时将显示 "Manage Resource Group Load Distribution"(管理资源组负载分配)菜单。
将 Concentrate_load 属性设置为 false,群集会在所有可用节点中均匀分配资源组负载。如果将此属性设置为 True,群集会尝试在不超出负载限制的情况下将资源组负载集中到尽可能少的节点上。默认情况下,Concentrate_load 属性设置为 False。您只能在全局群集中设置 Concentrate_load 属性,不能在区域群集中设置此属性。在区域群集中,默认设置始终为 False。
phys-schost# clsetup
此时将显示 clsetup 菜单。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
此时将显示 "Set the Concentrate Load Property of the Cluster"(设置群集的集中负载属性)菜单。
此时将显示当前值 TRUE 或 FALSE。
此时将显示 "Other Cluster Tasks"(其他群集任务)菜单。
注 - 如果您在安装 Oracle Solaris Cluster 软件之前安装了您自己的 /etc/inet/ntp.conf 文件,则不需要执行此过程。确定下一个步骤:
在您执行以下任何任务后,执行此任务来创建或修改 NTP 配置文件:
安装 Oracle Solaris Cluster 软件
向现有全局群集中添加节点
更改全局群集中节点的专用主机名
将节点添加到单节点群集中时,必须确保将所使用的 NTP 配置文件复制到原始群集节点以及新节点中。
注 - 请勿将 ntp.conf.cluster 文件重命名为 ntp.conf。
如果节点上不存在 /etc/inet/ntp.conf.cluster 文件,可能有一个以前安装 Oracle Solaris Cluster 软件时产生的 /etc/inet/ntp.conf 文件。如果节点上不存在 /etc/inet/ntp.conf 文件,Oracle Solaris Cluster 软件将创建 /etc/inet/ntp.conf.cluster 文件作为 NTP 配置文件。如果节点上存在 ntp.conf 文件,请改为对该文件执行以下编辑。
请等待每个节点上的命令成功完成,然后再继续执行步骤 5。
phys-schost# svcadm disable ntp
phys-schost# /etc/init.d/xntpd.cluster start
xntpd.cluster 启动脚本首先查找 /etc/inet/ntp.conf 文件。
如果 ntp.conf 文件存在,脚本将立即退出,而不启动 NTP 守护进程。
如果 ntp.conf 文件不存在,但 ntp.conf.cluster 文件存在,脚本将启动 NTP 守护进程。此时,脚本将 ntp.conf.cluster 文件用作 NTP 配置文件。
phys-schost# svcadm enable ntp
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果想要在专用互联上配置 IPsec,请转至如何在群集专用互连上配置 IP 安全体系结构 (IPsec)。
要配置 Solaris Volume Manager 软件,请转至 第 4 章。
要创建群集文件系统,请转至如何创建群集文件系统。
要在节点上创建非全局区域,请转至如何在全局群集节点上配置非全局区域。
请安装第三方应用程序、注册资源类型、设置资源组并配置数据服务。请参见应用程序软件随附的文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
您可以为 clprivnet 接口配置 IP 安全体系结构 (IPsec),以便在群集互连上提供安全的 TCP/IP 通信。
有关 IPsec 的信息,请参见《Oracle Solaris 管理:IP 服务》中的第 IV 部分, "IP 安全性"和 ipsecconf(1M) 手册页。有关 clprivnet 接口的信息,请参见 clprivnet(7) 手册页。
请在您想要配置为使用 IPsec 的每个全局群集投票节点上执行此过程。
phys-schost# ifconfig clprivnet0
请遵循《Oracle Solaris 管理:IP 服务》中的"如何使用 IPsec 保证两个系统之间的通信安全"中的说明。此外,请遵循以下准则:
确保这些地址的配置参数值在所有伙伴节点上均一致。
在配置文件中将每个策略配置为单独一行。
要实现 IPsec 而不重新引导,请遵循过程示例“"在不重新引导的情况下使用 IPsec 保证通信安全"”中的说明。
有关 sa unique 策略的更多信息,请参见 ipsecconf(1M) 手册页。
包括本地节点的 clprivnet IP 地址。
此功能将帮助驱动程序最好地利用群集专用网络的带宽,从而提供高分配粒度和更好的吞吐量。clprivnet 接口使用包的安全参数索引 (Security Parameter Index, SPI) 来条带化流量。
将此条目添加到为群集传输配置的策略规则。此设置为重新引导群集节点时重新生成安全关联提供了时间,并限制了重新引导节点可重新加入群集的时间范围。值为 30 秒便可。
phys-schost# vi /etc/inet/ike/config … { label "clust-priv-interconnect1-clust-priv-interconnect2" … p2_idletime_secs 30 } …
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
要配置 Solaris Volume Manager 软件,请转至 第 4 章。
要创建群集文件系统,请转至如何创建群集文件系统。
要在节点上创建非全局区域,请转至如何在全局群集节点上配置非全局区域。
请安装第三方应用程序、注册资源类型、设置资源组并配置数据服务。请参见应用程序软件随附的文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
否则,如果您完成了所有硬件和软件安装和配置任务,请验证群集。转至如何验证群集。
完成所有群集配置之后,使用 cluster check 命令验证群集配置和功能。有关更多信息,请参见 cluster(1CL) 手册页。
提示 - 为了便于将来参考或故障排除,对于运行的每个验证,请使用 -o outputdir 选项为日志文件指定子目录。重用现有的子目录名称将删除子目录中的所有现有文件。因此,为确保日志文件可供将来参考之用,请为运行的每个群集检查指定唯一的子目录名称。
开始之前
确保已在群集中完成所有硬件和软件组件(包括固件和修补程序)的安装和配置。
转到 My Oracle Support 的 "Patches & Updates"(修补程序和更新)选项卡。使用 "Advanced Search"(高级搜索),选择 "Solaris Cluster" 作为 "Product"(产品),并在 "Description"(描述)字段中指定 "check"(检查)来查找包含检查的 Oracle Solaris Cluster 修补程序。应用任何尚未安装在群集上的修补程序。
# cluster check -v -o outputdir
详细模式
将输出重定向到 outputdir 子目录。
该命令会运行所有可用的基本检查。不会影响任何群集功能。
# cluster check -v -k interactive -o outputdir
指定运行交互式验证检查
该命令会运行所有可用的交互式检查并提示您提供所需的群集相关信息。不会影响任何群集功能。
# cluster list-checks -k functional
例如,功能检查可能会引起节点出现紧急情况或故障转移到其他节点。
# cluster list-checks -v -C checkID
指定特定检查。
# cluster check -v -k functional -C checkid -o outputdir
指定运行功能验证检查
响应来自检查的提示,确认应运行该检查以及必须执行的任何信息或操作。
注 - 为了进行记录,请为所运行的每个检查指定唯一 outputdir 子目录名称。如果重用 outputdir 名称,则新检查的输出将覆写重用的 outputdir 子目录的现有内容。
示例 3-5 列出交互式验证检查
以下示例列出了可用于在群集上运行的所有交互式检查。示例输出显示了可能的检查样例;实际的可用检查因各配置而异
# cluster list-checks -k interactive Some checks might take a few moments to run (use -v to see progress)... I6994574 : (Moderate) Fix for GLDv3 interfaces on cluster transport vulnerability applied?
示例 3-6 运行功能验证检查
以下示例首先显示了功能检查的详细列表。随后列出了检查 F6968101 的详细描述,指出该检查会中断群集服务。群集将脱离生产环境。然后将运行功能检查,且详细输出会记录到 funct.test.F6968101.12Jan2011 子目录中。示例输出显示了可能的检查样例;实际的可用检查因各配置而异。
# cluster list-checks -k functional F6968101 : (Critical) Perform resource group switchover F6984120 : (Critical) Induce cluster transport network failure - single adapter. F6984121 : (Critical) Perform cluster shutdown F6984140 : (Critical) Induce node panic … # cluster list-checks -v -C F6968101 F6968101: (Critical) Perform resource group switchover Keywords: SolarisCluster3.x, functional Applicability: Applicable if multi-node cluster running live. Check Logic: Select a resource group and destination node. Perform '/usr/cluster/bin/clresourcegroup switch' on specified resource group either to specified node or to all nodes in succession. Version: 1.2 Revision Date: 12/10/10 Take the cluster out of production # cluster check -k functional -C F6968101 -o funct.test.F6968101.12Jan2011 F6968101 initializing... initializing xml output... loading auxiliary data... starting check run... pschost1, pschost2, pschost3, pschost4: F6968101.... starting: Perform resource group switchover ============================================================ >>> Functional Check <<< 'Functional' checks exercise cluster behavior. It is recommended that you do not run this check on a cluster in production mode.' It is recommended that you have access to the system console for each cluster node and observe any output on the consoles while the check is executed. If the node running this check is brought down during execution the check must be rerun from this same node after it is rebooted into the cluster in order for the check to be completed. Select 'continue' for more details on this check. 1) continue 2) exit choice: 1 ============================================================ >>> Check Description <<< … Follow onscreen directions
接下来的步骤
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
在完成全局群集配置之后且将其投入生产之前,请使用 Oracle Explorer 实用程序记录有关该群集的基本信息。如果将来需要排除群集故障,可以使用该数据。
服务工具包 (Services Tools Bundle) 中包含 Oracle Explorer 软件包 SUNWexplo 和 SUNWexplu。有关软件下载和安装的信息,请参见 http://www.oracle.com/us/support/systems/premier/services-tools-bundle-sun-systems-163717.html。
针对您的平台使用相应的命令。例如,要收集关于 Oracle 的 Sun Fire T1000 服务器的信息,请运行以下命令:
# explorer -i -w default,Tx000
有关更多信息,请参见 /opt/SUNWexplo/man/man1m/ 目录下的 explorer(1M) 手册页以及《Oracle Explorer Data Collector User’s Guide》(本指南可通过 My Oracle Support 上的“说明 1153444.1”获取):
explorer 输出文件以 explorer.hostid.hostname-date.tar.gz 形式保存到 /opt/SUNWexplo/output/ 目录下。
按《Oracle Explorer Data Collector User's Guide》中介绍的过程使用 FTP 或 HTTPS 来提交 Oracle Explorer 文件。
如果在对群集的技术问题进行诊断时需要 explorer 输出数据,Oracle Explorer 数据库可使 Oracle 技术支持人员获取这些数据。