跳过导航链接 | |
退出打印视图 | |
Oracle Solaris Cluster 软件安装指南 Oracle Solaris Cluster 4.0 (简体中文) |
1. 规划 Oracle Solaris Cluster 配置
在所有节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在所有节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在所有节点上配置 Oracle Solaris Cluster 软件 (XML)
安装和配置 Oracle Solaris 和 Oracle Solaris Cluster 软件(自动化安装程序)
如何安装和配置 Oracle Solaris 和 Oracle Solaris Cluster 软件(自动化安装程序)
在其他全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)
如何在其他全局群集节点上配置 Oracle Solaris Cluster 软件(XML 文件)
本节介绍了建立新的全局群集或向现有群集中添加节点的相关信息和过程。全局群集节点可以是物理计算机、Oracle VM Server for SPARC I/O 域或 Oracle VM Server for SPARC 来宾域。一个群集可以包含上述任意节点类型的组合。开始执行这些任务之前,请确保您已按照安装软件所述安装了 Oracle Solaris OS、Oracle Solaris Cluster 框架及其他产品的软件包。
下面的任务列表分别列出了建立新的全局群集时以及向现有全局群集中添加节点时要执行的任务。按照以下顺序完成操作。
表 3-1 任务列表:建立新的全局群集
|
表 3-2 任务列表:向现有全局群集中添加节点
|
scinstall 实用程序可在“典型”和“自定义”这两种模式下运行。对于 Oracle Solaris Cluster 软件的“典型”安装,scinstall 将自动指定以下配置默认值。
172.16.0.0
255.255.240.0
恰好两个适配器
switch1 和 switch2
已启用
已限制
填写以下群集配置工作单之一,完成“典型”模式或“自定义”模式安装:
“典型”模式工作单-如果将使用“典型”模式并接受所有默认值,请填写以下工作单。
|
“自定义”模式工作单-如果将使用“自定义”模式并自定义配置数据,请填写以下工作单。
注 - 如果要安装单节点群集,那么即使该群集不使用专用网络,scinstall 实用程序也会自动指定默认的专用网络地址和网络掩码。
|
请从全局群集的一个节点中执行此过程,以便在群集的所有节点上配置 Oracle Solaris Cluster 软件。
按照以下指导在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件的要求的更多信息,请参见如何安装 Oracle Solaris 软件。
确保已禁用 NWAM。有关说明,请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件并创建域。
确保在每个节点上安装了 Oracle Solaris Cluster 软件包和更新。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确保已配置了您希望用作已标记 VLAN 适配器的所有适配器并且您拥有其 VLAN ID。
确保您的“典型”模式或“自定义”模式的完整安装工作单可用。请参见在所有节点上配置 Oracle Solaris Cluster 软件 (scinstall)。
请按照交换机文档中的过程来确定 NDP 是否处于启用状态,如果是,则禁用 NDP。
在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包,则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。
建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。
或者,如果为您的用户帐户指定了系统管理员配置文件,则通过配置文件 shell 作为非超级用户发出命令,或使用 pfexec 命令给该命令加上前缀。
针对 RPC 的 Oracle Solaris TCP 包装功能阻止群集配置所必需的节点间通信。
如果 config/enable_tcpwrappers 设置为 true,则 TCP 包装处于启用状态,如以下示例命令输出中所示。
# svccfg -s rpc/bind listprop config/enable_tcpwrappers config/enable_tcpwrappers boolean true
# svccfg -s rpc/bind setprop config/enable_tcpwrappers = false # svcadm refresh rpc/bind # svcadm restart rpc/bindEntry 2
# ipadm create-ip interface # ipadm create-addr -T static -a local=address/prefix-length addrobj
有关更多信息,请参见《Oracle Solaris 管理:网络接口和网络虚拟化》中的"如何配置 IP 接口"。
在初始群集配置期间,除非群集中存在非链路本地 IPv6 公共网络接口,否则不会根据匹配的子网自动创建 IPMP 组。这些组使用传递式探测器进行接口监视,因此无需任何测试地址。
如果这些自动创建的 IPMP 组不能满足您的需求,或者由于您的配置包含一个或多个非链路本地 IPv6 公共网络接口而导致无法创建 IPMP 组时,请执行以下操作之一:
有关更多信息,请参见《Oracle Solaris 管理:网络接口和网络虚拟化》中的"配置 IPMP 组"。
phys-schost# scinstall
*** Main Menu *** Please select from one of the following (*) options: * 1) Create a new cluster or add a cluster node * 2) Print release information for this cluster node * ?) Help with menu options * q) Quit Option: 1
将显示“新建群集和群集节点”菜单。
将显示“典型模式或自定义模式”菜单。
将显示“创建新群集”屏幕。阅读相关要求,然后按 Ctrl-D 组合键继续。
scinstall 实用程序用于安装和配置所有群集节点并重新引导群集。将所有节点成功引导到群集中之后,即建立了群集。安装 Oracle Solaris Cluster 时的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
phys-schost# clquorum reset
当所有受监视的共享磁盘路径都发生故障时,如果至少有一个磁盘可从群集中的另一节点访问,则此功能会自动重新引导节点。
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
如果未向 /etc/hosts.allow 文件执行此添加,TCP 包装将阻止群集管理实用程序通过 RPC 进行节点间通信。
# /usr/sbin/ipadm show-addr ADDROBJ TYPE STATE ADDR clprivnet0/N static ok ip-address/netmask-length …
有关修改自动挂载程序映射的更多信息,请参见《Oracle Solaris 管理:网络服务》中的"涉及映射的管理任务"。
示例 3-1 在所有节点上配置 Oracle Solaris Cluster 软件
以下示例显示了当 scinstall 在双节点群集 schost 上完成配置任务时记录的 scinstall 进度消息。该群集是在“典型”模式下使用 scinstall 实用程序从 phys-schost-1 安装的。另一个群集节点为 phys-schost-2。适配器名称为 net2 和 net3。法定设备的自动选择已启用。
Log file - /var/cluster/logs/install/scinstall.log.24747 Configuring global device using lofi on pred1: done Starting discovery of the cluster transport configuration. The following connections were discovered: phys-schost-1:net2 switch1 phys-schost-2:net2 phys-schost-1:net3 switch2 phys-schost-2:net3 Completed discovery of the cluster transport configuration. Started cluster check on "phys-schost-1". Started cluster check on "phys-schost-2". cluster check completed with no errors or warnings for "phys-schost-1". cluster check completed with no errors or warnings for "phys-schost-2". Configuring "phys-schost-2" … done Rebooting "phys-schost-2" … done Configuring "phys-schost-1" … done Rebooting "phys-schost-1" … Log file - /var/cluster/logs/install/scinstall.log.24747
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后再次执行此过程。
接下来的步骤
如果安装了单节点群集,则已建立完群集。请转至创建群集文件系统以安装卷管理软件并配置群集。
如果已安装多节点群集并选择自动法定配置,则安装后设置已完成。请转至如何检验法定配置和安装模式。
如果已安装多节点群集并拒绝自动法定配置,请执行安装后设置。请转至如何配置法定设备。
如果要在群集中配置任何法定设备,请转至如何配置法定设备。
否则,请转至如何检验法定配置和安装模式。
要使用 XML 群集配置文件来配置新全局群集,请执行以下过程。新群集可以是某个运行 Oracle Solaris Cluster 4.0 软件的现有群集的副本。
此过程将对群集中的以下组成部分进行配置:
群集名称
群集节点成员身份
群集互连
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件的要求的更多信息,请参见如何安装 Oracle Solaris 软件。
确保已禁用 NWAM。有关说明,请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件并创建域。
确保已配置了您希望用作已标记 VLAN 适配器的所有适配器并且您拥有其 VLAN ID。
确保已在要配置的每个节点上安装了 Oracle Solaris Cluster 4.0 软件和更新。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
phys-schost# /usr/sbin/clinfo -n
clinfo: node is not configured as part of acluster: Operation not applicable
此消息表明潜在节点上尚未配置 Oracle Solaris Cluster 软件。
返回某个节点 ID 表明该节点上已配置了 Oracle Solaris Cluster 软件。
如果所有的潜在群集节点上都尚未配置 Oracle Solaris Cluster 软件,请继续执行步骤 2。
针对 RPC 的 Oracle Solaris TCP 包装功能阻止群集配置所必需的节点间通信。
如果 config/enable_tcpwrappers 设置为 true,则 TCP 包装处于启用状态,如以下示例命令输出中所示。
# svccfg -s rpc/bind listprop config/enable_tcpwrappers config/enable_tcpwrappers boolean true
# svccfg -s rpc/bind setprop config/enable_tcpwrappers = false # svcadm refresh rpc/bind # svcadm restart rpc/bindEntry 2
请按照交换机文档中的过程来确定 NDP 是否处于启用状态,如果是,则禁用 NDP。
在配置群集期间,软件将检查专用互连中是否不存在通信流量。如果在检查专用互连通信流量时,NDP 向专用适配器发送任何软件包,则该软件将认为此互连不是专用的,并且将中断群集配置。因此,在创建群集期间,必须禁用 NDP。
建立群集后,如果要使用该功能,可以对专用互连交换机重新启用 NDP 。
phys-schost# cluster export -o clconfigfile
指定输出目标。
群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。
有关更多信息,请参见 cluster(1CL) 手册页。
您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。
提供或修改 XML 元素的值,以反映您要创建的群集配置。
如果要复制现有群集,请打开借助于 cluster export 命令创建的文件。
如果不打算复制现有群集,请创建一个新文件。
请基于 clconfiguration(5CL) 手册页中显示的元素分层结构来编辑该文件。您可以将该文件存储到要配置为群集节点的其他主机所能访问的任一目录下。
为了能建立群集,群集配置 XML 文件中的以下组成部分必须具有有效值:
群集名称
群集节点
群集传输
如果您正在修改从现有群集中导出的配置信息,则必须更改某些值(如节点名称)以反映新群集的情况,这些值会用于多个群集对象的定义中。
有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。
phys-schost# /usr/share/src/xmllint --valid --noout clconfigfile
有关更多信息,请参见 xmllint(1) 手册页。
phys-schost# cluster create -i clconfigfile
指定要用作输入源的群集配置 XML 文件的名称。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
如果未向 /etc/hosts.allow 文件执行此添加,TCP 包装将阻止群集管理实用程序通过 RPC 进行节点间通信。
# /usr/sbin/ipadm show-addr ADDROBJ TYPE STATE ADDR clprivnet0/N static ok ip-address/netmask-length …
有关修改自动挂载程序映射的更多信息,请参见《Oracle Solaris 管理:网络服务》中的"涉及映射的管理任务"。
如果创建了双节点群集,则必须配置一个法定设备。如果您选择不使用群集配置 XML 文件来创建所需的法定设备,请转至如何配置法定设备。
按照如何安装和配置Oracle Solaris Cluster 法定服务器软件中的说明进行操作。
请参见《Oracle Solaris Cluster With Network-Attached Storage Device Manual》。
phys-schost# xmllint --valid --noout clconfigfile
phys-schost# clquorum add -i clconfigfile device-name
指定要配置为法定设备的设备的名称。
phys-schost# clquorum reset
phys-schost# claccess deny-all
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
示例 3-2 使用 XML 文件在所有节点上配置 Oracle Solaris Cluster 软件
以下示例将一个现有双节点群集的群集配置和法定配置复制到了一个新的双节点群集中。新群集安装有 Solaris 11 OS。群集配置将从现有群集节点 phys-oldhost-1 导出到群集配置 XML 文件 clusterconf.xml 中。新群集的节点名称为 phys-newhost-1 和 phys-newhost-2。在新群集中被配置为法定设备的设备是 d3。
此示例中的提示符名称 phys-newhost-N 表示应在这两个群集节点上执行相应的命令。
phys-newhost-N# /usr/sbin/clinfo -n clinfo: node is not configured as part of a cluster: Operation not applicable phys-oldhost-1# cluster export -o clusterconf.xml Copy clusterconf.xml to phys-newhost-1 and modify the file with valid values phys-newhost-1# xmllint --valid --noout clusterconf.xml No errors are reported phys-newhost-1# cluster create -i clusterconf.xml phys-newhost-N# svcs multi-user-server STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default phys-newhost-1# clnode status Output shows that both nodes are online phys-newhost-1# clquorum add -i clusterconf.xml d3 phys-newhost-1# clquorum reset
完全建立了群集之后,您可以从现有群集中复制其他群集组成部分的配置。如果尚未这样做,请修改要复制的 XML 元素的值,以反映要将该组件添加到其中的群集配置。例如,如果要复制资源组,请确保 <resourcegroupNodeList> 条目包含的是对新群集而言有效的节点名称,而不是所复制的群集中的节点名称,除非这些节点名称与新群集中的节点名称相同。
要复制群集组件,请对要复制的群集组件运行面向对象命令的 export 子命令。有关面向对象命令的语法和选项的更多信息,请参见要复制的群集对象所对应的手册页。
下面介绍了在建立群集之后可以通过群集配置 XML 文件创建的群集组件的列表。此列表包括了用来复制组件的命令的手册页:
设备组:Solaris Volume Manager:cldevicegroup(1CL)
对于 Solaris Volume Manager,应首先创建您在群集配置 XML 文件中指定的磁盘集。
资源组管理器组件
共享地址资源:clressharedaddress(1CL)
逻辑主机名资源:clreslogicalhostname(1CL)
资源类型:clresourcetype(1CL)
使用 clresource、clressharedaddress 或 clreslogicalhostname 命令的 -a 选项,还可以在复制资源的同时复制与之相关联的资源类型和资源组。如果不使用该选项,则在添加资源之前必须先将其资源类型和资源组添加到群集中。
NAS 设备:clnasdevice(1CL)
必须首先按照 NAS 设备文档中的介绍设置此类设备。
SNMP 主机:clsnmphost(1CL)
clsnmphost create -i 命令要求您用 -f 选项指定用户密码文件。
SNMP 用户:clsnmpuser(1CL)
用来监视群集对象中的系统资源的阈值:cltelemetryattribute(1CL)
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后再次执行此过程。
接下来的步骤
请转至如何检验法定配置和安装模式。
在群集的 scinstall 自动化安装程序 (Automated Installer, AI) 安装过程中,选择以下列方式之一运行 Oracle Solaris 软件的安装:
运行应用所有默认设置的非交互式 Oracle Solaris 安装。
运行交互式 Oracle Solaris 安装并指定要应用的所有非默认设置。
有关 Oracle Solaris 软件交互式安装的更多信息,请参见《安装 Oracle Solaris 11 系统》中的"使用文本安装程序安装"。
scinstall 实用程序可在“典型”和“自定义”这两种模式下运行。对于 Oracle Solaris Cluster 软件的“典型”安装,scinstall 将自动指定以下配置默认值。
172.16.0.0
255.255.240.0
恰好两个适配器
switch1 和 switch2
已启用
已限制
填写以下群集配置工作单之一,完成“典型”模式或“自定义”模式安装:
“典型”模式工作单-如果将使用“典型”模式并接受所有默认值,请填写以下工作单。
|
“自定义”模式工作单-如果将使用“自定义”模式并自定义配置数据,请填写以下工作单。
注 - 如果要安装单节点群集,那么即使该群集不使用专用网络,scinstall 实用程序还是会自动使用默认的专用网络地址和网络掩码。
|
此过程介绍了如何设置和使用 scinstall(1M) 定制自动化安装程序安装方法。此方法可一次性在所有全局群集节点上安装 Oracle Solaris OS 与 Oracle Solaris Cluster 框架和数据服务,并建立群集。这些节点可以是物理计算机或(仅限 SPARC)Oracle VM Server for SPARC I/O 域或来宾域,也可以是这些类型的节点的任意组合。
注 - 如果为物理群集计算机配置了 Oracle VM Server for SPARC,请将 Oracle Solaris Cluster 软件仅安装在 I/O 域或来宾域中。
按照以下指导在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
开始之前
执行以下任务:
确保安装 Solaris 软件之前已安装了硬件并且检验了连接。有关如何设置硬件的详细信息,请参见《Oracle Solaris Cluster Hardware Administration Manual》以及您的服务器和存储设备的相关文档。
确保已配置了一个自动化安装程序安装服务器和一个 DHCP 服务器。请参见《安装 Oracle Solaris 11 系统》中的第 III 部分, "使用安装服务器安装"。
确定群集节点的以太网地址以及该地址所属的子网的子网掩码长度。
确定每个群集节点的 MAC 地址。
确保群集配置规划完整。有关要求和指导,请参见如何准备群集软件安装。
设置用于群集节点的超级用户密码。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件并创建域。
确定要安装哪些 Oracle Solaris Cluster 软件包。
下表列出了在 AI 安装期间您可以选择的 Oracle Solaris Cluster 4.0 软件的组软件包以及每个组软件包所包含的主要功能。至少必须安装 ha-cluster-framework-minimal 组软件包。
|
确保您的“典型”模式或“自定义”模式的完整安装工作单可用。请参见安装和配置 Oracle Solaris 和 Oracle Solaris Cluster 软件(自动化安装程序)。
确保 AI 安装服务器符合下列要求。
安装服务器与群集节点位于同一子网中。
安装服务器本身不是群集节点。
安装服务器运行着 Oracle Solaris Cluster 软件支持的某个 Oracle Solaris OS 发行版。
每个新的群集节点都配置为一个定制的 AI 安装客户机,该客户机使用您为 Oracle Solaris Cluster 安装设置的定制 AI 目录。
按照与您的软件平台和 OS 版本相应的说明来设置 AI 安装服务器和 DHCP 服务器。请参见《安装 Oracle Solaris 11 系统》中的第 8 章 "设置安装服务器"和《Oracle Solaris 管理:IP 服务》中的第 II 部分, "DHCP"。
installserver# pkg publisher PUBLISHER TYPE STATUS URI solaris origin online solaris-repository ha-cluster origin online ha-cluster-repository
installserver# pkg install ha-cluster/system/install
installserver# /usr/cluster/bin/scinstall
将显示 scinstall 的主菜单。
*** Main Menu *** Please select from one of the following (*) options: * 1) Install and configure a cluster from this Automated Installer install server * 2) Print release information for this Automated Installer install server * ?) Help with menu options * q) Quit Option: 1
针对 RPC 的 Oracle Solaris TCP 包装功能阻止群集配置所必需的节点间通信。
如果 config/enable_tcpwrappers 设置为 true,则 TCP 包装处于启用状态,如以下示例命令输出中所示。
# svccfg -s rpc/bind listprop config/enable_tcpwrappers config/enable_tcpwrappers boolean true
# svccfg -s rpc/bind setprop config/enable_tcpwrappers = false # svcadm refresh rpc/bind # svcadm restart rpc/bindEntry 2
这将以默认配置安装 Oracle Solaris 软件。
注 - 如果要定制 Oracle Solaris 安装,不能使用此方法。如果您选择 Oracle Solaris 交互式安装,则会绕过自动化安装程序并且不会安装和配置 Oracle Solaris Cluster 软件。要在安装过程中定制 Oracle Solaris,请按照如何安装 Oracle Solaris 软件中的说明进行操作,然后按照如何安装 Oracle Solaris Cluster 框架和数据服务软件包中的说明安装并配置群集。
phys-schost# shutdown -g0 -y -i0
ok boot net:dhcp - install
注 - 命令中破折号 (-) 的两端需加空格。
# reboot -p
此时将显示 GRUB 菜单,其中包含两个类似于以下内容的菜单项:
Oracle Solaris 11 11/11 Text Installer and command line Oracle Solaris 11 11/11 Automated Install
注 - 如果在 20 秒内没有选择“自动安装”项,系统将使用默认的交互式文本安装程序方法继续进行安装,此方法不会安装和配置 Oracle Solaris Cluster 软件。
在每个节点上,将创建一个新的引导环境 (Boot Environment, BE),并且自动化安装程序会安装 Oracle Solaris OS 和 Oracle Solaris Cluster 软件。当安装成功完成时,每个节点被完全安装为一个新的群集节点。安装 Oracle Solaris Cluster 时的输出信息记录在每个节点上的 /var/cluster/logs/install/scinstall.log. N 文件中。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
# beadm activate BE-name
# shutdown -y -g0 -i0
注 - 不要使用 reboot 或 halt 命令。这些命令不会激活新的 BE。
ok boot
显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。
有关基于 GRUB 的引导的更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》。
有关修改自动挂载程序映射的更多信息,请参见《Oracle Solaris 管理:网络服务》中的"涉及映射的管理任务"。
如果无法访问登录提示,该值的设置使您能够重新引导节点。
grub edit> kernel /platform/i86pc/kernel/amd64/unix -B $ZFS-BOOTFS -k
有关更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》中的"如何在启用内核调试器 (kmdb) 的情况下引导系统"。
以下任务要求重新引导:
安装要求重新引导节点或群集的软件更新
对配置进行需要重新引导以便激活的更改
phys-schost-1# cluster shutdown -y -g0 cluster-name
注 - 只有等到群集关闭之后,才能重新引导群集中第一个安装的节点。禁用群集安装模式前,只有建立群集的第一个安装节点才有法定选票。在所建立的、仍处于安装模式的群集中,如果在重新引导第一个安装的节点前未关闭群集,则其余群集节点将无法获得法定投票。然后整个群集将关闭。
这些群集节点会一直处在安装模式下,直到您首次运行 clsetup 命令为止。您将在执行如何配置法定设备过程期间运行此命令。
ok boot
显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。
有关基于 GRUB 的引导的更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》。
将所有节点成功引导到群集中之后,即建立了群集。安装 Oracle Solaris Cluster 时的输出信息记录在 /var/cluster/logs/install/scinstall.log.N 文件中。
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
如果未向 /etc/hosts.allow 文件执行此添加,TCP 包装将阻止群集管理实用程序通过 RPC 进行节点间通信。
# /usr/sbin/ipadm show-addr ADDROBJ TYPE STATE ADDR clprivnet0/N static ok ip-address/netmask-length …
phys-schost# clnode set -p reboot_on_path_failure=enabled
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
接下来的步骤
1. 执行下列过程中适用于您的群集配置的所有过程。
2. 配置法定设置(如果尚未配置)并执行安装后任务。
如果您安装了多节点群集并接受了自动的法定配置,则安装后设置已完成。请转至如何检验法定配置和安装模式。
如果已安装多节点群集并拒绝自动法定配置,请执行安装后设置。请转至如何配置法定设备。
如果向现有的双节点群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
如果向包含至少三个节点且使用了法定设备的现有群集中添加了新节点,请转至如何在向全局群集中添加节点后更新法定设备。
如果向包含至少三个节点且未使用法定设备的现有群集中添加了新节点,请验证该群集的状态。请转至如何检验法定配置和安装模式。
如果安装了单节点群集,则已建立完群集。请转至创建群集文件系统以安装卷管理软件并配置群集。
故障排除
已禁用 scinstall 选项-如果 scinstall 命令的 AI 选项前面没有星号,则说明该选项处于禁用状态。这种情况表明 AI 设置未完成或设置出错。要纠正这种情况,请首先退出 scinstall 实用程序。重新执行步骤 1 至步骤 7 以更正 AI 设置,然后重新启动 scinstall 实用程序。
要在添加新的群集节点之前做好群集准备工作,请在现有的全局群集节点上执行以下过程。
开始之前
执行以下任务:
确保已安装所有必需的硬件。
确保新节点上已安装主机适配器。请参见《Oracle Solaris Cluster Hardware Administration Manual》。
检验是否存在任何现有的群集互连可以支持新节点。请参见《Oracle Solaris Cluster Hardware Administration Manual》。
确保已安装任何附加存储器。
phys-schost# clinterconnect show
添加节点之前,必须具有已配置的至少两条电缆或两个适配器。
phys-schost# clsetup
按照说明指定要添加到群集中的节点的名称、传输适配器的名称以及是否使用传输交换机。
phys-schost# clinterconnect show
命令输出结果应该显示至少两个群集互连的配置信息。
phys-schost# cluster show-netprops
输出类似于以下内容:
=== Private Network === private_netaddr: 172.16.0.0 private_netmask: 255.255.240.0 max_nodes: 64 max_privatenets: 10 max_zoneclusters: 12
请转至如何在添加节点或专用网络时更改专用网络配置。必须先关闭群集才能更改专用 IP 地址范围。这期间还要将每个资源组切换到脱机状态,禁用群集中的所有资源,然后重新引导到非群集模式下,在此之后才可以重新配置 IP 地址范围。
接下来的步骤
在新群集节点上配置 Oracle Solaris Cluster 软件。转至如何在附加全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)或如何在其他全局群集节点上配置 Oracle Solaris Cluster 软件(XML 文件)。
执行此任务可更改全局群集的专用 IP 地址范围,以适应下列一个或多个群集组件数量的增加:
节点或非全局区域数
专用网络数
区域群集数
此过程也可以用来缩小专用 IP 地址范围。
注 - 该过程需要关闭整个群集。如果只需要更改网络掩码(例如,为了添加区域群集支持),请勿执行此过程。而应改而从在群集模式下运行的全局群集节点中运行以下命令,以指定预期的区域群集数量:
phys-schost# cluster set-netprops num_zoneclusters=N
该命令无需关闭群集。
# clsetup
屏幕上将显示 clsetup 主菜单。
将显示“资源组”菜单。
# cluster status -t resource,resourcegroup
限定为仅输出指定的群集对象
指定资源
指定资源组
# cluster shutdown -g0 -y
指定等待时间(以秒为单位)
禁止发出用于询问您是否确认要关闭的提示
ok boot -x
有关基于 GRUB 的引导的更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》。
屏幕将显示编辑后的命令。
注 - 对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请执行上述步骤以再次将 -x 选项添加到内核引导参数命令中。
在非群集模式下运行时,clsetup 实用程序会为非群集模式操作显示主菜单。
clsetup 实用程序显示当前的专用网络配置,然后询问您是否要更改此配置。
clsetup 实用程序将显示默认的专用网络 IP 地址 172.16.0.0,并询问您是否接受此默认值。
clsetup 实用程序将提示您输入新的专用网络 IP 地址。
clsetup 实用程序显示默认网络掩码,然后询问您是否接受该默认网络掩码。
默认网络掩码为 255.255.240.0。此默认 IP 地址范围支持在群集中包含最多 64 个节点、12 个区域群集和 10 个专用网络。
当您拒绝默认网络掩码时,clsetup 实用程序将提示您输入要在群集中配置的节点、专用网络和区域群集的数量。
clsetup 实用程序将根据这些数字计算出两个网络掩码供选择:
第一个网络掩码是支持指定节点、专用网络和区域群集数目的最小网络掩码。
第二个网络掩码可支持两倍于指定值的节点、专用网络和区域群集数目,从而适应未来可能出现的增长情况。
# shutdown -g0 -y
ok boot
显示 GRUB 菜单后,选择相应的 Oracle Solaris 条目,然后按 Enter 键。
有关基于 GRUB 的引导的更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》。
# clsetup
屏幕上将显示 clsetup 主菜单。
将显示“资源组”菜单。
如果节点包含非全局区域,还应使这些区域内的所有资源组联机。
键入 q 退出每个子菜单,或者按 Ctrl-C。
接下来的步骤
要向现有的群集中添加节点,请转至以下过程之一:
scinstall 实用程序可在“典型”和“自定义”这两种模式下运行。对于 Oracle Solaris Cluster 软件的“典型”安装,scinstall 会自动将群集传输交换机指定为 switch1 和 switch2。
完成以下配置规划工作单之一。有关规划指导,请参见规划 Oracle Solaris OS和规划 Oracle Solaris Cluster 环境。
“典型”模式工作单-如果将使用“典型”模式并接受所有默认值,请填写以下工作单。
|
“自定义”模式工作单-如果将使用“自定义”模式并自定义配置数据,请填写以下工作单。
|
执行此过程,向现有全局群集中添加新节点。要使用自动化安装程序添加新节点,请按照如何安装和配置 Oracle Solaris 和 Oracle Solaris Cluster 软件(自动化安装程序)中的说明执行操作。
按照以下指导在此过程中使用交互式的 scinstall 实用程序:
交互式的 scinstall 使您可以提前键入。因此,如果未立即显示下一个菜单屏幕,请勿多次按回车键。
除非另外指明,否则按 Ctrl-D 键可返回到一系列相关问题的开始处或者返回到主菜单。
默认答案或先前会话的答案将显示在问题末尾的方括号 ([ ]) 中。按回车键即可输入方括号中的答复而无需键入。
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件的要求的更多信息,请参见如何安装 Oracle Solaris 软件。
确保已禁用 NWAM。有关说明,请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件并创建域。
确保在节点上安装了 Oracle Solaris Cluster 软件包和更新。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确保群集已为添加新节点做好了准备。请参见如何在添加全局群集节点之前做好群集准备工作。
确保您的“典型”模式或“自定义”模式的完整安装工作单可用。请参见在其他全局群集节点上配置 Oracle Solaris Cluster 软件 (scinstall)。
针对 RPC 的 Oracle Solaris TCP 包装功能阻止群集配置所必需的节点间通信。
如果 config/enable_tcpwrappers 设置为 true,则 TCP 包装处于启用状态,如以下示例命令输出中所示。
# svccfg -s rpc/bind listprop config/enable_tcpwrappers config/enable_tcpwrappers boolean true
# svccfg -s rpc/bind setprop config/enable_tcpwrappers = false # svcadm refresh rpc/bind # svcadm restart rpc/bindEntry 2
# ipadm create-ip interface # ipadm create-addr -T static -a local=address/prefix-length addrobj
有关更多信息,请参见《Oracle Solaris 管理:网络接口和网络虚拟化》中的"如何配置 IP 接口"。
在初始群集配置期间,除非群集中存在非链路本地 IPv6 公共网络接口,否则不会根据匹配的子网自动创建 IPMP 组。这些组使用传递式探测器进行接口监视,因此无需任何测试地址。
如果这些自动创建的 IPMP 组不能满足您的需求,或者由于您的配置包含一个或多个非链路本地 IPv6 公共网络接口而导致无法创建 IPMP 组时,请执行以下操作之一:
有关更多信息,请参见《Oracle Solaris 管理:网络接口和网络虚拟化》中的"配置 IPMP 组"。
phys-schost-new# /usr/cluster/bin/scinstall
将显示 scinstall 的主菜单。
*** Main Menu *** Please select from one of the following (*) options: * 1) Create a new cluster or add a cluster node * 2) Print release information for this cluster node * ?) Help with menu options * q) Quit Option: 1
将显示“新建群集和群集节点”菜单。
scinstall 实用程序可配置节点并将该节点引导到群集中。
如果某个节点上的服务尚未处于联机状态,请等待直到状态变为联机后,再继续执行下一步。
phys-schost# svcs multi-user-server node STATE STIME FMRI online 17:52:55 svc:/milestone/multi-user-server:default
phys-schost# claccess deny-all
或者,您也可以使用 clsetup 实用程序。有关过程,请参见《Oracle Solaris Cluster 系统管理指南》中的"如何向现有群集添加节点"。
phys-schost# clnode status
输出类似于以下内容。
=== Cluster Nodes === --- Node Status --- Node Name Status --------- ------ phys-schost-1 Online phys-schost-2 Online phys-schost-3 Online
有关更多信息,请参见 clnode(1CL) 手册页。
如果未向 /etc/hosts.allow 文件执行此添加,TCP 包装将阻止群集管理实用程序通过 RPC 进行节点间通信。
# /usr/sbin/ipadm show-addr ADDROBJ TYPE STATE ADDR clprivnet0/N static ok ip-address/netmask-length …
phys-schost# pkg list
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
有关修改自动挂载程序映射的更多信息,请参见《Oracle Solaris 管理:网络服务》中的"涉及映射的管理任务"。
示例 3-3 在新增的节点上配置 Oracle Solaris Cluster 软件
以下示例显示了如何将节点 phys-schost-3 添加到群集 schost 中。发起节点为 phys-schost-1。
Adding node "phys-schost-3" to the cluster configuration ... done Adding adapter "net2" to the cluster configuration ... done Adding adapter "net3" to the cluster configuration ... done Adding cable to the cluster configuration ... done Adding cable to the cluster configuration ... done Copying the config from "phys-schost-1" ... done Copying the postconfig file from "phys-schost-1" if it exists ... done Setting the node ID for "phys-schost-3" ... done (id=1) Verifying the major number for the "did" driver from "phys-schost-1" ... done Initializing NTP configuration ... done Updating nsswitch.conf ... done Adding cluster node entries to /etc/inet/hosts ... done Configuring IP Multipathing groups in "/etc/hostname.<adapter>" files Updating "/etc/hostname.hme0". Verifying that power management is NOT configured ... done Ensure that the EEPROM parameter "local-mac-address?" is set to "true" ... done Ensure network routing is disabled ... done Network routing has been disabled on this node by creating /etc/notrouter. Having a cluster node act as a router is not supported by Oracle Solaris Cluster. Please do not re-enable network routing. Updating file ("ntp.conf.cluster") on node phys-schost-1 ... done Updating file ("hosts") on node phys-schost-1 ... done Log file - /var/cluster/logs/install/scinstall.log.6952 Rebooting ...
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后再次执行此过程。
接下来的步骤
如果向使用法定设备的现有群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
否则,请转至如何检验法定配置和安装模式。
请执行以下过程,以便使用 XML 群集配置文件来配置新的全局群集节点。新节点可以是某个运行 Oracle Solaris Cluster 4.0 软件的现有群集节点的副本。
此过程将对新节点上的下列群集组成部分进行配置:
群集节点成员身份
群集互连
全局设备
开始之前
执行以下任务:
确保已安装了 Oracle Solaris OS 来支持 Oracle Solaris Cluster 软件。
如果节点上已安装了 Oracle Solaris 软件,必须确保 Oracle Solaris 安装满足 Oracle Solaris Cluster 软件和您打算在群集中安装的任何其他软件的要求。有关安装 Oracle Solaris 软件以满足 Oracle Solaris Cluster 软件的要求的更多信息,请参见如何安装 Oracle Solaris 软件。
确保已禁用 NWAM。有关说明,请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
SPARC: 如果要将 Oracle VM Server for SPARC I/O 域或来宾域配置为群集节点,请确保将 Oracle VM Server for SPARC 软件安装到每台物理计算机上,而且这些域满足 Oracle Solaris Cluster 要求。请参见SPARC: 如何安装 Oracle VM Server for SPARC 软件并创建域。
确保已在节点上安装了 Oracle Solaris Cluster 软件包和所有必需的更新。请参见如何安装 Oracle Solaris Cluster 框架和数据服务软件包。
确保群集已为添加新节点做好了准备。请参见如何在添加全局群集节点之前做好群集准备工作。
phys-schost-new# /usr/sbin/clinfo -n
节点上尚未配置 Oracle Solaris Cluster 软件。可以将潜在节点添加到群集中。
必须先删除现有的群集配置信息,然后才能将节点添加到其他群集中。
ok boot -x
有关基于 GRUB 的引导的更多信息,请参见《在 x86 平台上引导和关闭 Oracle Solaris》。
屏幕将显示编辑后的命令。
注 - 对内核引导参数命令所做的这一更改在系统引导后将失效。下次重新引导节点时,系统将引导至群集模式。如果希望引导至非群集模式,请执行上述步骤以再次将 -x 选项添加到内核引导参数命令中。
phys-schost-new# /usr/cluster/bin/clnode remove
phys-schost# clnode export -o clconfigfile
指定输出目标。
群集配置 XML 文件的名称。所指定的文件名可以是一个现有文件,也可以是一个将使用上述命令创建的新文件。
有关更多信息,请参见 clnode(1CL) 手册页。
针对 RPC 的 Oracle Solaris TCP 包装功能阻止群集配置所必需的节点间通信。
如果 config/enable_tcpwrappers 设置为 true,则 TCP 包装处于启用状态,如以下示例命令输出中所示。
# svccfg -s rpc/bind listprop config/enable_tcpwrappers config/enable_tcpwrappers boolean true
# svccfg -s rpc/bind setprop config/enable_tcpwrappers = false # svcadm refresh rpc/bind # svcadm restart rpc/bindEntry 2
如果要复制现有的群集节点,请打开借助于 clnode export 命令创建的文件。
如果不打算复制现有的群集节点,请创建一个新文件。
请基于 clconfiguration(5CL) 手册页中显示的元素分层结构来编辑该文件。可将该文件存储到任意目录下。
修改 XML 元素的值,以反映要创建的节点配置。
有关群集配置 XML 文件在结构和内容方面的详细信息,请参见 clconfiguration(5CL) 手册页。
phys-schost-new# xmllint --valid --noout clconfigfile
phys-schost-new# clnode add -n sponsor-node -i clconfigfile
指定一个现有群集成员的名称,该成员将作为新节点的发起节点。
指定要用作输入源的群集配置 XML 文件的名称。
如果未向 /etc/hosts.allow 文件执行此添加,TCP 包装将阻止群集管理实用程序通过 RPC 进行节点间通信。
# /usr/sbin/ipadm show-addr ADDROBJ TYPE STATE ADDR clprivnet0/N static ok ip-address/netmask-length …
phys-schost# clnode set -p reboot_on_path_failure=enabled
指定要设置的属性
如果所有监视的共享磁盘路径发生故障,则启用自动节点重新引导。
phys-schost# clnode show === Cluster Nodes === Node Name: node … reboot_on_path_failure: enabled …
故障排除
不成功的配置-如果一个或多个节点无法加入群集,或者指定了错误的配置信息,请首先尝试重新执行此过程。如果不能解决问题,请在每个配置有误的节点上执行如何取消 Oracle Solaris Cluster 软件的配置以更正安装问题过程,以将该节点从群集配置中删除。无需卸载 Oracle Solaris Cluster 软件包。然后再次执行此过程。
接下来的步骤
如果已经向某个使用法定设备的群集中添加了节点,请转至如何在向全局群集中添加节点后更新法定设备。
否则,请转至如何检验法定配置和安装模式。
如果向全局群集中添加了节点,那么,无论您使用的是共享磁盘、NAS 设备、法定服务器还是它们的组合,您都必须更新法定设备的配置信息。为此,您应删除所有的法定设备并更新全局设备名称空间。您可以重新配置仍要使用的任何法定设备(可选操作)。此更新将向每个法定设备注册新节点,从而使法定设备能够根据群集中节点的新数量重新计算其选票计数。
任何新配置的 SCSI 法定设备都会被设置为 SCSI-3 预留空间。
开始之前
确保在添加的节点上已经完成了 Oracle Solaris Cluster 软件的安装。
phys-schost# cluster status -t node
命令输出中将列出每个法定设备和每个节点。以下输出示例中显示出了当前的 SCSI 法定设备 d3。
phys-schost# clquorum list d3 …
对已配置的每个法定设备执行此步骤。
phys-schost# clquorum remove device-name
指定法定设备的名称。
如果法定设备删除成功,将不会列出任何法定设备。
phys-schost# clquorum status
phys-schost# cldevice populate
注 - 必须执行此步骤以防止可能发生的节点紊乱。
即使仅从一个节点中发出 cldevice populate 命令,该命令也会以远程方式在所有节点上执行。要确定 cldevice populate 命令是否已完成处理,请在群集的每个节点上运行以下命令:
phys-schost# ps -ef | grep scgdevs
可以对原来配置为法定设备的同一台设备进行配置,也可以选择新的共享设备进行配置。
phys-schost# cldevice list -v
输出类似于以下内容:
DID Device Full Device Path ---------- ---------------- d1 phys-schost-1:/dev/rdsk/c0t0d0 d2 phys-schost-1:/dev/rdsk/c0t6d0 d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 …
phys-schost# clquorum add -t type device-name
指定法定设备的类型。如果未指定此选项,将使用默认类型 shared_disk。
phys-schost# clquorum list
输出结果中应列出每个法定设备和每个节点。
示例 3-4 向双节点群集中添加节点后更新 SCSI 法定设备
下面的示例依次执行了以下操作:确定原始 SCSI 法定设备 d2;删除该法定设备;列出可用的共享设备;更新全局设备名称空间;将 d3 配置为新的 SCSI 法定设备;检验新设备。
phys-schost# clquorum list d2 phys-schost-1 phys-schost-2 phys-schost# clquorum remove d2 phys-schost# clquorum status … --- Quorum Votes by Device --- Device Name Present Possible Status ----------- ------- -------- ------ phys-schost# cldevice list -v DID Device Full Device Path ---------- ---------------- … d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 … phys-schost# cldevice populate phys-schost# ps -ef - grep scgdevs phys-schost# clquorum add d3 phys-schost# clquorum list d3 phys-schost-1 phys-schost-2
接下来的步骤
请转至如何检验法定配置和安装模式。
注 - 在以下几种情况下不需要配置法定设备:
在配置 Oracle Solaris Cluster 软件的过程中选择了自动法定配置。
安装了单节点全局群集。
向现有全局群集中添加了节点并且已指定足够的法定投票。
如果在建立群集时选择了自动法定配置,则不要执行此步骤。应继续执行如何检验法定配置和安装模式中的过程。
仅在完全形成新群集后执行一次该过程。使用此过程以指定法定选票并使群集脱离安装模式。
开始之前
法定服务器 – 要将法定服务器配置为法定设备,请执行以下操作:
在法定服务器主机上安装Oracle Solaris Cluster 法定服务器软件,然后启动法定服务器。有关安装和启动法定服务器的信息,请参见如何安装和配置Oracle Solaris Cluster 法定服务器软件。
确保与群集节点直接相连的网络交换机满足以下条件之一:
交换机支持快速生成树协议 (Rapid Spanning Tree Protocol, RSTP)。
交换机上已启用快速端口 (fast port) 模式。
必须具有上述某一项特性以确保群集节点与法定服务器之间的即时通信。如果通信因交换机而出现明显延迟,则群集会认为是缺少法定设备导致了通信不畅。
获取以下信息:
要指定给所配置的法定设备的名称
法定服务器主机的 IP 地址
法定服务器的端口号
NAS 设备 – 要将网络连接存储 (Network-Attached Storage, NAS) 设备配置为法定设备,请执行以下操作:
安装 NAS 设备的硬件和软件。有关 NAS 硬件和软件的要求和安装过程,请参见《Oracle Solaris Cluster With Network-Attached Storage Device Manual》以及您的设备文档。
准备使用法定服务器。
公共网络使用长度可变的子网掩码,也称为无类域间路由 (Classless Inter Domain Routing, CIDR)。
# ipadm show-addr ADDROBJ TYPE STATE ADDR lo0/v4 static ok 127.0.0.1/8 ipmp0/v4 static ok 10.134.94.58/24
注 - 如果您使用了法定服务器,但是公共网络使用了有类子网(如 RFC 791 中所定义),则无需执行本步骤。
或者,如果为您的用户帐户指定了系统管理员配置文件,则通过配置文件 shell 作为非超级用户发出命令,或使用 pfexec 命令给该命令加上前缀。
phys-schost# cluster status -t node
运行此命令无需超级用户身份。
phys-schost-1# cldevice list -v
输出类似于以下内容:
DID Device Full Device Path ---------- ---------------- d1 phys-schost-1:/dev/rdsk/c0t0d0 d2 phys-schost-1:/dev/rdsk/c0t6d0 d3 phys-schost-2:/dev/rdsk/c1t1d0 d3 phys-schost-1:/dev/rdsk/c1t1d0 …
使用步骤 a 中的 cldevice 输出信息来识别配置为法定设备的每个共享磁盘的设备 ID。例如,步骤 a 中的输出信息显示全局设备 d3 是由 phys-schost-1 和 phys-schost-2 共享的。
phys-schost# cldevice show device === DID Device Instances === DID Device Name: /dev/did/rdsk/dN … default_fencing: nofencing …
phys-schost# cluster show -t global === Cluster === Cluster name: cluster … global_fencing: nofencing …
注 - 如果单个磁盘的 default_fencing 属性设置为 global,则仅在群集范围的 global_fencing 属性设置为 nofencing 或 nofencing-noscrub 时对该单个磁盘禁用隔离功能。如果将 global_fencing 属性更改为可启用隔离功能的值,则其 default_fencing 属性设置为 global 的所有磁盘的隔离功能会变为启用状态。
phys-schost# cldevice set \ -p default_fencing=nofencing-noscrub device
phys-schost# cldevice show device
phys-schost# clsetup
将显示“初始群集设置”屏幕。
|
对于法定服务器,还需指定以下信息:
法定服务器主机的 IP 地址
法定服务器用来与群集节点进行通信的端口号
clsetup 实用程序在为群集设置了法定配置和投票计数后,将显示消息 "Cluster initialization is complete"。该实用程序将于此时返回到主菜单。
接下来的步骤
检验是否已禁用法定配置及安装模式。请转至如何检验法定配置和安装模式。
故障排除
中断的 clsetup 处理-如果法定设备设置过程被中断或无法成功完成,请重新运行 clsetup。
对法定选票计数的更改-如果以后增加或减少了连接到法定设备的节点数,法定选票计数不会自动重新计算。通过删除各个法定设备,然后将其添加回配置中(一次对一个法定设备进行操作),可以重新建立正确的法定选票。对于双节点群集,请临时添加一个新的法定设备,然后删除原法定设备并将其添加回配置。然后,删除临时法定设备。请参见《Oracle Solaris Cluster 系统管理指南》中的第 6 章 "管理法定"中的“如何修改法定设备节点列表”过程。
无法访问的法定设备-如果在群集节点上看到无法访问法定设备的消息,或者如果群集节点出现故障并显示消息 CMM: Unable to acquire the quorum device,则法定设备或其路径可能存在问题。检查法定设备及其路径是否正常。
如果该问题仍然存在,请使用其他法定设备。或者,如果仍要使用该法定设备,请将法定超时增大为较高的值,如下所述:
注 - 对于 Oracle Real Application Clusters (Oracle RAC),请勿更改默认的 25 秒法定超时时间。在某些记忆分裂方案中,较长的超时周期可能会导致 Oracle RAC VIP 故障转移因 VIP 资源超时而失败。如果所用法定设备不适合使用默认的 25 秒超时,请使用其他法定设备。
1. 成为超级用户。
2. 在每个群集节点上,以超级用户身份编辑 /etc/system 文件,将超时时间设置为较高的值。
以下示例将超时时间设置为 700 秒。
phys-schost# vi /etc/system … set cl_haci:qd_acquisition_timer=700
3. 从一个节点,关闭群集。
phys-schost-1# cluster shutdown -g0 -y
4. 将各节点引导回群集模式。
重新引导后会初始化对 /etc/system 文件的更改。
执行该过程以验证法定配置是否已成功完成,并验证群集安装模式是否已被禁用。
您不必成为超级用户就可以运行这些命令。
phys-schost$ clquorum list
输出结果中将列出每个法定设备和每个节点。
phys-schost$ cluster show -t global | grep installmode installmode: disabled
群集安装和创建已完成。
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果要更改任何专用主机名,请转至如何更改专用主机名。
如果要安装或修改 NTP 配置文件,请转至配置网络时间协议 (Network Time Protocol, NTP)。
如果要安装卷管理器,请转至第 4 章以安装卷管理软件。
如果要创建群集文件系统,请转至如何创建群集文件系统。
要了解如何安装第三方应用程序,注册资源类型,设置资源组以及配置数据服务,请参见应用程序软件附带的相关文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
在完整配置群集后,对配置进行验证。转至如何验证群集。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
另请参见
创建群集配置的备份。
对群集配置的归档备份有助于您更方便地恢复群集配置。有关更多信息,请参见《Oracle Solaris Cluster 系统管理指南》中的"如何备份群集配置"。
如果不希望使用默认的专用主机名 clusternodenodeID-priv(该主机名是在安装 Oracle Solaris Cluster 软件的过程中指定的),请执行此任务。
注 - 在配置并启动应用程序和数据服务后,请不要执行此过程。否则,在重命名旧的专用主机名后,应用程序或数据服务可能仍使用旧的专用主机名,从而造成主机名冲突。如果有一些应用程序或数据服务正在运行,则停止它们,然后再执行该过程。
请在一个活动的群集节点上执行此过程。
phys-schost# clsetup
屏幕上将显示 clsetup 主菜单。
将显示“专用主机名”菜单。
对于每个要更改的专用主机名,请重复该过程。
phys-schost# clnode show -t node | grep privatehostname privatehostname: clusternode1-priv privatehostname: clusternode2-priv privatehostname: clusternode3-priv
接下来的步骤
使用已更改的专用主机名更新 NTP 配置。转至如何在更改专用主机名后更新 NTP。
本节包含以下过程:
phys-schost# svcs svc:/network/ntp:default
phys-schost# svcadm enable svc:/network/ntp:default
phys-schost# svcadm restart svc:/network/ntp:default
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果要安装卷管理器,请转至第 4 章。
如果要创建群集文件系统,请转至如何创建群集文件系统。
要了解如何安装第三方应用程序,注册资源类型,设置资源组以及配置数据服务,请参见应用程序软件附带的相关文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
在完整配置群集后,对配置进行验证。转至如何验证群集。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
将节点添加到单节点群集中时,必须确保将所使用的 NTP 配置文件复制到原始群集节点以及新节点中。
这些文件是在群集中配置已添加节点时在该节点上创建的。
phys-schost# ln -s /etc/inet/ntp.conf.sc /etc/inet/ntp.conf.include
phys-schost# svcs svc:/network/ntp:default
phys-schost# svcadm enable svc:/network/ntp:default
phys-schost# svcadm restart svc:/network/ntp:default
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果要安装卷管理器,请转至第 4 章。
如果要创建群集文件系统,请转至如何创建群集文件系统。
要了解如何安装第三方应用程序,注册资源类型,设置资源组以及配置数据服务,请参见应用程序软件附带的相关文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
在完整配置群集后,对配置进行验证。转至如何验证群集。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
phys-schost# svcs svc:/network/ntp:default
phys-schost# svcadm enable svc:/network/ntp:default
phys-schost# svcadm restart svc:/network/ntp:default
接下来的步骤
查看以下列表以确定下一项要执行的任务(该任务应适用于您的群集配置)。如果需要执行此列表中的多项任务,请转至其中在列表中排在最前面的那项任务。
如果要安装卷管理器,请转至第 4 章。
如果要创建群集文件系统,请转至如何创建群集文件系统。
要了解如何安装第三方应用程序,注册资源类型,设置资源组以及配置数据服务,请参见应用程序软件附带的相关文档以及《Oracle Solaris Cluster Data Services Planning and Administration Guide》。
在完整配置群集后,对配置进行验证。转至如何验证群集。
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
完成所有群集配置之后,使用 cluster check 命令验证群集配置和功能。有关更多信息,请参见 cluster(1CL) 手册页。
提示 - 为了便于将来参考或故障排除,对于运行的每个验证,请使用 -o outputdir 选项为日志文件指定子目录。重用现有的子目录名称将删除子目录中的所有现有文件。因此,为确保日志文件可供将来参考之用,请为运行的每个群集检查指定唯一的子目录名称。
开始之前
确保已在群集中完成所有硬件和软件组件(包括固件和软件更新)的安装和配置。
该搜索将找到包含 check 的 Oracle Solaris Cluster 软件更新。
# cluster check -v -o outputdir
详细模式。
将输出重定向到 outputdir 子目录。
该命令会运行所有可用的基本检查。不会影响任何群集功能。
# cluster check -v -k interactive -o outputdir
指定运行交互式验证检查
该命令会运行所有可用的交互式检查并提示您提供所需的群集相关信息。不会影响任何群集功能。
# cluster list-checks -k functional
例如,功能检查可能会引起节点出现紧急情况或故障转移到其他节点。
# cluster list-checks -v -C check-ID
指定特定检查。
# cluster check -v -k functional -C check-ID -o outputdir
指定运行功能验证检查
响应来自检查的提示,确认应运行该检查以及必须执行的任何信息或操作。
注 - 为了进行记录,请为所运行的每个检查指定唯一 outputdir 子目录名称。如果重用 outputdir 名称,则新检查的输出将覆写重用的 outputdir 子目录的现有内容。
示例 3-5 列出交互式验证检查
以下示例列出了可用于在群集上运行的所有交互式检查。示例输出显示了可能的检查样例;实际的可用检查因各配置而异
# cluster list-checks -k interactive Some checks might take a few moments to run (use -v to see progress)... I6994574 : (Moderate) Fix for GLDv3 interfaces on cluster transport vulnerability applied?
示例 3-6 运行功能验证检查
以下示例首先显示了功能检查的详细列表。随后列出了检查 F6968101 的详细描述,指出该检查会中断群集服务。群集将脱离生产环境。然后将运行功能检查,且详细输出会记录到 funct.test.F6968101.12Jan2011 子目录中。示例输出显示了可能的检查样例;实际的可用检查因各配置而异。
# cluster list-checks -k functional F6968101 : (Critical) Perform resource group switchover F6984120 : (Critical) Induce cluster transport network failure - single adapter. F6984121 : (Critical) Perform cluster shutdown F6984140 : (Critical) Induce node panic … # cluster list-checks -v -C F6968101 F6968101: (Critical) Perform resource group switchover Keywords: SolarisCluster3.x, functional Applicability: Applicable if multi-node cluster running live. Check Logic: Select a resource group and destination node. Perform '/usr/cluster/bin/clresourcegroup switch' on specified resource group either to specified node or to all nodes in succession. Version: 1.2 Revision Date: 12/10/10 Take the cluster out of production # cluster check -k functional -C F6968101 -o funct.test.F6968101.12Jan2011 F6968101 initializing... initializing xml output... loading auxiliary data... starting check run... pschost1, pschost2, pschost3, pschost4: F6968101.... starting: Perform resource group switchover ============================================================ >>> Functional Check <<< 'Functional' checks exercise cluster behavior. It is recommended that you do not run this check on a cluster in production mode.' It is recommended that you have access to the system console for each cluster node and observe any output on the consoles while the check is executed. If the node running this check is brought down during execution the check must be rerun from this same node after it is rebooted into the cluster in order for the check to be completed. Select 'continue' for more details on this check. 1) continue 2) exit choice: 1 ============================================================ >>> Check Description <<< … Follow onscreen directions
接下来的步骤
将群集投入生产之前,请记录群集配置的基本信息以供将来进行诊断时使用。请转至如何记录群集配置的诊断数据。
在完成全局群集配置之后且将其投入生产之前,请使用 Oracle Explorer 实用程序记录有关该群集的基本信息。如果将来需要排除群集故障,可以使用该数据。
服务工具包 (Services Tools Bundle) 中包含 Oracle Explorer 软件包 SUNWexplo 和 SUNWexplu。有关软件下载和安装的信息,请参见 http://www.oracle.com/us/support/systems/premier/services-tools-bundle-sun-systems-163717.html。
针对您的平台使用相应的命令。例如,要收集关于 Oracle 的 Sun Fire T1000 服务器的信息,请运行以下命令:
# explorer -i -w default,Tx000
有关更多信息,请参见 /opt/SUNWexplo/man/man1m/ 目录下的 explorer(1M) 手册页以及《Oracle Explorer Data Collector User Guide》(本指南可通过 My Oracle Support 上的“说明 1153444.1”获取):
explorer 输出文件以 explorer.hostid.hostname-date.tar.gz 形式保存到 /opt/SUNWexplo/output/ 目录下。
按《Oracle Explorer Data Collector User's Guide》中介绍的过程使用 FTP 或 HTTPS 来提交 Oracle Explorer 文件。
如果在对群集的技术问题进行诊断时需要 explorer 输出数据,Oracle Explorer 数据库可使 Oracle 技术支持人员获取这些数据。