已知问题和错误

在产品发行时，存在影响 Oracle Solaris Cluster 和 Oracle Solaris Cluster Geographic Edition 4.0 软件运行的下列已知问题和错误。这些错误和问题分为以下几个类别：

管理
数据服务
安装
运行时

请与 Oracle 支持服务联系以确定是否已有代码修复可用。

管理

x86： `clzonecluster export` 命令失败 (7066586)

问题摘要：以下命令在 x86 计算机上可能会失败。

# clzonecluster export zonename
usage:
export [-f output-file]

解决方法：请改用以下命令：

# zonecfg -z zone-cluster-name export

在 PxFS 辅助服务器上的非全局区域中对 `setuid` 使用 `chmod` 会返回错误 (7020380)

问题摘要：在群集文件系统上，从非全局区域运行的 chmod 命令可能会失败。chmod 操作在 PxFS 主服务器所在的节点上的非全局区域中会成功，但在 PxFS 辅助服务器所在的节点上的非全局区域中会失败。例如：

# chmod 4755 /global/oracle/test-file

解决方法：执行下列操作之一：

在访问群集文件系统的任何全局群集节点上执行操作。
从具有群集文件系统的回送挂载的 PxFS 主节点上运行的任何非全局区域执行操作。
将 PxFS 主服务器切换到遇到错误的非全局区域正在其上运行的全局群集节点。

无法基于配置文件创建具有不可调整扩展属性的资源 (6971632)

问题摘要：使用 XML 配置文件创建资源时，如果任何资源具有不可调整的扩展属性（即，Tunable 资源属性特性设置为 None），则命令无法创建该资源。

解决方法：编辑 XML 配置文件以从资源中删除不可调整的扩展属性。

`Cluster.CCR：libpnm 系统错误: 无法解析 pnm proxy pnm_server.2.zonename` (6942090)

问题摘要：如果在 Oracle Solaris Cluster 主机上使用具有独占 IP 的 solaris10 标记非全局区域，则带有 -m 或 -v 选项的 clnode status 命令将在 /var/adm/messages 文件中报告一个错误，类似于以下内容：

Cluster.CCR: [ID 544775 daemon.error] libpnm system error: Failed to resolve pnm proxy zonename

此错误不会影响非全局区域或群集的运行。不必因为会看到这些错误而将 solaris10 标记区域置于群集的控制之下。

只有在具有独占 IP 的 solaris10 标记区域上，才会出现此问题。当存在以下情况时，不会出现此问题：

区域为 solaris 标记区域并使用独占 IP。
区域为 solaris10 标记区域并使用共享 IP。
区域为 solaris 标记区域并使用共享 IP。

解决方法：没有解决方法。此错误消息不会影响非全局区域或全局群集的运行。

当策略为 `pathcount` 时，缺少 `/dev/rmt` 会导致预留空间的使用不正确 (6920996)

问题摘要：将新的存储设备添加到群集并为其配置三个或更多 DID 路径时，运行 cldevice populate 命令的节点可能无法在设备上注册它的 PGR 密钥。

解决方法：在所有群集节点上运行 cldevice populate 命令，或者从同一节点运行两次 cldevice populate 命令。

当群集中存在负载时禁用设备隔离会导致预留空间冲突 (6908466)

问题摘要：为具有活动 I/O 负载的共享设备关闭隔离可能会导致连接到该设备的节点之一的预留空间发生冲突。

解决方法：在为设备关闭隔离之前，停止该设备的 I/O。

从群集配置中删除节点可能会导致节点出现紧急情况 (6735924)

问题摘要：将群集配置从三节点群集更改为两节点群集时，如果剩余节点之一离开群集或从群集配置中删除，则可能会导致群集完全丢失。

解决方法：从三节点群集配置中删除节点后，立即在剩余群集节点之一上运行 cldevice clear 命令。

数据服务

对于以某个常见模式开头的 UFS 和 ZFS 组合，共享挂载点匹配不正确 (7093237)

问题摘要：如果为 ZFS 挂载点创建了一个 NFS 资源并且该挂载点的前缀与 vfstab 文件中的某个 UFS 文件系统条目匹配，倘若该 UFS 文件系统未挂载到该节点上，则 HA for NFS 数据服务的验证将失败。

解决方法：将 UFS 文件系统挂载到与 ZFS 文件系统相关的 HAStoragePlus 资源在其上联机的节点。仅当创建或更新资源时，才需要执行此操作。在任何其他情况下，不存在该约束：要使资源组可以脱机或联机以及随意切换到任何节点，必须先挂载 UFS 文件系统。

在应用修补程序 145333-09 之后出现“无法确定 Oracle CRS 版本”错误 (7090390)

问题摘要：当 su 用户使用 csh shell 时，Oracle Solaris Cluster 代码无法确定 Oracle CRS 版本。

解决方法：拥有 ${CRS_HOME}/bin/srvctl 的用户不得使用 csh shell。

SPARC： HA for Oracle VM Server for SPARC 默认 `STOP_TIMEOUT` 过低－需要更好地监视域迁移进度 (7069269)

问题摘要：HA for Oracle VM Server for SPARC 数据服务中的 STOP_TIMEOUT 值过低，无法完成来宾域的迁移。

解决方法：将 STOP_TIMEOUT 的默认值至少增大到 900 或预期迁移时间间隔的 4 倍。

可伸缩应用程序在区域群集间未被隔离 (6911363)

问题摘要：如果配置为在不同区域群集中运行的可伸缩应用程序绑定到 INADDR_ANY 并使用同一端口，则可伸缩服务将无法对不同区域群集中运行的这些应用程序的实例进行区分。

解决方法：不要将要绑定到 INADDR_ANY 的可伸缩应用程序配置为本地 IP 地址，或者将它们绑定到不会与其他可伸缩应用程序相冲突的端口。

同时在多个节点上运行 `clnas add` 或 `clnas remove` 命令会出现问题 (6791618)

问题摘要：添加或删除 NAS 设备时，同时在多个节点上运行 clnas add 或 clnas remove 命令可能会损坏 NAS 配置文件。

解决方法：一次只在一个节点上运行 clnas add 或 clnas remove 命令。

安装

在群集中配置节点之前，`cluster check` 会因为 `cacaoadm` 所需的`数据不足`而失败 (7104375)

问题摘要：cluster check 命令使用 Common Agent Container (CAC) 服务在节点之间进行通信并要求 CAC 正在运行。如果管理员在节点不是群集成员且 CAC 服务未运行时运行 check S6979686，则会显示以下消息：

Insufficient Data: 1; /usr/sbin/cacaoadm status: Unable to check
SMF status

解决方法：可以放心地忽略此错误。在安装 Oracle Solaris Cluster 软件时，请选择 ignore the error and continue（忽略该错误并继续执行）选项以继续操作。

在以前安装过群集软件的引导环境中配置群集之后，某些群集服务可能会丢失 (7103721)

问题摘要：如果您卸载了 Oracle Solaris Cluster，然后又将其安装并配置到同一引导环境中，则该群集会成功引导，但可能会丢失某些群集服务。运行 svcs -x 命令并检查任何以 svc:/system/cluster 开头的服务。

# svcs -x
svc:/system/cluster/rgm-starter:default (Resource Group Manager Daemon)
 State: offline since Fri Oct 28 18:30:36 2011
Reason: Dependency svc:/system/cluster/rpc-fed:default is absent.
   See: http://sun.com/msg/SMF-8000-E2
Impact: 5 dependent services are not running.  (Use -v for list.)

解决方法：使用以下命令来添加丢失的服务。以下示例显示了如何添加 svc:/system/cluster/rpc-fed:default 服务：

# service=svc:/system/cluster/rpc-fed:default 
# svccfg -s ${service%:*} add ${service##*:} 
# svccfg -s ${service} addpg general framework 
# svccfg -s ${service} delcust -M  
# svcadm enable ${service}

然后，重新运行 svcs -x 命令来检查丢失的任何其他群集服务。

`scinstall` 试图在备用接口上创建 IPMP 组 (7095759)

问题摘要：如果在执行 Oracle Solaris Cluster 配置之前，群集节点已创建了具有“主动-备用”配置的 IPMP 组，则在配置 Oracle Solaris Cluster 期间，scinstall 命令将失败并显示以下错误消息：

Configuring IP multipathing groups ...failed 
scinstall: Failed to retrieve the broadcast value for this adapter

如果备用适配器没有任何广播值，则 scinstall 命令将输出以上错误消息，并且不会继续执行组创建。不过，scinstall 命令将继续执行，且不会出现任何问题。

解决方法：不需要任何解决方法，可以放心地忽略此消息。

`clnode remove -F nodename` 命令无法从 Solaris Volume Manager 设备组删除节点 `nodename` (6471834)

问题摘要：使用 clnode remove -F nodename 命令从群集中删除节点时，已删除节点的过时条目可能会保留在 Solaris Volume Manager 设备组中。

解决方法：在运行 clnode remove -F nodename 命令之前使用 metaset 命令从 Solaris Volume Manager 设备组删除节点。

如果您在从 Solaris Volume Manager 设备组删除节点之前运行了 clnode remove -F nodename 命令，请从活动群集节点运行 metaset 命令来删除 Solaris Volume Manager 设备组中的过时节点条目。然后，运行 clnode clear -F nodename 命令，以便从群集中完全删除该节点的所有痕迹。

自动发现应当只为每个适配器找到一个互连路径 (6299097)

问题摘要：如果互连适配器之间的网络硬件中存在冗余路径，则 scinstall 实用程序可能无法配置它们之间的互连路径。

解决方法：如果自动发现找到了多个互连路径，请手动为每个路径指定适配器对。

运行时

`getnetmaskbyaddr()` 导致逻辑主机名的故障转移失败 (7075347)

问题摘要：如果为 netmasks 名称服务启用了 nis，则逻辑主机名故障转移要求从网络中获取网络掩码。对 getnetmaskbyaddr() 的此调用会因 CR 7051511 挂起一段时间，这段时间可能足够长，以便资源组管理器 (Resource Group Manager, RGM) 将资源置于 FAILED 状态。即使 /etc/netmasks 本地文件中有正确的网络掩码条目，也会出现此问题。该问题只会影响多宿主群集，例如位于多个子网上的群集节点。

解决方法：将 /etc/nsswitch.conf 文件（由 SMF 服务进行处理）配置为仅使用 files 进行 netmasks 查找。

# /usr/sbin/svccfg -s svc:/system/name-service/switch setprop config/netmask = astring:\"files\"
# /usr/sbin/svcadm refresh svc:/system/name-service/switch

`ssm_start` 由于无关的 IPMP 关闭而失败 (6938555)

问题摘要：依赖于 SUNW.SharedAddress 资源的可伸缩资源因子集上共享地址资源不使用的 IPMP 组出现故障而无法联机。群集节点的系统日志中会显示类似下面的消息：

Mar 22 12:37:51 schost1 SC SUNW.gds:5,Traffic_voip373,Scal_service_voip373,SSM_START: 
ID 639855 daemon.error IPMP group sc_ipmp1 has status DOWN. Assuming this
node cannot respond to client requests.

解决方法：修复失败的 IPMP 组，并重新启动失败的可伸缩资源。

跳过导航链接
退出打印视图
	Oracle Solaris Cluster 4.0 发行说明 Oracle Solaris Cluster 4.0 (简体中文)