JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle Solaris Cluster 4.1 发行说明     Oracle Solaris Cluster 4.1 (简体中文)
search filter icon
search icon

文档信息

前言

1.  Oracle Solaris Cluster 4.1 发行说明

软件的新增功能

对 Oracle Solaris 11.2 OS 的支持

用于创建区域群集的新的 clsetup 向导

支持 solaris10 标记区域群集

支持独占 IP 区域群集

支持将 Trusted Extensions 与区域群集结合使用

可基于每个节点定义资源依赖性

支持内核区域 (kernel cage) 动态重新配置 (Dynamic Reconfiguration, DR)

增强了群集安全框架

通过群集互连支持套接字直接协议

通过存储监视器更快地检测和响应故障

ZFS 存储池

用于配置 Oracle PeopleSoft Application Server 数据服务的新的 clsetup 向导

用于配置 Oracle WebLogic Server 数据服务的新的 clsetup 向导

支持 MySQL 和 MySQL Cluster 数据服务

针对 PostgreSQL 的新数据服务

针对 Samba 的新数据服务

针对 SAP liveCache 的新数据服务

针对 SAP MaxDB 的新数据服务

针对 Siebel 8.2.2 的新数据服务

针对 Sybase ASE 的新数据服务

针对 Oracle Traffic Director 的新数据服务

针对 Oracle TimesTen 的新数据服务

针对 SAP NetWeaver 数据服务的新手册

新的 Oracle External Proxy 数据服务

新的 Oracle PeopleSoft Enterprise Process Scheduler 数据服务

新的 Oracle Web Tier 数据服务

支持 Oracle E-Business 12.1.1 数据服务

在 Geographic Edition 中支持 Sun ZFS Storage Appliance 数据复制

在 Geographic Edition 中支持 EMC Symmetrix Remote Data Facility

在 Geographic Edition 中支持 MySQL 复制

针对 ccradmdcs_config 高级维护命令的新手册页

对非全局区域的有选择的支持

Oracle Solaris Cluster 4.1 软件未包括的功能

限制

区域群集中的 Solaris Volume Manager 磁盘集

本发行版中已修改的命令

兼容性问题

逻辑主机在发生公共网络故障时不进行故障转移 (16979921)

Oracle ASM 与 Solaris Volume Manager 镜像逻辑卷

在执行 GI root.sh 和启动 CRS 期间,S10 标记区域中的 osysmond 进行核心转储 (14456069)

Oracle Clusterware 无法为 ora.asm 资源创建所有 SID (12680224)

由于 pkg 命令过时,导致 Oracle Solaris 11 SRU 安装可能失败

无法使用 clzonecluster install-cluster 仅将修补程序安装到 solaris10 标记区域群集 (7200532)

向 IPMP 组添加主适配器将删除 DNS 配置 (7198718)

SAP JAVA 问题影响 HA for SAP NetWeaver 在意外中断时进行故障转移的能力 (7191360)

如果未安装 pkg:/system/resource-mgmt/resource-cap,但配置了 capped-memory,则区域不会引导 (7087700)

Geographic Edition 不支持主动-主动 ZFS Storage Appliance 群集配置 (6770212)

辅助功能信息

支持的产品

数据复制

数据服务

文件系统

Geographic Edition 软件要求

内存要求

Oracle Solaris 操作系统

Oracle VM Server for SPARC

卷管理软件

产品本地化

已知问题和错误

管理

clzc reboot 命令导致 solaris10 标记专用 IP 区域群集以使全局区域节点发生紧急情况 (16941521)

在专用 IP 区域群集的区域中执行 /usr/sbin/shutdown 命令可能会导致该区域群集的其他正在运行的区域停止 (16963753)

svc_private_network:default SMF 服务在 solaris10 标记专用 IP 区域群集中进入维护状态 (16716992)

无法为 clprivnet 接口设置巨型帧 (Jumbo Frame) MTU 大小 (16618736)

公网故障不会使对具有 SCAN 侦听器的 DB 服务器资源进行故障转移 (16231523)

数据服务配置向导不支持可伸缩 HAStoragePlus 的存储资源和资源组 (7202824)

从独占 IP 区域群集中删除节点将使群集节点出现紊乱 (7199744)

privnet 不存在将使区域群集停止引导,即使有良好的 privnet (7199431)

clzonecluster 命令无法检验在未指定 allowed-addr 时是否无法指定 defrouter,CCR 配置失败 (7199135)

如果任意一个群集节点不在群集中,clzonecluster bootreboothalt 子命令将失败 (7193998)

群集文件系统不支持扩展属性 (7167470)

在 PxFS 辅助服务器上的非全局区域中使用 chmod 设置 setuid 权限会返回错误 (7020380)

无法基于配置文件创建具有不可调整扩展属性的资源 (6971632)

当群集中存在负载时禁用设备隔离会导致预留空间冲突 (6908466)

如果复制的设备组状态会导致状态间切换和切换回原状态失败,EMC SRDF 将拒绝在状态间切换 (6798901)

从群集配置中删除节点可能会导致节点出现紊乱 (6735924)

组合 DID 时,需要进行更多的验证检查 (6605101)

数据服务

HA for TimesTen 不支持“活动-备用”配置 (16861602)

无法更新区域群集中使用 NAS 配置的 SUNW.ScalMountPoint 资源的属性 (7203506)

无法访问在区域群集的可伸缩 HAStoragePlus 资源中配置的全局文件系统 (7197623)

RAC 向导失败,显示 "ERROR: Oracle ASM is either not installed or the installation is invalid!" (7196184)

如果将 WebLogic Server 安装在 NFS 中,在区域/区域群集中配置 WebLogic Server 域时,clsetup 向导将失败 (7196102)

大量 GDS 资源不识别网络,一些资源无法重新启动并保持脱机状态 (7189659)

SUNW.Proxy_SMF_failover sc_delegated_restarter 文件描述符泄漏 (7189211)

如果设置 Debug_level=1pas-rg 将故障转移到节点 2,并且再也无法在节点 1 上启动 (7184102)

可伸缩应用程序在区域群集间未被隔离 (6911363)

同时在多个节点上运行 clnas addclnas remove 命令会出现问题 (6791618)

开发者环境

clresource show -p 命令返回错误信息 (7200960)

Geographic Edition

群集节点对 Sun ZFS Storage Appliance 项目或 iSCSI LUN 没有访问权限 (15924240)

某个伙伴上持续报告 DR 状态为 unknown (7189050)

接管到辅助站点失败,因为 fs umount 在主站点上失败 (7182720)

如果使用 BUI 停止项目复制,则创建和验证 ZFS Storage Appliance 保护组将失败 (7176292)

使用区域群集时从全局群集发送多个通知电子邮件 (7098290)

安装

不指定修补程序选项则无法在现有的 3.3 5/11 solaris10 标记区域上安装数据服务代理 (7197399)

install 而非 install-cluster 用于 solaris10 标记区域时,clzonecluster 不报告错误 (7190439)

当主机名中包含大写字母时,创建 ASM 实例代理资源将出错 (7190067)

向导找不到 ASM SID (7190064)

当群集节点的主机名中包含大写字母时,创建 RAC 代理资源将失败 (7189565)

进行 solaris10 标记区域的非交互式数据服务安装时很难获取数据服务名称 (7184714)

Cacao 在运行 Trusted Extensions 的计算机上无法进行通信 (7183625)

clnode remove -F nodename 命令无法从 Solaris Volume Manager 设备组中删除节点 nodename (6471834)

自动搜索应当只为每个适配器找到一个互连路径 (6299097)

运行时

逻辑主机名故障转移会产生重复地址而导致中断 (7201091)

sc_delegated_restarter 未将清单中设置的环境变量考虑在内 (7173159)

使用 ipadm disable-if -t interface 禁用传输接口后无法重新启用 (7141828)

getnetmaskbyaddr() 导致逻辑主机名的故障转移失败 (7075347)

升级

x86: scinstall -u update 有时无法升级 x86 节点上的群集软件包 (7201491)

软件更新

修补程序管理工具

My Oracle Support

Oracle Solaris Cluster 4.1 文档集

文档问题

升级指南

HA for Oracle Guide

HA for Oracle RAC 指南

HA for Oracle Solaris Zones Guide

Solaris Volume Manager

Geographic Edition Data Replication Guide for Oracle Solaris Availability Suite

手册页

clzonecluster(1CL)

ORCL.sapcenter(5)

ORCL.saprepenq(5)

ORCL.saprepenq_preempt(5)

ORCL.sapstartsrv(5)

scdpmd.conf(4)

scha_check_app_user(1HA)

SUNW.HAStoragePlus(5)

SUNW.ScalDeviceGroup(5)

SUNW.ScalMountPoint(5)

A.  ORCL.otd(5) 手册页

已知问题和错误

截止产品发行时,存在影响 Oracle Solaris Cluster 和 Oracle Solaris Cluster Geographic Edition 4.1 软件运行的下列已知问题和错误。这些错误和问题分为以下几个类别:

请联系 Oracle 技术支持代表,以了解是否已有修复程序可用。

管理

clzc reboot 命令导致 solaris10 标记专用 IP 区域群集以使全局区域节点发生紧急情况 (16941521)

问题摘要:重新引导或停止 solaris10 标记的专用 IP 区域群集节点可能会导致全局区域节点发生紧急情况。当区域群集节点使用基网络作为主(公共)网络接口并且在为该群集中的其他区域群集节点配置的基网络接口上有 VNIC 时,会发生此情况。

解决方法: 创建并使用 VNIC 作为专用 IP 区域群集的主网络接口。

在专用 IP 区域群集的区域中执行 /usr/sbin/shutdown 命令可能会导致该区域群集的其他正在运行的区域停止 (16963753)

问题摘要: 如果您在专用 IP 区域群集的区域中使用 /usr/sbin/shutdown 命令来停止或重新引导区域,则该区域群集的其他任何活动且正在运行的区域可能会被群集软件停止。

解决方法: 不要在专用 IP 区域群集的区域内使用 /usr/sbin/shutdown 命令来停止或重新引导区域。请改用 /usr/cluster/bin/clzonecluster 命令在全局区域中停止或重新引导专用 IP 区域群集的区域。/usr/cluster/bin/clzonecluster 命令是用来停止或重新引导任何类型区域群集的区域的正确方法。如果看到此问题,请使用 /usr/cluster/bin/clzonecluster 命令引导已由群集软件停止的任何此类区域。

svc_private_network:default SMF 服务在 solaris10 标记专用 IP 区域群集中进入维护状态 (16716992)

问题摘要: 当您在 solaris10 标记专用 IP 区域群集的区域中执行系统标识时,svc_private_network:default SMF 服务在该区域中会进入维护模式。在之后重新引导区域时,该问题不会出现。

解决方法: 在 solaris10 标记专用 IP 区域群集的区域中执行系统标识配置后,重新引导该区域。

无法为 clprivnet 接口设置巨型帧 (Jumbo Frame) MTU 大小 (16618736)

问题摘要: 群集 clprivnet 接口的 MTU 始终设置为默认值 1500,与底层专用互连的 MTU 不匹配。因此,不能为 clprivnet 接口设置巨型帧 MTU 大小。

解决方法: 没有已知解决方法。

公网故障不会使对具有 SCAN 侦听器的 DB 服务器资源进行故障转移 (16231523)

问题摘要: 如果 HA-Oracle 数据库配置为使用 Grid Infrastructure SCAN 侦听器,则公网出现故障时 HA-Oracle 数据库资源不会进行故障转移。

解决方法: 将 Oracle Grid Infrastructure SCAN 侦听器与 HA-Oracle 数据库配合使用时,向 HA-Oracle 数据库资源组添加一个逻辑主机,该主机的 IP 地址位于与 SCAN 侦听器相同的子网中。

数据服务配置向导不支持可伸缩 HAStoragePlus 的存储资源和资源组 (7202824)

问题摘要: 现有数据服务配置向导不支持配置可伸缩 HAStoragePlus 资源和资源组。此外,向导也检测不到可伸缩 HAStoragePlus 的现有资源和资源组。

例如,以多实例模式配置 HA for WebLogic Server 时,即使群集上已有现有的可伸缩 HAStoragePlus 资源和资源组,向导也会显示 No highly available storage resources are available for selection

解决方法: 以下列方式配置使用可伸缩 HAStoragePlus 资源和资源组的数据服务:

  1. 使用 clresourcegroupclresource 命令以可伸缩模式配置 HAStoragePlus 资源组和资源。

  2. 使用 clsetup 向导配置数据服务,就如它们在本地文件系统上(即不涉及存储资源)一样。

  3. 使用 CLI 创建对步骤 1 中所配置的可伸缩 HAStoragePlus 资源的脱机重新启动依赖性,以及与可伸缩 HAStoragePlus 资源组的正向强关联。

从独占 IP 区域群集中删除节点将使群集节点出现紊乱 (7199744)

问题摘要: 从独占 IP 区域群集中删除区域群集节点时,独占 IP 区域群集所在的全局群集节点将出现紊乱。此问题只在具有 InfiniBand 互连的全局群集上出现。

解决方法: 在删除区域群集节点之前,停止独占 IP 区域群集。

privnet 不存在将使区域群集停止引导,即使有良好的 privnet (7199431)

问题摘要: 如果在独占 IP 区域群集配置 (ip-type=exclusive) 中将无效或不存在的网络链路指定为 privnet 资源,那么即使有有效的 privnet 资源,区域群集节点也无法加入区域群集。

解决方法: 从区域群集配置中删除无效的 privnet 资源,然后重新引导区域群集节点。

# clzonecluster reboot -n nodename zone-cluster

或者,对应无效的 privnet 资源创建缺少的网络链路,然后重新引导区域。有关更多信息,请参见 dladm(1M) 手册页。

clzonecluster 命令无法检验在未指定 allowed-addr 时是否无法指定 defrouter,CCR 配置失败 (7199135)

问题摘要: 在独占 IP 区域群集中,如果在节点范围内配置 net 资源时指定了 defrouter 属性而未指定 allowed-address 属性,则 Oracle Solaris 软件将出错。对于独占 IP 区域群集,Oracle Solaris 软件要求,如果您指定了 defrouter 属性,则必须始终指定 allowed-address 属性。如果未这样做,Oracle Solaris 软件将报告相应的错误消息,但是群集可能已使用区域群集信息填充 CCR。此操作将区域群集保留为 Unknown 状态。

解决方法: 指定区域群集的 allowed-address 属性。

如果任意一个群集节点不在群集中,clzonecluster bootreboothalt 子命令将失败 (7193998)

问题摘要: 即使只有一个群集节点不在群集中,clzonecluster bootreboothalt 子命令也会失败。将显示类似如下的错误:

root@pnode1:~# clzc reboot zoneclustername 
clzc:  (C827595) "pnode2" is not in cluster mode.
clzc:  (C493113) No such object.

root@pnode1:~# clzc halt zoneclustername
clzc:  (C827595) "pnode2" is not in cluster mode.
clzc:  (C493113) No such object.

clzonecluster bootreboothalt 子命令应该可以跳过处于非群集模式下的节点,而非失败。

解决方法: 对 clzonecluster bootclzonecluster halt 命令使用以下选项以指定子命令的节点列表:

-n nodename[,…]

-n 选项允许对指定的节点子集运行子命令。例如,如果在包含节点 pnode1pnode2pnode3 的三节点群集中,节点 pnode2 已关闭,可以运行以下 clzonecluster 子命令以排除关闭的节点:

clzonecluster halt -n pnode1,pnode3 zoneclustername
clzonecluster boot -n pnode1,pnode3 zoneclustername
clzonecluster reboot -n pnode1,pnode3 zoneclustername

群集文件系统不支持扩展属性 (7167470)

问题摘要: 群集文件系统当前不支持扩展属性。当用户使用 xattr 挂载选项挂载群集文件系统时,将看到以下行为:

因此,任何程序访问群集文件系统中文件的扩展属性都可能都无法获得预期结果。

解决方法: 使用 noxattr 挂载选项挂载群集文件系统。

在 PxFS 辅助服务器上的非全局区域中使用 chmod 设置 setuid 权限会返回错误 (7020380)

问题摘要chmod 命令可能无法更改群集文件系统中文件的 setuid 权限。如果在非全局区域中运行 chmod 命令,而且该非全局区域不在 PxFS 主服务器上,则 chmod 命令将无法更改 setuid 权限。

例如:

# chmod 4755 /global/oracle/test-file
chmod: WARNING: can't change /global/oracle/test-file

解决方法: 执行下列操作之一:

无法基于配置文件创建具有不可调整扩展属性的资源 (6971632)

问题摘要: 使用 XML 配置文件创建资源时,如果任何资源具有不可调整的扩展属性(即,Tunable 资源属性特性设置为 None),则命令无法创建该资源。

解决方法: 编辑 XML 配置文件以从资源中删除不可调整的扩展属性。

当群集中存在负载时禁用设备隔离会导致预留空间冲突 (6908466)

问题摘要: 为具有活动 I/O 负载的共享设备关闭隔离可能会导致连接到该设备的某个节点的预留空间发生冲突。

解决方法: 在为设备关闭隔离之前,停止该设备的 I/O。

如果复制的设备组状态会导致状态间切换和切换回原状态失败,EMC SRDF 将拒绝在状态间切换 (6798901)

问题摘要: 如果被拆分了副本对的 EMC SRDF 设备组尝试将设备组切换到其他节点,则切换将失败。此外,设备组将无法在原始节点上恢复为联机状态,直到将其副本对恢复为成对状态。

解决方法: 在尝试将关联的 Oracle Solaris Cluster 全局设备组切换到其他群集节点之前,确认未拆分其 SRDF 副本。

从群集配置中删除节点可能会导致节点出现紊乱 (6735924)

问题摘要: 将群集配置从三节点群集更改为两节点群集时,如果剩余节点之一离开群集或从群集配置中删除,则可能会导致群集完全丢失。

解决方法: 从三节点群集配置中删除节点后,立即在剩余群集节点之一上运行 cldevice clear 命令。

组合 DID 时,需要进行更多的验证检查 (6605101)

问题摘要cldevice 命令无法检验组合为单个 DID 设备的复制的 SRDF 设备实际上是否是彼此的副本,并且属于指定的复制组。

解决方法: 组合 DID 设备以用于 SRDF 时请特别小心。确保指定的 DID 设备实例是彼此的副本,并且属于指定的复制组。

数据服务

HA for TimesTen 不支持“活动-备用”配置 (16861602)

问题摘要:TimesTen“活动-备用”配置要求在 TimesTen ttCWadmin 实用程序中集成 Oracle Solaris Cluster 方法。尽管已在《Oracle Solaris Cluster Data Service for Oracle TimesTen Guide》中介绍了此集成,但尚未提供。因此,不要将 TimesTen“活动-备用”配置与 Oracle Solaris Cluster HA for TimesTen 一起使用,也不要在 Oracle Solaris Cluster 上使用 TimesTen ttCWadmin 实用程序。

Oracle Solaris Cluster TimesTen 数据服务随附了一组资源类型。其中的大部分资源类型都设计成可用于 TimesTen“活动-备用”配置,但在 Oracle Solaris Cluster 上只能将 ORCL.TimesTen_server 资源类型用于高可用性 TimesTen 配置。

解决方法:不使用 TimesTen“活动-备用”配置。

无法更新区域群集中使用 NAS 配置的 SUNW.ScalMountPoint 资源的属性 (7203506)

问题摘要: 对区域群集中使用 NAS 文件系统配置的 SUNW.ScalMountPoint 资源中任何属性的更新都会失败,并显示一条类似如下的错误消息:

clrs:   hostname:zone-cluster : Bad address

解决方法: 使用 clresource 命令删除该资源,然后使用所有所需属性重新创建资源。





无法访问在区域群集的可伸缩 HAStoragePlus 资源中配置的全局文件系统 (7197623)

问题摘要: 考虑这样一个群集文件系统:其全局群集的 /etc/vfstab 文件中具有以下条目,mount-at-boot 值为 no

# cat /etc/vfstab
/dev/md/datadg/dsk/d0   /dev/md/datadg/rdsk/d0 /global/fs-data ufs   5  no   logging,global

如果在区域群集的可伸缩资源组中创建了 HAStoragePlus 资源,并且上述群集文件系统将 mount-at-boot 值设置为 no,则可能无法通过区域群集节点挂载点看到群集文件系统数据。

解决方法: 执行以下步骤可避免此问题:

  1. 在一个全局群集节点中,使区域群集中包含 HAStoragePlus 的可伸缩资源组脱机。

    # clresourcegroup offline -Z zonecluster scalable-resource-group
  2. 在每个全局群集节点上的 /etc/vfstab 文件中,将群集文件系统条目的 mount-at-boot 值更改为 yes

    /dev/md/datadg/dsk/d0   /dev/md/datadg/rdsk/d0 /global/fs-data ufs   5  yes   logging,global
  3. 在一个全局群集节点中,使区域群集中包含 HAStoragePlus 的可伸缩资源组联机。

    # clresourcegroup online -Z zonecluster scalable-resource-group

RAC 向导失败,显示 "ERROR: Oracle ASM is either not installed or the installation is invalid!" (7196184)

问题摘要: Oracle RAC 配置向导失败,显示消息:ERROR: Oracle ASM is either not installed or the installation is invalid!

解决方法: 确保 "ASM" 条目为 /var/opt/oracle/oratab 文件中的第一个条目,如下所示:

root@phys-schost-1:~# more /var/opt/oracle/oratab
…
+ASM1:/u01/app/11.2.0/grid:N            # line added by Agent
MOON:/oracle/ora_base/home:N

如果将 WebLogic Server 安装在 NFS 中,在区域/区域群集中配置 WebLogic Server 域时,clsetup 向导将失败 (7196102)

问题摘要: 如果将 WebLogic Server 安装在 NFS 挂载点上,在区域/区域群集中使用 clsetup 向导配置 HA-WebLogic Server 资源将失败。

全局群集上的 NFS 存储不会出现此问题,如果使用除 NFS 以外的其他存储,也不会出现此问题。

出现此问题的条件为:挂载 NFS 存储且在区域中安装 WebLogic Server,并使用 clsetup 向导配置 WebLogic Server。

错误消息:ERROR: The specified path is not a valid WebLogic Server domain location。对于主目录位置、启动脚本和环境文件,将显示类似的消息。

最终,Administration/Managed/RPS 服务器搜索时将无法找到它。

Not able to find the WebLogic Administration Server Instance. 
Make sure the provided WebLogic Domain Location (<DOMAIN_LOCATION_PROVIDED>) 
is the valid one.

No Reverse Proxy Server Instances found. You can't proceed further.

No Managed Server instances found. You can't proceed further.

解决方法: 手动配置 WebLogic Server 资源。

大量 GDS 资源不识别网络,一些资源无法重新启动并保持脱机状态 (7189659)

问题摘要: 此问题将影响满足下列所有条件的通用数据服务 (Generic Data Service, GDS) 资源:

如果资源持续无法启动,GDS 将不断地继续重新启动它。出现问题并生成错误 " Restart operation failed: cluster is reconfiguring"。这将导致不再自动重新启动 GDS 资源。

解决方法: 手动禁用受影响的 GDS 资源,然后重新启用。

SUNW.Proxy_SMF_failover sc_delegated_restarter 文件描述符泄漏 (7189211)

问题摘要: 每次禁用或启用 SMF 代理资源 SUNW.Proxy_SMF_failover 时,文件描述符计数就加一。重复的切换可将文件描述符增加至 256,达到此限制点后无法再将资源切换为联机。

解决方法: 禁用并重新启用 sc_restarter SMF 服务。

# svcadm disable sc_restarter
# svcadm enable sc_restarter

如果设置 Debug_level=1pas-rg 将故障转移到节点 2,并且再也无法在节点 1 上启动 (7184102)

问题摘要: 如果将 Debug_level 属性设置为 1,将无法在任何节点上启动对话实例资源。

解决方法: 使用 Debug_level=2,它是 Debug_level=1 的超集。

可伸缩应用程序在区域群集间未被隔离 (6911363)

问题摘要: 如果配置为在不同区域群集中运行的可伸缩应用程序绑定到 INADDR_ANY 并使用同一端口,则可伸缩服务将无法对不同区域群集中运行的这些应用程序的实例进行区分。

解决方法: 不要将要绑定到 INADDR_ANY 的可伸缩应用程序配置为本地 IP 地址,或者将它们绑定到不会与其他可伸缩应用程序相冲突的端口。

同时在多个节点上运行 clnas addclnas remove 命令会出现问题 (6791618)

问题摘要: 添加或删除 NAS 设备时,同时在多个节点上运行 clnas addclnas remove 命令可能会损坏 NAS 配置文件。

解决方法: 一次只在一个节点上运行 clnas addclnas remove 命令。

开发者环境

clresource show -p 命令返回错误信息 (7200960)

问题摘要: 在 solaris10 标记非全局区域中,clresource show -p property 命令返回错误的信息。

解决方法: 此错误的原因是 solaris10 标记区域中存在 Oracle Solaris Cluster 4.1 之前版本的二进制文件。从全局区域运行以下命令,可获取有关本地非全局区域资源的正确信息:

# clresource show -p property -Z zone-name

Geographic Edition

群集节点对 Sun ZFS Storage Appliance 项目或 iSCSI LUN 没有访问权限 (15924240)

问题摘要: 如果节点在站点是主站点时离开群集,项目或 iSCSI LUN 将被隔离。但是,如果此节点又加入新的辅助站点,且随后该辅助站点发生了转换或接管,在站点提升为主站点后项目或 iSCSI LUN 不会被解除隔离,此节点上的应用程序无法访问文件系统。

解决方法: 重新引导该节点。

某个伙伴上持续报告 DR 状态为 unknown (7189050)

问题摘要: 持续报告 DR 状态为 unknown,虽然 DR 资源正确报告了复制状态。

解决方法: 运行 geopg validate protection-group 命令,强制向保护组发出资源组状态通知。

接管到辅助站点失败,因为 fs umount 在主站点上失败 (7182720)

问题摘要: 如果文件系统的 umount 在主站点上失败,保护组的接管也将失败。

解决方法: 执行以下步骤:

  1. 发出 fuser -cu file-system

  2. 在主站点上检查非应用程序进程 ID,如 cd

  3. 在执行接管操作之前终止此类进程。

如果使用 BUI 停止项目复制,则创建和验证 ZFS Storage Appliance 保护组将失败 (7176292)

问题摘要: 如果使用浏览器用户界面 (Browser User Interface, BUI) 停止复制,则保护组验证将失败,并且保护组将转为配置错误状态。

解决方法: 在 BUI 中,执行以下操作以停止复制:

  1. 在 "Shares"(共享)选项卡下,选择要复制的项目。

  2. 单击 "Replication"(复制)选项卡,然后选择 "Scheduled"(预定)选项。

  3. 等到状态更改为 manual,单击 "Enable/Disable"(启用/禁用)按钮。

使用区域群集时从全局群集发送多个通知电子邮件 (7098290)

问题摘要: 如果在区域群集中配置了 Oracle Solaris Cluster Geographic Edition,区域群集和全局群集都将发送有关与伙伴群集断开连接的重复的通知电子邮件。应只从区域群集发送这些电子邮件。

解决方法: 这是群集事件处理的附带效应。这是无害的,应忽略重复的电子邮件。

安装

不指定修补程序选项则无法在现有的 3.3 5/11 solaris10 标记区域上安装数据服务代理 (7197399)

问题摘要: 通过 Oracle Solaris Cluster 3.3 或 3.3 5/11 DVD 在 solaris10 标记非全局区域中安装代理时,如果未指定支持 solaris10 标记区域的修补程序,clzoncecluster install-cluster 命令将失败。

解决方法: 执行以下步骤可通过 Oracle Solaris Cluster 3.3 或 3.3 5/11 DVD 将代理安装到 solaris10 标记区域:

  1. 将区域群集重新引导为脱机模式。

    # clzonecluster reboot -o zonecluster
  2. 运行 clzonecluster install-cluster 命令,指定支持 solaris10 标记区域的核心修补程序的信息。

    # clzonecluster install-cluster -d dvd -p patchdir=patchdir[,patchlistfile=patchlistfile] \
    -n node[,…]] zonecluster
  3. 安装完成后,重新引导区域群集以使其联机。

    # clzonecluster reboot zonecluster

install 而非 install-cluster 用于 solaris10 标记区域时,clzonecluster 不报告错误 (7190439)

问题摘要: 使用 clzonecluster install 命令通过 Oracle Solaris Cluster 发行版 DVD 进行安装时,不会输出任何消息,但是也不会将任何内容安装到节点上。

解决方法: 要在 solaris10 标记区域安装 Oracle Solaris Cluster 发行版,请勿使用用于安装 Oracle Solaris 10 映像的 clzonecluster install 命令,而应改用 clzonecluster install-cluster 命令。

当主机名中包含大写字母时,创建 ASM 实例代理资源将出错 (7190067)

问题摘要: 在群集节点主机名中使用大写字母将导致创建 ASM 实例代理资源失败。

解决方法: 安装 Oracle Solaris Cluster 软件时,在群集节点主机名中仅使用小写字母。

向导找不到 ASM SID (7190064)

问题摘要: 使用 clsetup 实用程序配置 HA for Oracle 或 HA for Oracle RAC 数据库时,如果群集节点主机名是使用大写字母配置的,Oracle ASM 系统标识符屏幕将无法找到或配置 Oracle ASM SID。

解决方法: 安装 Oracle Solaris Cluster 软件时,在群集节点主机名中仅使用小写字母。

当群集节点的主机名中包含大写字母时,创建 RAC 代理资源将失败 (7189565)

问题摘要: 在群集节点主机名中使用大写字母将导致创建 RAC 数据库代理资源失败。

解决方法: 安装 Oracle Solaris Cluster 软件时,在群集节点主机名中仅使用小写字母。

进行 solaris10 标记区域的非交互式数据服务安装时很难获取数据服务名称 (7184714)

问题摘要: 使用带 -s 选项的 clzonecluster install-cluster 命令安装代理时,很难知道可指定哪些代理名称。

解决方法: 使用 clzonecluster install-cluster -d dvd -s {all | software-component[,…]} options zone-cluster 命令创建 solaris10 标记区域群集时,可以使用 -s 选项指定以下群集组件:

Cacao 在运行 Trusted Extensions 的计算机上无法进行通信 (7183625)

问题摘要: 如果在安装和配置 Oracle Solaris Cluster 软件之前启用了 Oracle Solaris 软件的 Trusted Extensions 功能,则 Oracle Solaris Cluster 设置过程无法将 Common Agent Container 安全密钥从群集中的一个节点复制到另一个节点。要使 Common Agent Container 在群集节点上正确运行,所有群集节点上的安全密钥副本必须完全相同。

解决方法: 手动将安全密钥从一个全局群集节点复制到全局群集的其他所有节点。

  1. 在每个节点上,停止安全性文件代理。

    phys-schost# /usr/sbin/cacaoadm stop
  2. 在一个节点上切换至 /etc/cacao/instances/default/ 目录。

    phys-schost-1# cd /etc/cacao/instances/default/
  3. /etc/cacao/instances/default/ 目录打包为 tar 文件。

    phys-schost-1# tar cf /tmp/SECURITY.tar security
  4. /tmp/SECURITY.tar 文件复制到其他所有群集节点中。

  5. 在向其复制了 /tmp/SECURITY.tar 文件的每个节点上,解压缩安全性文件。

    /etc/cacao/instances/default/ 目录中已存在的所有安全性文件都将被覆盖。

    phys-schost-2# cd /etc/cacao/instances/default/
    phys-schost-2# tar xf /tmp/SECURITY.tar
  6. 从群集的每个节点中删除 /tmp/SECURITY.tar 文件。


    注 - 必须删除 tar 文件的所有副本以避免安全隐患。


    phys-schost-1# rm /tmp/SECURITY.tar
    phys-schost-2# rm /tmp/SECURITY.tar
  7. 在每个节点上,重新启动安全性文件代理。

    phys-schost# /usr/sbin/cacaoadm start

clnode remove -F nodename 命令无法从 Solaris Volume Manager 设备组中删除节点 nodename (6471834)

问题摘要: 使用 clnode remove -F nodename 命令从群集中删除节点时,Solaris Volume Manager 设备组中可能仍然存在已删除节点的过时条目。

解决方法: 在运行 clnode remove -F nodename 命令之前,使用 metaset 命令从 Solaris Volume Manager 设备组中删除相应节点。

如果您在从 Solaris Volume Manager 设备组删除节点之前运行了 clnode remove -F nodename 命令,请从活动群集节点运行 metaset 命令来删除 Solaris Volume Manager 设备组中的过时节点条目。然后,运行 clnode clear -F nodename 命令,以便从群集中完全删除该节点的所有痕迹。

自动搜索应当只为每个适配器找到一个互连路径 (6299097)

问题摘要: 如果互连适配器之间的网络硬件中存在冗余路径,则 scinstall 实用程序可能无法配置它们之间的互连路径。

解决方法: 如果自动搜索找到了多个互连路径,请手动为每个路径指定适配器对。

运行时

逻辑主机名故障转移会产生重复地址而导致中断 (7201091)

问题摘要: 对于共享 IP 区域群集 (ip-type=shared),如果使用 uadmin 1 0uadmin 2 0 命令关闭了区域群集节点的底层非全局区域,则因此发生的 LogicalHostname 资源的故障转移可能会导致在新的主节点上配置重复的 IP 地址。重复的地址将以 DUPLICATE 标志进行标记并维持五分钟,在此期间,应用程序无法使用该地址。有关 DUPLICATE 标志的更多信息,请参见 ifconfig(1M) 手册页。

解决方法: 使用下列任一方法:

sc_delegated_restarter 未将清单中设置的环境变量考虑在内 (7173159)

问题摘要: 当服务处于 SUNW.Proxy_SMF_failover 资源类型控制之下时,无法识别服务清单中指定的任何环境变量。

解决方法: 没有解决方法。

使用 ipadm disable-if -t interface 禁用传输接口后无法重新启用 (7141828)

问题摘要: 对专用传输接口意外使用 ipadm disable-if 命令后,群集传输路径将脱机。

解决方法: 将禁用的接口所连接到的电缆禁用并重新启用。

  1. 确定接口所连接到的电缆。

    # /usr/cluster/bin/clinterconnect show | grep Cable
  2. 在此节点上禁用该接口的电缆。

    # /usr/cluster/bin/clinterconnect disable cable
  3. 重新启用电缆,使路径联机。

    # /usr/cluster/bin/clinterconnect enable cable

getnetmaskbyaddr() 导致逻辑主机名的故障转移失败 (7075347)

问题摘要: 如果为 netmasks 名称服务启用了 nis,则逻辑主机名故障转移要求从网络中获取网络掩码。对 getnetmaskbyaddr() 的此调用会因 CR 7051511 挂起一段时间,这段时间可能足够长,以便资源组管理器 (Resource Group Manager, RGM) 将资源置于 FAILED 状态。即使 /etc/netmasks 本地文件中有正确的网络掩码条目,也会出现此问题。此问题只会影响多宿主群集,例如位于多个子网上的群集节点。

解决方法: 将 /etc/nsswitch.conf 文件(由 SMF 服务进行处理)配置为仅使用 files 进行 netmasks 查找。

# /usr/sbin/svccfg -s svc:/system/name-service/switch setprop config/netmask = astring:\"files\"
# /usr/sbin/svcadm refresh svc:/system/name-service/switch

升级

x86: scinstall -u update 有时无法升级 x86 节点上的群集软件包 (7201491)

问题摘要: 有时在 x86 群集节点上运行 scinstall -u update 无法升级群集软件包。会报告以下错误消息:

root@phys-schost-1:~# scinstall -u update

Calling "scinstall -u preupgrade"

Renamed "/.alt.s11u1_24a-2/etc/cluster/ccr" to "/.alt.s11u1_24a-2/etc/cluster/ccr.upgrade".
Log file - /.alt.s11u1_24a-2/var/cluster/logs/install/scinstall.upgrade.log.12037

** Upgrading software **
Startup: Linked image publisher check ... Done
Startup: Refreshing catalog 'aie' ... Done
Startup: Refreshing catalog 'solaris' ... Done
Startup: Refreshing catalog 'ha-cluster' ... Done
Startup: Refreshing catalog 'firstboot' ... Done
Startup: Checking that pkg(5) is up to date ... Done
Planning: Solver setup ... Done
Planning: Running solver ... Done
Planning: Finding local manifests ... Done
Planning: Fetching manifests:  0/26  0% complete
Planning: Fetching manifests: 26/26  100% complete
Planning: Package planning ... Done
Planning: Merging actions ... Done
Planning: Checking for conflicting actions ... Done
Planning: Consolidating action changes ... Done
Planning: Evaluating mediators ... Done
Planning: Planning completed in 16.30 seconds
Packages to update: 26

Planning: Linked images: 0/1 done; 1 working: zone:OtherNetZC
pkg: update failed (linked image exception(s)):

A 'update' operation failed for child 'zone:OtherNetZC' with an unexpected
return value of 1 and generated the following output:
pkg: 3/4 catalogs successfully updated:
 
Framework stall:
URL: 'http://bea100.us.oracle.com:24936/versions/0/' 

解决方法: 在运行 scinstall -u update 命令之前,运行 pkg refresh --full