跳过导航链接 | |
退出打印视图 | |
![]() |
Oracle Solaris Cluster 3.3 3/13 发行说明 Oracle Solaris Cluster 3.3 3/13 (简体中文) |
Oracle Solaris Cluster 3.3 3/13 发行说明
Oracle Solaris Cluster 3.3 3/13 软件的新增功能
支持内核区域 (kernel cage) 动态重新配置 (Dynamic Reconfiguration, DR)
用于配置 Oracle PeopleSoft Application Server 数据服务的新的 clsetup 向导
用于配置 Oracle WebLogic Server 数据服务的新的 clsetup 向导
新的 Oracle PeopleSoft Enterprise Process Scheduler 数据服务
在 Geographic Edition 中支持 Sun ZFS Storage Appliance 数据复制
Oracle Solaris Cluster Manager 中的拓扑页面
Oracle ASM 与 Solaris Volume Manager 镜像逻辑卷
ACFS 代理资源在 Oracle 二进制文件安装期间脱机 (16581850)
Tavor InfiniBand (IB) 传输群集节点出现紧急情况:mutex_enter: bad mutex, lp (16372022)
Solaris 升级到 Oracle Solaris 10 8/11 会覆盖 hostname.adp 内容 (15882549)
套接字直接协议 (Socket Direct Protocol, SDP)
无法为 clprivnet 接口设置巨型帧 (Jumbo Frame) MTU 大小 (16618736)
群集检查实用程序的 S6708502 检查将 RT 进程 ora_dism 报告为不支持 (16365116)
公网故障不会使对具有 SCAN 侦听器的 DB 服务器资源进行故障转移 (16231523)
如果将 Failover_mode 设置为 SOFT,在公共接口发生故障时资源组不会进行故障转移 (15711034)
无法在区域群集中注册资源类型 SUNW.scalable_acfs_proxy (15700050)
如果任意一个群集节点不在群集中,clzonecluster boot、reboot 和 halt 子命令将失败 (15812235)
在 PxFS 辅助服务器上的非全局区域中使用 chmod 设置 setuid 权限会返回错误 (15697690)
无法基于配置文件创建具有不可调整扩展属性的资源 (15658184)
当群集中存在负载时禁用设备隔离会导致预留空间冲突 (15608862)
自动搜索在具有混合 I/O 的 LDoms 上不起作用 (15581535)
如果复制的设备组状态会导致状态间切换和切换回原状态失败,EMC SRDF 和 Hitachi TrueCopy 应拒绝在状态间切换 (15538295)
从群集配置中删除节点可能会导致节点出现紧急情况 (15500647)
组合 DID 时,需要进行更多的验证检查 (15423531)
运行 uadmin 5 1 后 sun.storage_proxy.type 资源处于脱机状态 (16910145)
HA for TimesTen 不支持"主动-备用"配置 (16861602)
在 clzonecluster halt zonecluster 命令后运行 clzonecluster boot zonecluster 命令会导致区域群集中出现节点引导故障 (16398199)
禁用 LDom 资源会使 LDom 处于绑定状态 (16323723)
手动卸载 ZFS 文件系统不会导致自动进行重新挂载 (16319552)
Oracle HTTP Server (OHS) 代理调用 /bin/grep -q,这对于此 grep 版本是非法选项 (16270576)
clsetup WebLogic Server 向导不为区域群集区域中的故障转移文件系统创建资源 (15943191)
如果区域群集具有的节点比其全局区域节点少,则向导无法创建区域群集 rac-framework 资源组 (15825830)
Oracle Solaris 10 Samba 修补程序 119757-20 或 119758-20 影响 HA-Samba 数据服务 (15757158)
当 set Debug_level=1 时,pas-rg 将故障转移到节点 2,并且再也无法在节点 1 上启动 (15803844)
在具有群集文件系统的可伸缩资源组中配置的 HAStoragePlus 资源无限期地保持 Starting 状态 (15649193)
同时在多个节点上运行 clnas add 或 clnas remove 命令会出现问题 (15533979)
clresourcegroup add-node 命令导致 HAStoragePlus 资源变为 Faulted 状态 (15391480)
RAC 向导失败,显示 "ERROR: Oracle ASM is either not installed or the installation is invalid!" (15814020)
主群集丢失对存储的访问时,Geographic Edition Hitachi TrueCopy 保护组接管失败 (16013386)
Geographic Edition 按不正确的顺序禁用 ASM 资源,导致显示错误消息 (16004984)
群集节点对 ZFS Storage Appliance 项目或 iSCSI LUN 没有访问权限 (15924240)
使用区域群集时从全局群集发送多个通知电子邮件 (15746425)
某个伙伴上持续报告 DR 状态为 unknown (15808054)
如果使用 BUI 停止项目复制,则创建和验证 ZFS Storage Appliance 保护组将失败 (15797609)
如果启用 DES 验证并将节点名称指定为全限定主机名,使用 scinstall 实用程序进行集中安装时无法配置群集 (16228318)
区域群集向导未提供一种在使用 Oracle Solaris 10 OS 的节点上输入数据的方法 (15874818)
运行 scinstall -u 命令会使 'installed' 区域处于 'mounted' 状态 (15817301)
安装程序会删除与 Ops Center Agent JavaDB 数据库对应的现有软件包 (15646335)
clzonecluster cancel 命令会导致出现错误 (15950187)
sc_delegated_restarter 未将清单中设置的环境变量考虑在内 (15795184)
应用 Oracle Solaris Cluster 3.3 3/13 核心修补程序
如何应用 Oracle Solaris Cluster 3.3 3/13 核心修补程序
删除 Oracle Solaris Cluster 3.3 3/13 核心修补程序
如何删除 Oracle Solaris Cluster 3.3 3/13 核心修补程序
适用于 Sun StorageTek 2530 阵列的群集支持修补程序
下列已知问题和错误会影响 Oracle Solaris Cluster 3.3 3/13 发行版的运行。请联系 Oracle 技术支持代表,以了解是否有可用的修复程序。这些错误和问题分为以下几个类别:
问题摘要: 群集 clprivnet 接口的 MTU 始终设置为默认值 1500,与底层专用互连的 MTU 不匹配。因此,不能为 clprivnet 接口设置巨型帧 MTU 大小。
解决方法: 没有已知解决方法。请联系 Oracle 技术支持代表,以了解是否有可用的修补程序。
问题摘要: 群集检查实用程序可能会报告 S6708502 检查违规,指出 Oracle Solaris Cluster 不支持实时进程 ora_dism。
解决方法: 忽略此特定进程的检查违规。此实时进程是 Oracle RAC 12c 的新进程,Oracle Solaris Cluster 允许此进程。
问题摘要: 如果 HA-Oracle 数据库配置为使用 Grid Infrastructure SCAN 侦听器,则公网出现故障时 HA-Oracle 数据库资源不会进行故障转移。
解决方法: 将 Oracle Grid Infrastructure SCAN 侦听器与 HA-Oracle 数据库配合使用时,向 HA-Oracle 数据库资源组添加一个逻辑主机,该主机的 IP 地址位于与 SCAN 侦听器相同的子网中。
问题摘要: 群集文件系统当前不支持扩展属性。当用户使用 xattr 挂载选项挂载群集文件系统时,将看到以下行为:
对常规文件执行扩展属性操作将失败,并显示 ENOENT 错误。
对目录执行扩展属性操作将导致对目录本身执行常规操作。
因此,任何访问群集文件系统中文件的扩展属性的程序都可能无法获得预期结果。
解决方法: 使用 noxattr 挂载选项挂载群集文件系统。
问题摘要: 如果故障转移数据服务(例如,HA for Oracle)配置了 ScalMountpoint 资源来探测和检测 NAS 存储访问故障,发生网络接口丢失(例如,由于电缆连接断开)时,监视探测器将挂起。如果数据服务资源的 Failover_mode 属性设置为 SOFT,这将导致停止失败状态并且资源不会进行故障转移。关联的错误消息类似于以下内容:
SC[SUNW.ScalMountPoint:3,scalmnt-rg,scal-oradata-11g-rs,/usr/cluster/lib/rgm /rt/scal_mountpoint/scal_mountpoint_probe]: Probing thread for mountpoint /oradata/11g is hanging for timeout period 300 seconds
解决方法: 将数据服务资源上的 Failover_mode 属性更改为 HARD。
# clresource set -p Failover_mode=HARD ora-server-rs # clresource show -v ora-server-rs | grep Failover_mode Failover_mode: HARD
问题摘要: 当前实现需要 /usr/cluster/lib/rgm/rtreg 中存在 RTR 文件,而不是指向该文件的符号链接。
解决方法: 以超级用户身份在全局群集的一个节点上执行以下命令。
# cp /opt/SUNWscor/oracle_asm/etc/SUNW.scalable_acfs_proxy /usr/cluster/lib/rgm/rtreg/ # clrt register -Z zoneclustername SUNW.scalable_acfs_proxy # rm /usr/cluster/lib/rgm/rtreg/SUNW.scalable_acfs_proxy
问题摘要: 即使只有一个群集节点不在群集中,clzonecluster boot、reboot 和 halt 子命令也会失败。将显示类似如下的错误:
root@pnode1:~# clzc reboot zoneclustername clzc: (C827595) "pnode2" is not in cluster mode. clzc: (C493113) No such object. root@pnode1:~# clzc halt zoneclustername clzc: (C827595) "pnode2" is not in cluster mode. clzc: (C493113) No such object.
clzonecluster boot、reboot 和 halt 子命令应该可以跳过处于非群集模式下的节点,而非失败。
解决方法: 对 clzonecluster boot 或 clzonecluster halt 命令使用以下选项以指定子命令的节点列表:
-n nodename[,…]
-n 选项允许对指定的节点子集运行子命令。例如,如果在包含节点 pnode1、pnode2 和 pnode3 的三节点群集中,节点 pnode2 已关闭,可以运行以下 clzonecluster 子命令以排除关闭的节点:
clzonecluster halt -n pnode1,pnode3 zoneclustername clzonecluster boot -n pnode1,pnode3 zoneclustername clzonecluster reboot -n pnode1,pnode3 zoneclustername
问题摘要: chmod 命令可能无法更改群集文件系统中文件的 setuid 权限。如果在非全局区域中运行 chmod 命令,而且该非全局区域不在 PxFS 主服务器上,则 chmod 命令将无法更改 setuid 权限。
例如:
# chmod 4755 /global/oracle/test-file chmod: WARNING: can't change /global/oracle/test-file
解决方法: 执行下列操作之一:
在访问群集文件系统的任何全局群集节点上执行操作。
从具有群集文件系统的回送挂载的 PxFS 主节点上运行的任何非全局区域执行操作。
将 PxFS 主服务器切换到遇到错误的非全局区域正在其上运行的全局群集节点。
问题摘要: 使用 XML 配置文件创建资源时,如果任何资源具有不可调整的扩展属性(即,Tunable 资源属性特性设置为 None),则命令无法创建该资源。
解决方法: 编辑 XML 配置文件以从资源中删除不可调整的扩展属性。
问题摘要: 为具有活动 I/O 负载的共享设备关闭隔离可能会导致连接到该设备的某个节点的预留空间发生冲突。
解决方法: 在为设备关闭隔离之前,停止该设备的 I/O。
问题摘要: 在具有混合 I/O 的逻辑域上进行群集配置过程中,自动搜索不会报告群集互连的任何路径。
解决方法: 运行交互式 scinstall 实用程序时,选择分别配置发起节点和其他节点,而不是在单个操作中配置所有节点。实用程序提示 "Do you want to use autodiscovery?"(是否要使用自动搜索?)时,回答 "no"(否)。然后可以从 scinstall 实用程序提供的列表中选择传输适配器。
问题摘要: 如果副本对处于 COPY 状态的 Hitachi TrueCopy 设备组或者被拆分了副本对的 EMC SRDF 设备组尝试将设备组切换到其他节点,则切换将失败。此外,设备组将无法在原始节点上恢复为联机状态,直到将其副本对恢复为成对状态。
解决方法: 在尝试将关联的 Oracle Solaris Cluster 全局设备组切换到其他群集节点之前,确认 TrueCopy 副本不处于 COPY 状态或者 SRDF 副本未被拆分。
问题摘要: 将群集配置从三节点群集更改为两节点群集时,如果剩余节点之一离开群集或从群集配置中删除,则可能会导致群集完全丢失。
解决方法: 从三节点群集配置中删除节点后,立即在剩余群集节点之一上运行 cldevice clear 命令。
问题摘要: scdidadm 命令和 cldevice 命令无法检验组合为单个 DID 设备的复制 SRDF 设备实际上是否是彼此的副本,并且属于指定的复制组。
解决方法: 组合 DID 设备以用于 SRDF 时请特别小心。确保指定的 DID 设备实例是彼此的副本,并且属于指定的复制组。
问题摘要: 在非正常关闭群集节点期间(例如节点出现紧急情况),类型为 sun.storage_proxy.type 的 Oracle Clusterware sun.storage-proxy-resource 可能会在节点引导时处于脱机状态。这反过来会导致 Oracle Solaris Cluster RAC 服务器代理资源处于脱机状态。
解决方法: 执行以下步骤:
手动启动 ACFS 存储代理资源。
# crsctl stop res sun.storage-proxy-resource -n nodename # crsctl start res sun.storage-proxy-resource -n nodename
使 Oracle Solaris Cluster RAC 服务器代理资源联机。
# clresourcegroup online rac-server-proxy-resource-group
问题摘要: TimesTen“主动-备用”配置要求在 TimesTen ttCWadmin 实用程序中集成 Oracle Solaris Cluster 方法。尽管已在《Oracle Solaris Cluster Data Service for Oracle TimesTen Guide》中介绍了此集成,但尚未提供。因此,不要将 TimesTen“主动-备用”配置与 Oracle Solaris Cluster HA for TimesTen 一起使用,也不要在 Oracle Solaris Cluster 上使用 TimesTen ttCWadmin 实用程序。
Oracle Solaris Cluster TimesTen 数据服务随附了一组资源类型。其中的大部分资源类型都设计成与 TimesTen“主动-备用”配置一起使用,但在 Oracle Solaris Cluster 上只能将 ORCL.TimesTen_server 资源类型用于高可用性 TimesTen 配置。
解决方法: 不使用 TimesTen“主动-备用”配置。
问题摘要: 如果运行 clzonecluster halt zonecluster 命令后运行 clzonecluster boot zonecluster 命令,则会有一个或多个节点无法引导并显示以下错误:
root@node1:/# clzonecluster boot zc1 Waiting for zone boot commands to complete on all the nodes of the zone cluster "zc1"... clzc: (C215301) Command execution failed on node node2. zoneadm: zone 'zc1': These file-systems are mounted on subdirectories of /gpool/zones/zone1/root: zoneadm: zone 'zc1': /gpool/zones/zone1/root/u01 zoneadm: zone 'zc1': call to zoneadmd failed
区域群集节点不会引导并且 clzonecluster status 命令将节点显示为脱机。
解决方法: 卸载脱机节点的全局区域中的文件系统:/usr/sbin/umount/gpool/zones/zone1/root/u01(如上述情况),然后在区域群集的任何节点的全局区域中运行以下命令:/usr/cluster/bin/clzonecluster boot -n offline-node zonecluster。通过运行 /usr/cluster/bin/clzonecluster status 命令验证脱机节点现在是否联机。
问题摘要: 如果在手动维护操作过程中禁用了 HA for Oracle VM Server for SPARC (HA for Logical Domains) 资源,zpool 导出会失败。发生此故障是因为逻辑域的绑定状态会使依赖于故障转移 ZFS 资源的 ZFS zpool 处于忙碌状态。状态间切换和故障转移不受影响。
解决方法: 执行以下步骤:
从逻辑域释放资源。
# ldm unbind-dom ldom
清理处于 STOP_FAILED 状态的 HASP 资源。
问题摘要: 如果卸载了 Solaris ZFS 文件系统,HAStoragePlus 探测器不会自动重新挂载该文件系统。
解决方法: 向数据集提供挂载点,然后 HAStoragePlus 探测器会自动重新挂载任何手动卸载的文件系统。例如:
# zfs list NAME USED AVAIL REFER MOUNTPOINT pool-1 414K 417G 32K none pool-1/test1 31.5K 417G 31.5K /testmount1 pool-1/test2 31.5K 417G 31.5K /testmount2
如果为 pool-1 提供了挂载点,HAStoragePlus 探测器会自动重新挂载任何手动卸载的文件系统。
# zfs set -p mountpoint=/pool-1 pool-1 # zfs list NAME USED AVAIL REFER MOUNTPOINT pool-1 414K 417G 32K /pool-1 pool-1/test1 31.5K 417G 31.5K /testmount1 pool-1/test2 31.5K 417G 31.5K /testmount2
问题摘要: 停止 HA-OHS 数据服务时,即使资源成功脱机,也会显示 /bin/grep: illegal option -q 消息。
解决方法: 在使 OHS 应用程序处于群集控制下之前,确保 OHS 进程未在运行。如果进程在群集控制下运行,可以忽略此消息。
问题摘要: 删除资源时,会显示与删除 CCR 条目(域配置)相关的错误消息。
解决方法: 这些错误消息无害,可忽略。
问题摘要: 如果在故障转移文件系统上配置 WebLogic Server 应用程序,WebLogic Server 向导无法创建资源。如果 WebLogic Server 实例配置为侦听 "All IP Addresses"(所有 IP 地址),该向导也无法创建资源。
解决方法: 如果在故障转移文件系统上配置 WebLogic Server 应用程序并且向导无法创建资源,则为故障转移文件系统手动创建 HA-WLS 资源。如果 WebLogic Server 实例配置为侦听 "All IP Addresses"(所有 IP 地址)并且向导无法创建资源,将该实例配置为仅侦听文档中建议的逻辑主机或手动创建 HA-WLS 资源。
问题摘要: 如果数据服务向导从不属于区域群集的节点运行,则在该区域群集中使用该向导配置 RAC 框架会失败。
解决方法: 如果在区域群集中配置数据服务,则从托管该区域群集的一个群集节点运行向导。
问题摘要: 应用 Samba 修补程序 119757-20 (SPARC) 或 119758-20 (x86) 后,二进制文件的位置从 /usr/sfw/bin 更改为 /usr/bin,从 /usr/sfw/lib 更改为 /usr/lib/samba 。这将破坏 Oracle Solaris Cluster Data Service for Samba。
解决方法: 如果已经安装了上面列出的修补程序,则需要重新注册 Oracle Solaris Cluster Data Service for Samba 资源(您必须删除并重新注册该资源)。/opt/SUNWscsmb/util/samba_config 文件必须按如上所述指定新的二进制文件位置。更改 samba_config 文件后,必须执行 /opt/SUNWscsmb/util/samba_register 文件来重新注册资源。
问题摘要: 如果将 Debug_level 属性设置为 1,将无法在任何节点上启动对话实例资源。
解决方法: 使用 Debug_level=2,它是 Debug_level=1 的超集。
问题摘要: 如果群集文件系统的 /etc/vfstab 文件条目具有等于 no 的 mount-at-boot 值并且该群集文件系统是在属于可伸缩资源组的 SUNW.HAStoragePlus 资源中配置的,则 SUNW.HAStoragePlus 资源无法联机。资源将保持 Starting 状态,直到 prenet_start_method 超时。
解决方法: 在群集文件系统的 /etc/vfstab 文件的条目中,将 mount-at-boot 值设置为 yes。
问题摘要: 如果配置为在不同区域群集中运行的可伸缩应用程序绑定到 INADDR_ANY 并使用同一端口,则可伸缩服务将无法对不同区域群集中运行的这些应用程序的实例进行区分。
解决方法: 不要将要绑定到 INADDR_ANY 的可伸缩应用程序配置为本地 IP 地址,或者将它们绑定到不会与其他可伸缩应用程序相冲突的端口。
添加或删除 NAS 设备时,同时在多个节点上运行 clnas add 或 clnas remove 命令可能会损坏 NAS 配置文件。
解决方法: 一次只在一个节点上运行 clnas add 或 clnas remove 命令。
问题摘要: 如果向配置了 ZFS 池的 HAStoragePlus 资源所在的资源组的节点列表添加 native 标记非全局区域,HAStoragePlus 资源可能进入 Faulted 状态。仅当托管 native 区域的物理节点是资源组节点列表的一部分时才发生此问题。
解决方法: 重新启动包含故障 HAStoragePlus 资源的资源组。
# clresourcegroup restart faulted-resourcegroup
问题摘要: Oracle RAC 配置向导失败,显示消息:ERROR: Oracle ASM is either not installed or the installation is invalid!
解决方法: 确保 "ASM" 条目为 /var/opt/oracle/oratab 文件中的第一个条目,如下所示:
root@phys-schost-1:~# more /var/opt/oracle/oratab … +ASM1:/u01/app/11.2.0/grid:N # line added by Agent MOON:/oracle/ora_base/home:N
问题摘要: 主群集丢失对存储设备的访问时,接管操作失败。
解决方法: 使丢失了对存储的访问的主群集关闭。
问题摘要: Geographic Edition 将保护组 (Protection Group, PG) 切换为具有辅助角色时,会不正确地对 ASM 设备组取消管理。如果接着重新启动群集并且如果 LUN 是可读写的,则这些设备组会错误地重新启用。重新启动 Geographic Edition 后,将禁止向这些 LUN 写入,用户可能在系统控制台上看到多个致命写入错误。这些错误不表示严重问题,可以忽略。Geographic Edition 将正确运行。
解决方法: 忽略这些消息。
问题摘要: 如果节点在站点是主站点时离开群集,项目或 iSCSI LUN 将被隔离。但是,如果此节点又加入新的辅助站点,且随后该辅助站点发生了转换或接管,在站点提升为主站点后项目或 iSCSI LUN 不会被解除隔离,此节点上的应用程序无法访问文件系统。
解决方法: 重新引导该节点。
问题摘要: 如果在区域群集中配置了 Oracle Solaris Cluster Geographic Edition,区域群集和全局群集都将发送有关与伙伴群集断开连接的重复的通知电子邮件。应只从区域群集发送这些电子邮件。
解决方法: 这是群集事件处理的附带效应。这是无害的,您应该忽略重复的电子邮件。
问题摘要: 持续报告 DR 状态为 unknown,虽然 DR 资源正确报告了复制状态。
解决方法: 运行 geopg validate protection-group 命令,强制向保护组发出资源组状态通知。
问题摘要: 如果使用浏览器用户界面 (Browser User Interface, BUI) 停止复制,则保护组验证将失败,并且保护组将转为配置错误状态。
解决方法: 在 BUI 中,执行以下操作以停止复制:
在 "Shares"(共享)选项卡下,选择要复制的项目。
单击 "Replication"(复制)选项卡,然后选择 "Scheduled"(预定)选项。
等到状态更改为 manual,单击 "Enable/Disable"(启用/禁用)按钮。
问题摘要: 如果启用 DES 验证并将节点指定为全限定主机名,则使用集中安装时,scinstall 实用程序无法配置群集。将显示类似如下的错误消息:
Updating file ("ntp.conf.cluster) on node <FQ-host-name) ... failed scinstall: Failed to configure ("ntp.conf.cluster") on node <FQ-host-name> scinstall: scinstall did NOT complete successfully!
解决方法: 重新运行 scinstall 实用程序并且此次选择一次配置一个节点的选项。指定节点名称,不包含域名。如果正在配置双节点群集,法定配置将失败,导致不重置安装模式。这种情况下,在节点引导到群集模式后,手动重置安装模式。
问题摘要: 由于区域群集的区域中的 Oracle Solaris 系统配置不完整而导致该区域群集引导时,其会处于 Ready-Offline 状态。区域群集的区域处于交互式系统配置模式,等待输入。不存在系统配置文件 (/etc/sysidcfg) 或者该文件不包含群集节点上全局区域中的所有必需系统配置属性时,会发生这种情况。
解决方法: 安装区域群集之前,创建 /etc/sysidcfg 文件并指定所有群集节点上所有必需的系统配置属性。该文件中的配置属性用于在第一次引导区域群集时自动配置 Oracle Solaris 系统。所必需的 Oracle Solaris 系统配置属性会根据 Oracle Solaris OS 版本而有所不同。有关更多详细信息,请参见《Oracle Solaris 管理:基本管理》。或者,在安装和引导区域群集后,使用 zlogin -Czone 在区域群集的所有节点上登录,以手动完成 Oracle Solaris 系统配置。
问题摘要: 运行 scinstall -u 命令会使 'installed' 区域处于 'mounted' 状态。此状态会导致重新引导系统时 Live Upgrade 出现问题,因为系统无法修复备用引导环境的区域路径。
解决方法: 执行以下步骤:
运行 svcadm disable zones 命令。
所有运行区域现在都应该处于 'mounted' 状态。服务在 100 秒后可能进入维护状态,但这不是问题。
对所有区域运行 zoneadm —z zonename unmount 命令。
键入 init 6。
问题摘要: Oracle Enterprise Manager Ops Center Agent for Oracle Solaris 10 为其配置数据库使用 JavaDB 软件。使用 installer 实用程序安装 Oracle Solaris Cluster 软件时,将重新安装 JavaDB 软件包,导致删除现有代理配置数据库。
因为删除了该软件包,Ops Center Agent 会报告以下错误消息:
java.sql.SQLException: Database '/var/opt/sun/xvm/agentdb' not found. at org.apache.derby.impl.jdbc.SQLExceptionFactory40.getSQLException(Unknown Source) at org.apache.derby.impl.jdbc.Util.newEmbedSQLException(Unknown Source) at org.apache.derby.impl.jdbc.Util.newEmbedSQLException(Unknown Source)
现在 Agent 已损坏,需要取消配置或者进行配置。
解决方法: 在所有群集节点上额外安装以下 JavaDB 软件包(从 Oracle Solaris Cluster 介质手动安装):
SUNWjavadb-demo
SUNWjavadb-javadoc
SUNWjavadb-docs
SUNWjavadb-client
运行 installer 实用程序不会删除现有 JavaDB 数据库软件包。
问题摘要: 在简体中文和繁体中文语言环境中使用 installer 实用程序来安装 Oracle Solaris Cluster 软件时,检查系统要求的软件错误地报告交换空间是 0 MB。
解决方法: 忽略此报告信息。在这些语音环境中,可以运行以下命令来确定正确的交换空间大小:
# df -h | grep swap
问题摘要: 发出 cancel 子命令时,clzonecluster 交互式配置(由 clzonecluster configure 命令 zcname 打开)在某些情况下会崩溃。将显示 Error executing zone configure command 错误消息。
解决方法: 您可以放心地忽略此问题。仅未保存的配置数据会由于该问题而丢失。要避免配置实用程序崩溃,请不要使用 cancel 命令。
问题摘要: 当服务处于 SUNW.Proxy_SMF_failover 资源类型控制之下时,无法识别服务清单中指定的任何环境变量。
解决方法: 修改服务方法来直接设置环境变量。
问题摘要: 对专用传输接口意外使用 ifconfig unplumb 命令后,群集传输路径将脱机。
解决方法: 将禁用的接口所连接到的电缆禁用并重新启用。
确定接口所连接到的电缆。
# /usr/cluster/bin/clinterconnect show | grep Cable
在此节点上禁用该接口的电缆。
# /usr/cluster/bin/clinterconnect disable cable
重新启用电缆,使路径联机。
# /usr/cluster/bin/clinterconnect enable cable
问题摘要: 如果为 netmasks 名称服务启用了 nis/ldap,则逻辑主机名故障转移要求从网络中获取网络掩码。对 getnetmaskbyaddr() 的此调用会因 CR 7051511 挂起一段时间,这段时间可能相当长,导致资源组管理器 (Resource Group Manager, RGM) 将资源置于 FAILED 状态。即使 /etc/netmasks 本地文件中有正确的网络掩码条目,也会出现此问题。此问题只会影响多宿主群集,例如位于多个子网上的群集节点。
解决方法: 将 /etc/nsswitch.conf 文件(由 SMF 服务进行处理)配置为仅使用 files 进行 netmasks 查找。
# /usr/sbin/svccfg -s svc:/system/name-service/switch setprop config/netmask = astring:\"files\" # /usr/sbin/svcadm refresh svc:/system/name-service/switch