以下已知问题和错误会影响 Sun Cluster 3.1 发行版的运行。
在开始安装 Solaris 和 Sun Cluster 之前,请先确定所有数据服务的要求。 如果您未确定这些要求,则可能会不正确地执行安装进程,从而导致需要完整地重新安装 Solaris 和 Sun Cluster 软件。
例如,Oracle Parallel Server/Real Application Clusters 的 Oracle Parallel Fail Safe/Real Application Clusters Guard 选项对于群集中使用的主机名/节点名称就有特殊要求。 由于在安装 Sun Cluster 软件之后不能再更改主机名,所以在安装 Sun Cluster 软件之前必须满足这些要求。 有关主机名/节点名称的特殊要求的详细信息,请参见 Oracle Parallel Fail Safe/Real Application Clusters Guard 文档。
问题摘要: 有时,在 qfe 适配器终止的专用互连传输路径无法联机。
使用 scstat -W 识别出现故障的适配器。 输出将显示以该适配器作为路径端点(处于 faulted 或 waiting 状态)之一的所有传输路径。
使用 scsetup 从群集配置中删除所有连接到该适配器的电缆。
再次使用 scsetup 从群集配置中删除该适配器。
添加回适配器和电缆。
检验路径是否显示。 如果问题仍存在,请重复几次步骤 1 至步骤 5。
检验路径是否显示。 如果问题仍存在,请重新引导具有发生故障适配器的节点。 在重新引导节点之前,请确保剩下的群集具有足够的定额选票来承受该节点重新引导。
问题摘要: remove 脚本无法撤消注册 SUNW.gds 资源类型,并显示以下消息:
资源类型已撤消注册。
解决方法: 在使用 remove 脚本后,手动撤消注册 SUNW.gds。 或者,可以使用 scsetup 命令或 SunPlex Manager。
问题摘要: 如果一个或多个群集节点具有四个以上处理器,则在专用互连上使用 ce 适配器的群集可能会通知路径超时和后续节点死机。
解决方法: 通过将 set ce:ce_taskq_disable=1 添加到所有群集节点上的 /etc/system 文件中然后重新引导群集节点,来设置 ce 驱动程序中的 ce_taskq_disable 参数。 这将确保在中断环境中能始终传送心跳(和其他数据包),从而消除路径超时和后续节点死机。 重新引导群集节点时,应遵守定额注意事项。
问题摘要: 如果在节点连接群集时正在进行设备组切换,则连接节点和切换操作可能挂起。 存取任意设备服务的所有尝试也会挂起。 如果群集具有两个以上的节点,并且设备中安装的文件系统为 VxFS 文件系统,则很可能发生此错误。
解决方法: 为避免出现这种情况,请不要在节点正在连接群集时启动设备组切换。 如果出现这种情况,则必须重新引导所有群集节点才能恢复对设备组的存取。
问题摘要: SunPlex Manager 包含一个数据服务安装向导,可用于在群集上设置高度可用的 DNS 服务。 如果用户未提供现有的 DNS 配置(例如 named.conf 文件),该向导将尝试通过自动检测现有网络和名称服务配置来生成有效的 DNS 配置。 但是,这种操作在某些网络环境中会失败,从而导致向导在未发出错误消息的情况下失败。
解决方法: 系统提示时,为 SunPlex Manager DNS 数据服务安装向导提供现有的有效 named.conf 文件。 否则,按照所介绍的 DNS 数据服务过程在群集上手动配置高可用性的 DNS。
问题摘要: SunPlex Manager 包含一个数据服务安装向导,可用于通过安装和配置 Oracle 二进制文件以及创建群集配置在群集上设置高度可用的 Oracle 服务。 但是,此安装向导当前未运行,并生成基于用户软件配置的多种错误。
解决方法: 使用 Sun Cluster 文档中提供的过程在群集上手动安装和配置 Oracle 数据服务。
问题摘要: 如果使用 SunPlex Manager 从多适配器 IPMP 组中删除了适配器,则并不总是能够立即将适配器再次添加回同一组。
解决方法: 尝试将适配器添加回同一 IPMP 组之前,先删除 /etc/hostname.adapter。
问题摘要: 由于内部错误,Sun 提供的大多数群集代理都使用 LOG_USER 工具而不使用 LOG_DAEMON 将消息写入系统日志(请参见 syslog(3C))。 在配置为使用缺省系统日志设置(请参见 syslog.conf(4))的群集上,通常会将严重程度为 LOG_WARNING 或 LOG_NOTICE 的消息写入系统日志,而不会将其输出。
解决方法: 在所有群集节点上的 /etc/syslog.conf 文件靠近开头的部分添加以下行:
user.warning /var/adm/messages |
问题摘要: 《用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》的“准备节点和磁盘”中的 nssswitch.conf 文件的要求不适用于 passwd 数据库的条目。 如果满足了这些要求,则在公共网络关闭时,su 命令可能会在可以控制 liveCache 资源的每个节点上都挂起。
解决方法: 在可以控制 liveCache 资源的每个节点上,确保 passwd 数据库的 /etc/nsswitch.conf 文件中的条目为:
passwd: files nis [TRYAGAIN=0]
问题摘要: Apache 和 Oracle 的 SunPlex Manager 数据服务安装向导不支持 Solaris 9 及更高版本。
解决方法: 使用 Sun Cluster 文档在群集上手动安装 Oracle。 如果在 Solaris 9(或更高版本)上安装 Apache,请在运行安装向导之前手动添加 Solaris Apache 软件包 SUNWapchr 和 SUNWapchu。
问题摘要: 根磁盘封装过程中群集节点重新引导的不适当时间安排可能会导致节点死机。
解决方法: 一次在一个节点上运行 scvxinstall,等到一个节点的所有重新引导过程完成之后,再在另一个节点上启动 scvxinstall。
问题摘要: 在非英文语言环境下运行 SunPlex Agent Builder 时,缺省窗口大小太小,某些控件不能显示在窗口中。 此问题已出现在德文和西班牙文语言环境中。
解决方法: 根据需要手动调整 SunPlex Agent Builder 窗口的大小。
问题摘要: 如果同时从多个节点启动,sccheck 可能挂起。
解决方法: 不要从任何用于将命令传递到多个节点的多控制台启动 sccheck。 sccheck 可以重叠运行,但不应同时启动。
问题摘要: scinstall -r 不删除特定语言环境的数据服务软件包。
解决方法: 节点启动之后,请运行 pkginfo | grep -i cluster 以确保已删除了所有数据服务软件包。 要删除列出的软件包,请对每个软件包运行 pkgrm。
问题摘要: 某些繁体中文语言环境下的 SunPlex Agent Builder 消息以简体中文显示。
解决方法: 在 zh_TW 语言环境下运行 SunPlex Agent Builder 使消息以繁体中文正确显示。
问题摘要: 从 HADB 代理调用 hadbm 时,此命令从 /usr/bin 获取 java 二进制。 由于需要将 /usr/bin 中的 java 二进制链接到相应的 Java 1.4 版(或更高版本),因此 HADB 代理无法正常运行。
解决方法: 在脚本 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 中,将 JAVA_HOME 环境变量指定为合适的 Java 1.4 版(或更高版本)。
问题摘要: 如果尝试使用 scsetup 将第一个适配器添加到单节点群集中,将收到以下错误消息: Unable to determine transport type.
解决方法: 至少要手动配置第一个适配器:
# scconf -a -A trtype=type,name=nodename,node=nodename |
配置了第一个适配器后,进一步使用 scsetup 按预期的方式配置互连工作。
问题摘要: 以下应用程序的数据服务不能使用 scinstall 公用程序进行升级:
Apache Tomcat
DHCP
mySQL
Oracle E-Business Suite
Samba
SWIFTAlliance Access
WebLogic Server
WebSphere MQ
WebSphere MQ Integrator
解决方法: 如果要升级上述列表中的应用程序的数据服务,请使用以下步骤替换《Sun Cluster 软件安装指南(适用于 Solaris OS)》的“升级到 Sun Cluster 3.1 4/04 软件(轮询)”中升级数据服务的步骤。 对于已安装数据服务的每个节点执行以下步骤。
删除要升级的数据服务的软件包。
# pkgrm pkg-inst |
pkg-inst 指定要升级的数据服务的软件包名称,如下表所列。
应用程序 |
数据服务软件包 |
---|---|
Apache Tomcat |
SUNWsctomcat |
DHCP |
SUNWscdhc |
mySQL |
SUNWscmys |
Oracle E-Business Suite |
SUNWscebs |
Samba |
SUNWscsmb |
SWIFTAlliance Access |
SUNWscsaa |
WebLogic Server(英文语言环境) |
SUNWscwls |
WebLogic Server(法文语言环境) |
SUNWfscwls |
WebLogic Server(日文语言环境) |
SUNWjscwls |
WebSphere MQ |
SUNWscmqs |
WebSphere MQ Integrator |
SUNWscmqi |
安装适用于要升级到的数据服务版本的软件包。
要安装软件包,请按照适用于要升级的数据服务的 Sun Cluster 文档中的说明进行操作。 此文档可从 http://docs.sun.com 获得。
问题摘要: Sun Cluster HA for Oracle 数据服务使用超级用户命令 su(1M) 来启动和停止数据库。 如果运行的是 Solaris 8 或 Solaris 9,则当群集节点的公共网络发生故障时,网络服务可能会不可用。
解决方法: 在可以成为 oracle_server 或 oracle_listener 资源的主节点的每个节点上的 /etc/nsswitch.conf 配置文件中包含以下条目:
passwd: files groups: files publickey: files project: files
这些条目可确保 su 命令不会引用 NIS/NIS+ 名称服务,以使数据服务在发生网络故障期间能够正常启动和停止。
问题摘要: Sun Cluster HA for SAP liveCache 数据服务使用 dbmcli 命令来启动和停止 liveCache。 如果运行的是 Solaris 9,则当群集节点的公共网络出现故障时,网络服务可能会不可用。
解决方法: 在可以成为 liveCache 资源主节点的每个节点上的 /etc/nsswitch.conf 配置文件中包含 publickey 数据库的以下条目之一:
publickey: publickey: files publickey: files [NOTFOUND=return] nis publickey: files [NOTFOUND=return] nisplus
除了《用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》中介绍的更新之外,添加上述条目之一可确保 su 命令和 dbmcli 命令不引用 NIS/NIS+ 名称服务。 绕过 NIS/NIS+ 名称服务可确保在网络发生故障期间数据服务可以正常启动和停止。
问题摘要: Sun Cluster HA for Siebel 不会监视单个 Siebel 组件。 如果检测到 Siebel 组件的故障,只会在 syslog 中记录一条警告消息。
解决方法: 使用命令 scswitch -R -h node - g resource_group 重新启动其中的组件处于脱机状态的 Siebel 服务器资源组。