Sun Cluster 3.1 4/04 发行说明(适用于 Solaris OS)

已知问题和错误

以下已知问题和错误会影响 Sun Cluster 3.1 发行版的运行。

数据服务: 安装准则

在开始安装 Solaris 和 Sun Cluster 之前,请先确定所有数据服务的要求。 如果您未确定这些要求,则可能会不正确地执行安装进程,从而导致需要完整地重新安装 Solaris 和 Sun Cluster 软件。

例如,Oracle Parallel Server/Real Application Clusters 的 Oracle Parallel Fail Safe/Real Application Clusters Guard 选项对于群集中使用的主机名/节点名称就有特殊要求。 由于在安装 Sun Cluster 软件之后不能再更改主机名,所以在安装 Sun Cluster 软件之前必须满足这些要求。 有关主机名/节点名称的特殊要求的详细信息,请参见 Oracle Parallel Fail Safe/Real Application Clusters Guard 文档。

节点无法引出 qfe 路径 (4526883)

问题摘要: 有时,在 qfe 适配器终止的专用互连传输路径无法联机。

解决方法: 请遵循以下所示步骤:

  1. 使用 scstat -W 识别出现故障的适配器。 输出将显示以该适配器作为路径端点(处于 faultedwaiting 状态)之一的所有传输路径。

  2. 使用 scsetup 从群集配置中删除所有连接到该适配器的电缆。

  3. 再次使用 scsetup 从群集配置中删除该适配器。

  4. 添加回适配器和电缆。

  5. 检验路径是否显示。 如果问题仍存在,请重复几次步骤 1 至步骤 5。

  6. 检验路径是否显示。 如果问题仍存在,请重新引导具有发生故障适配器的节点。 在重新引导节点之前,请确保剩下的群集具有足够的定额选票来承受该节点重新引导。

remove 脚本无法撤消注册 SUNW.gds 资源类型 (4727699)

问题摘要: remove 脚本无法撤消注册 SUNW.gds 资源类型,并显示以下消息:

资源类型已撤消注册。

解决方法: 在使用 remove 脚本后,手动撤消注册 SUNW.gds。 或者,可以使用 scsetup 命令或 SunPlex Manager。

在专用互连上使用 ce 适配器时出现路径超时 (4746175)

问题摘要: 如果一个或多个群集节点具有四个以上处理器,则在专用互连上使用 ce 适配器的群集可能会通知路径超时和后续节点死机。

解决方法: 通过将 set ce:ce_taskq_disable=1 添加到所有群集节点上的 /etc/system 文件中然后重新引导群集节点,来设置 ce 驱动程序中的 ce_taskq_disable 参数。 这将确保在中断环境中能始终传送心跳(和其他数据包),从而消除路径超时和后续节点死机。 重新引导群集节点时,应遵守定额注意事项。

重新引导后,节点在系统进行设备组切换操作时挂起 (4806621)

问题摘要: 如果在节点连接群集时正在进行设备组切换,则连接节点和切换操作可能挂起。 存取任意设备服务的所有尝试也会挂起。 如果群集具有两个以上的节点,并且设备中安装的文件系统为 VxFS 文件系统,则很可能发生此错误。

解决方法: 为避免出现这种情况,请不要在节点正在连接群集时启动设备组切换。 如果出现这种情况,则必须重新引导所有群集节点才能恢复对设备组的存取。

如果未提供现有的 DNS 配置,DNS 向导将失败 (4839993)

问题摘要: SunPlex Manager 包含一个数据服务安装向导,可用于在群集上设置高度可用的 DNS 服务。 如果用户未提供现有的 DNS 配置(例如 named.conf 文件),该向导将尝试通过自动检测现有网络和名称服务配置来生成有效的 DNS 配置。 但是,这种操作在某些网络环境中会失败,从而导致向导在未发出错误消息的情况下失败。

解决方法: 系统提示时,为 SunPlex Manager DNS 数据服务安装向导提供现有的有效 named.conf 文件。 否则,按照所介绍的 DNS 数据服务过程在群集上手动配置高可用性的 DNS。

使用 SunPlex Manager 安装 Oracle 服务 (4843605)

问题摘要: SunPlex Manager 包含一个数据服务安装向导,可用于通过安装和配置 Oracle 二进制文件以及创建群集配置在群集上设置高度可用的 Oracle 服务。 但是,此安装向导当前未运行,并生成基于用户软件配置的多种错误。

解决方法: 使用 Sun Cluster 文档中提供的过程在群集上手动安装和配置 Oracle 数据服务。

删除适配器后无法将其添加到 IPMP 组中 (4884060)

问题摘要: 如果使用 SunPlex Manager 从多适配器 IPMP 组中删除了适配器,则并不总是能够立即将适配器再次添加回同一组。

解决方法: 尝试将适配器添加回同一 IPMP 组之前,先删除 /etc/hostname.adapter

Shell 版本的 scds_syslog 不使用工具 LOG_DAEMON (4897239)

问题摘要: 由于内部错误,Sun 提供的大多数群集代理都使用 LOG_USER 工具而不使用 LOG_DAEMON 将消息写入系统日志(请参见 syslog(3C))。 在配置为使用缺省系统日志设置(请参见 syslog.conf(4))的群集上,通常会将严重程度为 LOG_WARNINGLOG_NOTICE 的消息写入系统日志,而不会将其输出。

解决方法: 在所有群集节点上的 /etc/syslog.conf 文件靠近开头的部分添加以下行:


user.warning			/var/adm/messages
这能使 user.warning 消息被记录。 可以为 user.notice 消息添加类似的行,但这样做既没有必要,还可能导致日志过快地填满,这取决于正运行的混用的应用程序。

passwdnsswitch.conf 要求使得 nis 不可用 (4904975)

问题摘要: 用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)》的“准备节点和磁盘”中的 nssswitch.conf 文件的要求不适用于 passwd 数据库的条目。 如果满足了这些要求,则在公共网络关闭时,su 命令可能会在可以控制 liveCache 资源的每个节点上都挂起。

解决方法: 在可以控制 liveCache 资源的每个节点上,确保 passwd 数据库的 /etc/nsswitch.conf 文件中的条目为:

passwd: files nis [TRYAGAIN=0]

Oracle 和 Apache 的数据服务安装向导不支持 Solaris 9 及更高版本 (4906470)

问题摘要: Apache 和 Oracle 的 SunPlex Manager 数据服务安装向导不支持 Solaris 9 及更高版本。

解决方法: 使用 Sun Cluster 文档在群集上手动安装 Oracle。 如果在 Solaris 9(或更高版本)上安装 Apache,请在运行安装向导之前手动添加 Solaris Apache 软件包 SUNWapchrSUNWapchu

一个节点作为 scvxinstall 封装的一部分重新引导后出现节点死机 (4931910)

问题摘要: 根磁盘封装过程中群集节点重新引导的不适当时间安排可能会导致节点死机。

解决方法: 一次在一个节点上运行 scvxinstall,等到一个节点的所有重新引导过程完成之后,再在另一个节点上启动 scvxinstall

非英文语言环境的 SunPlex Agent Builder 的缺省窗口大小太小 (4937877)

问题摘要: 在非英文语言环境下运行 SunPlex Agent Builder 时,缺省窗口大小太小,某些控件不能显示在窗口中。 此问题已出现在德文和西班牙文语言环境中。

解决方法: 根据需要手动调整 SunPlex Agent Builder 窗口的大小。

同时在多个节点上运行时 sccheck 挂起 (4944192)

问题摘要: 如果同时从多个节点启动,sccheck 可能挂起。

解决方法: 不要从任何用于将命令传递到多个节点的多控制台启动 scchecksccheck 可以重叠运行,但不应同时启动。

scinstall -r 不删除数据服务语言环境软件包 (4955294)

问题摘要: scinstall -r 不删除特定语言环境的数据服务软件包。

解决方法: 节点启动之后,请运行 pkginfo | grep -i cluster 以确保已删除了所有数据服务软件包。 要删除列出的软件包,请对每个软件包运行 pkgrm

在繁体中文语言环境下显示的语言不正确 (4955538)

问题摘要: 某些繁体中文语言环境下的 SunPlex Agent Builder 消息以简体中文显示。

解决方法: zh_TW 语言环境下运行 SunPlex Agent Builder 使消息以繁体中文正确显示。

Java 二进制链接到不正确的 Java 版本会导致 HADB 代理出现故障 (4968899)

问题摘要: 从 HADB 代理调用 hadbm 时,此命令从 /usr/bin 获取 java 二进制。 由于需要将 /usr/bin 中的 java 二进制链接到相应的 Java 1.4 版(或更高版本),因此 HADB 代理无法正常运行。

解决方法: 在脚本 /opt/SUNWappserver7/SUNWhadb/4/bin/hadbm 中,将 JAVA_HOME 环境变量指定为合适的 Java 1.4 版(或更高版本)。

scsetup 不能将第一个适配器添加到单节点群集中 (4983095)

问题摘要: 如果尝试使用 scsetup 将第一个适配器添加到单节点群集中,将收到以下错误消息: Unable to determine transport type.

解决方法: 至少要手动配置第一个适配器:


# scconf -a -A trtype=type,name=nodename,node=nodename

配置了第一个适配器后,进一步使用 scsetup 按预期的方式配置互连工作。

某些数据服务不能使用 scinstall 公用程序进行升级

问题摘要: 以下应用程序的数据服务不能使用 scinstall 公用程序进行升级:

解决方法: 如果要升级上述列表中的应用程序的数据服务,请使用以下步骤替换《Sun Cluster 软件安装指南(适用于 Solaris OS)》的“升级到 Sun Cluster 3.1 4/04 软件(轮询)”中升级数据服务的步骤。 对于已安装数据服务的每个节点执行以下步骤。

  1. 删除要升级的数据服务的软件包。


    # pkgrm pkg-inst
    

    pkg-inst 指定要升级的数据服务的软件包名称,如下表所列。

    应用程序 

    数据服务软件包 

    Apache Tomcat 

    SUNWsctomcat

    DHCP 

    SUNWscdhc

    mySQL 

    SUNWscmys

    Oracle E-Business Suite 

    SUNWscebs

    Samba 

    SUNWscsmb

    SWIFTAlliance Access 

    SUNWscsaa

    WebLogic Server(英文语言环境) 

    SUNWscwls

    WebLogic Server(法文语言环境) 

    SUNWfscwls

    WebLogic Server(日文语言环境) 

    SUNWjscwls

    WebSphere MQ 

    SUNWscmqs

    WebSphere MQ Integrator 

    SUNWscmqi

  2. 安装适用于要升级到的数据服务版本的软件包。

    要安装软件包,请按照适用于要升级的数据服务的 Sun Cluster 文档中的说明进行操作。 此文档可从 http://docs.sun.com 获得。

HA Oracle 停止方法超时 (4644289)

问题摘要: Sun Cluster HA for Oracle 数据服务使用超级用户命令 su(1M) 来启动和停止数据库。 如果运行的是 Solaris 8 或 Solaris 9,则当群集节点的公共网络发生故障时,网络服务可能会不可用。

解决方法: 在可以成为 oracle_serveroracle_listener 资源的主节点的每个节点上的 /etc/nsswitch.conf 配置文件中包含以下条目:

passwd: files
groups: files
publickey: files
project:  files

这些条目可确保 su 命令不会引用 NIS/NIS+ 名称服务,以使数据服务在发生网络故障期间能够正常启动和停止。

SAP liveCache 停止方法超时 (4836272)

问题摘要: Sun Cluster HA for SAP liveCache 数据服务使用 dbmcli 命令来启动和停止 liveCache。 如果运行的是 Solaris 9,则当群集节点的公共网络出现故障时,网络服务可能会不可用。

解决方法: 在可以成为 liveCache 资源主节点的每个节点上的 /etc/nsswitch.conf 配置文件中包含 publickey 数据库的以下条目之一:

publickey: 
publickey:  files
publickey:  files [NOTFOUND=return] nis 
publickey:  files [NOTFOUND=return] nisplus

除了用于 SAP liveCache 的 Sun Cluster 数据服务指南(适用于 Solaris OS)中介绍的更新之外,添加上述条目之一可确保 su 命令和 dbmcli 命令不引用 NIS/NIS+ 名称服务。 绕过 NIS/NIS+ 名称服务可确保在网络发生故障期间数据服务可以正常启动和停止。

HA-Siebel 不会自动重新启动失败的 Siebel 组件 (4722288)

问题摘要: Sun Cluster HA for Siebel 不会监视单个 Siebel 组件。 如果检测到 Siebel 组件的故障,只会在 syslog 中记录一条警告消息。

解决方法: 使用命令 scswitch -R -h node - g resource_group 重新启动其中的组件处于脱机状态的 Siebel 服务器资源组。